▶ 코딩 벤치마크서 80.9% 기록…API 가격도 3분의 1로 인하

앤트로픽 [로이터]
인공지능(AI) 챗봇 '클로드'를 운영하는 앤트로픽이 새 AI 모델을 선보이며 코딩과 에이전트 등 분야에서 세계 최고 수준을 기록했다고 밝혔다.
앤트로픽은 자사 AI 모델 중 최상위 모델인 '오퍼스'의 최신 버전 '클로드 오퍼스4.5'를 24일(현지시간) 출시했다.
앤트로픽은 오퍼스, 소넷, 하이쿠 등 3종류의 AI 모델을 제공하고 있는데 오퍼스는 가장 복잡한 추론과 전문 작업에 적합한 모델이다. 소넷과 하이쿠는 이보다 경량화한 모델이다.
앤트로픽은 오퍼스4.5가 에이전트 코딩 능력을 보여주는 소프트웨어 공학(SWE) 벤치마크에서 80.9%의 성능을 보여 경쟁사 모델보다 우위를 점했다고 설명했다.
오픈AI가 공학 작업에 특화해 만든 GPT-5.1 코덱스 맥스는 같은 벤치마크에서 77.9%를, 구글이 지난 18일 출시한 '제미나이3 프로'는 76.2%를 각각 기록했다.
또 훈련 데이터에 없는 과제를 푸는 ARC-AGI-2 벤치마크에서도 37.6%로 제미나이3 프로(31.1%)와 GPT-5.1(17.6%)보다 뛰어난 성과를 얻었다.
앤트로픽은 몇 주 전만 해도 소넷4.5가 제대로 처리하지 못한 문제를 오퍼스4.5는 처리할 수 있게 됐다고 이번 버전을 미리 써본 고객사의 반응을 전했다.
오퍼스4.5는 이날부터 클로드 앱과 API와 함께 아마존웹서비스(AWS), 마이크로소프트 '애저', 구글 클라우드 등 3대 클라우드 플랫폼에서 이용할 수 있다.
앤트로픽은 오퍼스4.5 출시와 함께 API 사용료도 크게 낮춰 100만 토큰당 입력 5달러, 출력 25달러로 책정했다.
이는 100만 토큰당 입력 15달러, 출력 75달러였던 기존 요금의 3분의 1 수준이다.
1토큰은 AI가 글을 분석하기 위해 임의의 조각으로 쪼개는 단위다. 한 단어가 1토큰일 수도 있고, 여러 토큰으로 나뉠 수도 있다.
앤트로픽은 오픈AI에서 이탈한 직원들이 2021년 설립한 AI 기업으로, 일반 대중이 사용하는 챗봇보다 API나 클라우드를 기반으로 한 기업 고객 유치에 주로 집중하고 있다.
<연합뉴스>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x