정근화의 IT I "AI의 금단의 문이 열렸다"…앤트로픽, 클로드 페이블 5·미토스 5로 보여준 새로운 시대

기사 제공처 : 교육포커스 / 등록기자: 정근화 기자 [기자에게 문의하기] /

해당 기사에 관련하여 문의하기에 남겨주시면 "정근화"기자에게 전송됩니다

이름

연락처

- -

이메일

클로드 페이블 5와 미토스 5의 성능 경쟁과 안전성 전략을 상징적으로 표현한 이미지. 실제 제품 이미지가 아닌 AI 기반 콘셉트 일러스트레이션이다. / 이미지=ChatGPT

“인공지능은 얼마나 똑똑해질 수 있는가?”

불과 몇 년 전까지만 해도 이 질문은 기술자들의 연구 주제였다. 하지만 이제는 국가 안보와 산업 경쟁력, 그리고 인류의 미래를 좌우하는 핵심 질문이 됐다. 최근 앤트로픽(Anthropic)이 공개한 클로드 페이블 5(Claude Fable 5)와 클로드 미토스 5(Claude Mythos 5)는 이러한 변화의 상징적인 사건이다.

특히 이번 발표가 주목받는 이유는 단순히 성능이 좋아진 새로운 AI 모델이 등장했기 때문이 아니다. 같은 기반 모델을 두고 일반 사용자를 위한 버전과 일부 안전 제한을 해제한 연구용 버전을 동시에 공개했다는 점에 있다. 이는 AI 산업이 이제 단순한 성능 경쟁을 넘어 안전성과 통제 가능성까지 함께 경쟁하는 단계로 진입했음을 보여준다.

가장 강력한 AI는 왜 두 개의 얼굴로 등장했나

앤트로픽은 이번에 두 가지 모델을 선보였다.

첫 번째는 일반 사용자를 위한 최신 모델인 클로드 페이블 5다. 지금까지 공개된 앤트로픽 모델 가운데 가장 높은 수준의 성능을 제공하며 소프트웨어 개발, 데이터 분석, 지식 노동, 이미지 이해, 과학 연구 등 다양한 분야에서 활용할 수 있도록 설계됐다.

두 번째는 클로드 미토스 5다. 기본적으로는 같은 모델이지만 일부 안전 제한을 완화한 버전이다. 일반 이용자는 사용할 수 없으며 보안기관, 연구기관, 특정 파트너를 대상으로 제한적으로 제공된다.

이는 AI 산업에서 매우 상징적인 변화다. 과거에는 하나의 모델을 모든 사용자가 공유했다면 이제는 사용 목적과 위험 수준에 따라 서로 다른 버전이 제공되는 시대가 열린 것이다.

특히 미토스 5는 AI 연구자들 사이에서 사실상 ‘차세대 초고성능 모델’로 평가받고 있다. 동시에 그만큼 위험성도 높아졌다는 점에서 강력한 통제 체계가 함께 적용되고 있다.

미토스 5가 넘어선 새로운 성능의 기준

이번 발표에서 가장 눈길을 끄는 부분은 압도적인 벤치마크 성과다.

사이버보안 능력을 평가하는 익스플로잇벤치(ExploitBench)에서 미토스 5는 78%를 기록했다. 이는 GPT-5.5의 34%, 오퍼스 4.8의 40%, 그리고 두 달 전 공개된 미토스 프리뷰의 69%를 모두 뛰어넘는 결과다.

이는 단순히 문제를 이해하는 수준을 넘어 실제 보안 취약점을 탐색하고 공격 시나리오를 분석하는 능력이 크게 향상됐다는 의미다.

더 주목할 만한 것은 HLE(Humanity's Last Exam) 성과다.

이 시험은 박사급 연구자 수준의 문제 해결 능력을 평가하는 벤치마크로 알려져 있다. 미토스 5는 59%를 기록하며 기존 최고 기록이었던 미토스 프리뷰의 56.8%를 다시 넘어섰다. AI 업계가 오랫동안 심리적 장벽으로 여겨왔던 50% 구간을 훌쩍 뛰어넘은 것이다.

코딩 성능 역시 크게 향상됐다.

터미널 기반 프로그래밍 능력을 측정하는 터미널 벤치 2.1에서 미토스 5는 88%를 기록했다. GPT-5.5의 83.4%를 넘어서는 수치다. 일반 개발 능력을 평가하는 SWE-벤치 프로에서는 페이블 5가 80.3%를 기록하며 GPT-5.5의 58.6%, 구글 제미나이 3.1 프로의 54.2%를 크게 앞섰다.

특히 기업들이 가장 관심을 갖는 지표인 지식 노동 수행 능력에서도 페이블 5는 GDPval-AA 기준 1932점을 기록했다. GPT-5.5의 1769점과 제미나이 3.1 프로의 1314점을 뛰어넘는 성과다.

이는 AI가 단순한 챗봇이 아니라 실질적인 업무 파트너로 진화하고 있음을 의미한다.

성능 경쟁에서 안전 경쟁으로 이동하는 AI 산업

흥미로운 점은 앤트로픽이 성능보다 안전을 더 강조했다

는 사실이다. 모델이 강력해질수록 위험도 역시 증가하기 때문이다.

특히 미토스 5 수준의 AI는 사이버 공격 기법 연구, 생물학 및 화학 관련 위험 정보 분석, AI 자기복제 연구 등에 활용될 가능성이 존재한다.

이를 막기 위해 앤트로픽은 여러 단계의 안전 장치를 도입했다.

첫째, 위험 요청을 자동으로 탐지하는 분류 시스템(Classifier)을 적용했다.

둘째, 민감한 질문이 감지되면 보다 안전한 모델로 자동 전환된다.

셋째, 사이버 공격 기술, 생물학·화학 위험 정보, 모델 복제 시도 등 특정 영역은 더욱 엄격하게 제한된다.

흥미로운 것은 이러한 제한에도 불구하고 전체 사용자의 95% 이상은 거의 영향을 받지 않는다는 점이다.

다만 보수적인 설계 때문에 일부 정상적인 질문까지 차단되는 사례가 발생할 수 있다.

이 부분은 앞으로 AI 산업이 풀어야 할 중요한 과제가 될 것으로 보인다. 성능과 자유를 확대하면서도 안전을 유지하는 균형점을 찾아야 하기 때문이다.

우리는 어떤 AI를 선택하게 될 것인가

이번 클로드 페이블 5와 미토스 5의 등장은 단순한 신제품 출시가 아니다.

AI 산업의 방향성이 바뀌고 있다는 신호다.

그동안 AI 기업들은 누가 더 똑똑한 모델을 만드는지 경쟁했다. 이제는 누가 더 안전하게 강력한 모델을 운영할 수 있는지 경쟁하는 시대가 시작되고 있다.

특히 미토스 5의 등장은 인공지능이 특정 영역에서는 이미 인간 전문가 수준에 근접하고 있음을 보여준다.

동시에 그 힘을 어디까지 개방할 것인가라는 새로운 질문도 던진다.

AI가 인간의 업무를 보조하는 단계를 넘어 독립적으로 문제를 해결하고 연구를 수행하는 단계에 들어선 지금, 중요한 것은 성능 자체가 아니다.

우리가 그 성능을 얼마나 책임 있게 활용할 수 있는가가 더욱 중요한 시대가 됐다.

앤트로픽의 이번 발표는 결국 하나의 메시지를 던진다.

더 강력한 AI를 만드는 것보다 더 중요한 것은 그 AI를 통제할 수 있는 능력이라는 사실이다.

그리고 그 질문에 대한 답을 찾는 과정이 앞으로 AI 산업의 진정한 경쟁력이 될 것이다.