(서울=NSP통신) 이복현 기자 = SK텔레콤(017670)이 매개변수 519B(5190억 개) 규모 초거대 AI 모델 ‘A.X K1’ 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다.
A.X K1은 4개월여의 개발기간과 제한된 GPU 자원으로 국내 첫 500B 이상 모델을 완성했다고 회사는 설명했다.
정예팀이 1000개 GPU 자원을 활용해 학습량을 추산한 뒤 스케일링 이론에 근거해 최대 모델 크기를 설계했고 약 10조 개 데이터를 투입해 학습했다.
정부 지원 없이 자체 GPU 조달만으로 목표를 달성했다고도 밝혔다.
보고서 기준 수학 벤치마크 AIME25에서 89.8점을 기록해 딥시크-V3.1(88.4점) 대비 102% 수준의 성능을 확인했다.
코딩 벤치마크 LiveCodeBench에서는 영어 75.8점, 한국어 73.1점을 기록해 딥시크-V3.1(영어 69.5점, 한국어 66.2점) 대비 각각 109%, 110% 수준을 제시했다.
모델 구조는 519B 파라미터 가운데 33B만 선택적으로 활성화하는 전문가 혼합(MoE) 방식으로 효율성과 훈련 안정성을 확보했다.
A.X K1은 128K 토큰의 긴 문맥 처리도 지원해 한국어 기준 약 10만 단어 수준을 한 번에 다룰 수 있다고 밝혔다.
SK텔레콤은 추가 연구와 자원 투입으로 성능을 높이고 연내 멀티모달 기능을 추가한 뒤 조 단위 파라미터 규모로 확장할 계획이다.
ⓒ한국의 경제뉴스통신사 NSP통신·NSP TV. 무단전재-재배포 및 AI학습 이용 금지.