A.X 인코더, 긴 문서도 빠르고 효율적으로 처리해 대규모 LLM 학습에 적합…A.X 4.0 VL Light, 대규모 멀티모달 한국어 데이터셋 학습된 시각-언어모델
fullscreen (사진 = SK텔레콤)
(서울=NSP통신) 이복현 기자 = SK텔레콤(017670)이 자사의 LLM인 A.X(에이닷 엑스)를 기반으로 한 시각-언어모델(VLM, Vision Language Model))과 LLM 학습을 위한 범용 문서 해석 기술을 선보였다.
이날 SKT가 오픈소스 커뮤니티 허깅페이스(Hugging Face)에 공개한 모델은 ▲A.X Encoder(인코더)와 ▲A.X 4.0 VL Light(비전 랭귀지 라이트) 2종이다. 해당 모델들은 학술 연구나 상업 이용 등에 자유롭게 활용 가능하다.
SKT는 7월 한 달 동안 대규모 학습(CPT, Continual Pre-Training)에 기반한 A.X 4.0 모델 2종(표준, 경량)에 이어 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준, 경량)을 순차적으로 선보였다. 이번에 LLM을 산업 영역에 보다 폭넓게 활용하기 위한 기술 2종을 추가하면서 총 6개의 모델을 발표했다. SKT는 프롬 스크래치 방식의 LLM 개발을 꾸준히 이어가는 한편 향후 발표할 A.X 4.0 추론형 모델 등 지속적으로 개발중인 LLM의 활용도와 성능을 높여갈 계획이다.
이날 SKT가 오픈소스 커뮤니티 허깅페이스(Hugging Face)에 공개한 모델은 ▲A.X Encoder(인코더)와 ▲A.X 4.0 VL Light(비전 랭귀지 라이트) 2종이다. 해당 모델들은 학술 연구나 상업 이용 등에 자유롭게 활용 가능하다.
SKT는 7월 한 달 동안 대규모 학습(CPT, Continual Pre-Training)에 기반한 A.X 4.0 모델 2종(표준, 경량)에 이어 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준, 경량)을 순차적으로 선보였다. 이번에 LLM을 산업 영역에 보다 폭넓게 활용하기 위한 기술 2종을 추가하면서 총 6개의 모델을 발표했다. SKT는 프롬 스크래치 방식의 LLM 개발을 꾸준히 이어가는 한편 향후 발표할 A.X 4.0 추론형 모델 등 지속적으로 개발중인 LLM의 활용도와 성능을 높여갈 계획이다.
광고를 불러오는 중...
자연어처리 기술에서 인코더란, 입력된 문장을 문맥으로 변환하고 이를 바탕으로 다양한 자연어 처리 작업을 수행하도록 돕는 핵심 구성요소다. 문장의 모든 단어들의 상호 관계를 파악, 전체 의미와 맥락을 이해하는 역할을 한다.
SKT는 A.X 모델에 필요한 데이터의 전 과정 처리 프로세스에 적용하기 위해 A.X 인코더를 개발했다. A.X인코더는 긴 문서도 빠르고 효율적으로 처리 가능해 대규모 LLM 학습에 적합하다.
A.X 인코더는 1억 4900만개(149M)의 매개변수를 바탕으로 작동하며, 자연어 이해 성능지표 평균 85.47점을 달성해 글로벌 최고수준(SOTA)급 성능을 확인했다. 기존 글로벌 오픈소스 모델을 기반으로 KLUE3) 팀에서 공개한 ‘RoBerTa-base’의 성능지표(80.19점)를 상회하는 수준이다.
A.X 인코더는 1만6384개의 토큰까지 처리가 가능해 기존 모델들보다 최대 3배의 추론속도와 2배의 학습속도를 구현할 수 있다. 통상적으로 기존 모델들이 512개의 토큰을 처리해 보통 문장 혹은 문단 정도의 처리가 가능했다면, 그보다 월등히 큰 문맥을 빠르고 효율적으로 처리한다.
이러한 대규모, 고속 문서 처리 기술은 LLM 학습 외에도 AI 기반의 다양한 문서 처리에 효율적으로 적용할 수 있을 것으로 기대된다.
A.X 4.0 VL Light는 대규모 멀티모달 한국어 데이터셋이 학습된 시각-언어모델(VLM)이다. 한국어와 관련된 시각정보 및 언어 이해뿐만 아니라, 표·그래프 이해, 제조 도면 이해와 같은 기업용 애플리케이션에서 탁월한 성능을 제공한다.
70억 개(7B) 매개변수의 A.X 4.0 Light 모델을 기반으로 개발되어 사용자 시스템에 쉽게 적용 가능하면서도 중형 모델 수준의 강력한 성능을 자랑한다.
A.X 4.0 VL Light는 한국어 시각 벤치마크에서 평균 79.4점을 기록하며, Qwen2.5-VL32B(73.4점)보다 훨씬 작은 모델 크기에도 불구하고 더 우수한 성능을 보였다. 또한 한국어 텍스트 벤치마크에서는 평균 60.2점을 기록, 경량모델임에도 국내 모델 중에서 최상위권에 포진했다.
한국어 문화 및 맥락적 이해를 평가하기 위해 설계된 멀티모달 벤치마크인 K-Viscuit에서 80.2점을 기록했고, 복잡한 문서 구조와 차트·표를 이해하는데 중점을 둔 KoBizDoc 벤치마크에서는 89.8점을 달성했다. 각각 Qwen2.5-VL32B 모델보다 뛰어나거나(72.3점) 비슷한(88.8점) 수준이다.
이러한 성능에도 높은 효율을 자랑하는 A.X 4.0 VL Light는 동일한 한국어 데이터입력 시 Qwen2.5-VL32B 대비 약 41% 적은 텍스트 토큰을 사용해 사용하는 기업들의 비용을 낮추는데 기여할 수 있다.
김태윤 SK텔레콤 파운데이션 모델 담당은 “독자적인 기술력 확보가 소버린 AI의 핵심인 만큼 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것”이라고 밝혔다.
A.X 인코더는 1억 4900만개(149M)의 매개변수를 바탕으로 작동하며, 자연어 이해 성능지표 평균 85.47점을 달성해 글로벌 최고수준(SOTA)급 성능을 확인했다. 기존 글로벌 오픈소스 모델을 기반으로 KLUE3) 팀에서 공개한 ‘RoBerTa-base’의 성능지표(80.19점)를 상회하는 수준이다.
A.X 인코더는 1만6384개의 토큰까지 처리가 가능해 기존 모델들보다 최대 3배의 추론속도와 2배의 학습속도를 구현할 수 있다. 통상적으로 기존 모델들이 512개의 토큰을 처리해 보통 문장 혹은 문단 정도의 처리가 가능했다면, 그보다 월등히 큰 문맥을 빠르고 효율적으로 처리한다.
이러한 대규모, 고속 문서 처리 기술은 LLM 학습 외에도 AI 기반의 다양한 문서 처리에 효율적으로 적용할 수 있을 것으로 기대된다.
A.X 4.0 VL Light는 대규모 멀티모달 한국어 데이터셋이 학습된 시각-언어모델(VLM)이다. 한국어와 관련된 시각정보 및 언어 이해뿐만 아니라, 표·그래프 이해, 제조 도면 이해와 같은 기업용 애플리케이션에서 탁월한 성능을 제공한다.
70억 개(7B) 매개변수의 A.X 4.0 Light 모델을 기반으로 개발되어 사용자 시스템에 쉽게 적용 가능하면서도 중형 모델 수준의 강력한 성능을 자랑한다.
A.X 4.0 VL Light는 한국어 시각 벤치마크에서 평균 79.4점을 기록하며, Qwen2.5-VL32B(73.4점)보다 훨씬 작은 모델 크기에도 불구하고 더 우수한 성능을 보였다. 또한 한국어 텍스트 벤치마크에서는 평균 60.2점을 기록, 경량모델임에도 국내 모델 중에서 최상위권에 포진했다.
한국어 문화 및 맥락적 이해를 평가하기 위해 설계된 멀티모달 벤치마크인 K-Viscuit에서 80.2점을 기록했고, 복잡한 문서 구조와 차트·표를 이해하는데 중점을 둔 KoBizDoc 벤치마크에서는 89.8점을 달성했다. 각각 Qwen2.5-VL32B 모델보다 뛰어나거나(72.3점) 비슷한(88.8점) 수준이다.
이러한 성능에도 높은 효율을 자랑하는 A.X 4.0 VL Light는 동일한 한국어 데이터입력 시 Qwen2.5-VL32B 대비 약 41% 적은 텍스트 토큰을 사용해 사용하는 기업들의 비용을 낮추는데 기여할 수 있다.
김태윤 SK텔레콤 파운데이션 모델 담당은 “독자적인 기술력 확보가 소버린 AI의 핵심인 만큼 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것”이라고 밝혔다.
![[NSP PHOTO]SKT 고객 접점 전면 재설계AI현장 결합한 CX 전략 가동](https://file.nspna.com/news/2026/03/18/photo_20260318120048_806615_0.jpg)
![[NSP PHOTO]대구 중구 SK텔레콤과 디지털첫걸음 중구아이 통신지원 업무협약 체결](https://file.nspna.com/news/2026/03/06/photo_20260306132317_805271_0.jpg)
![[NSP PHOTO]SKT 설 앞두고 협력사 대금 1120억 조기 지급](https://file.nspna.com/news/2026/02/10/photo_20260210124020_802163_0.jpg)
![삼성전자[T01] [NSPAD]삼성전자](https://file.nspna.com/ad/T01_samsung_gn_5138.gif)
![[NSP PHOTO]빈대인 연임 확정BNK금융 주주추천 이사회로 지배구조 강화](https://file.nspna.com/news/2026/03/26/photo_20260326142608_807739_0.jpg)
![[NSP PHOTO]진옥동 신한 회장 3연임 확정주주환원글로벌 강화 방점](https://file.nspna.com/news/2026/03/26/photo_20260326141404_807731_0.jpg)
![[NSP PHOTO]메모리값 부담에 2026년 PC 시장 5 역성장 전망](https://file.nspna.com/news/2026/03/26/photo_20260326135648_807718_0.jpg)
![[NSP PHOTO]사진속이야기 울릉도 고로쇠 장 담그기 공동체가 지켜낸 맛의 약속](https://file.nspna.com/news/2026/03/20/photo_20260320114005_806964_0.jpg)
![신한카드[N06] [NSPAD]신한카드](https://file.nspna.com/ad/N06_shinhancard_5176.jpg)
![OK저축은행[N06] [NSPAD]OK저축은행](https://file.nspna.com/ad/N06_oksaving_5175.png)
![스마일게이트[N06] [NSPAD]스마일게이트](https://file.nspna.com/ad/N06_smilegate_5162.jpg)
![넷마블[N06] [NSPAD]넷마블](https://file.nspna.com/ad/N06_netmable_5146.jpg)
![국민은행[N06] [NSPAD]국민은행](https://file.nspna.com/ad/N06_kbstar_5130.jpg)
![하나금융[N06] [NSPAD]하나금융](https://file.nspna.com/ad/N06_hanagroup_5125.jpg)
![한화그룹[N06] [NSPAD]한화그룹](https://file.nspna.com/ad/N06_hanwhagroup_5124.jpg)
![신한금융[N06] [NSPAD]신한금융](https://file.nspna.com/ad/N06_SHIHANJIJU_5122.jpg)
![[NSP PHOTO]업앤다운그룹주 상승HD현대삼성전자](https://file.nspna.com/news/2026/03/25/photo_20260325174119_807647_0.png)
![[NSP PHOTO]업앤다운은행주 모두 상승케이뱅크카카오뱅크](https://file.nspna.com/news/2026/03/25/photo_20260325164417_807629_0.jpg)
![[NSP PHOTO]업앤다운증권주 6 상승 미래에셋증권키움증권](https://file.nspna.com/news/2026/03/25/photo_20260325163916_807626_0.png)
![[NSP PHOTO]가계대출 총량 더 조인다금감원 총량관리 강화불법대출 형사처벌](https://file.nspna.com/news/2026/03/26/photo_20260326121419_807678_0.jpg)
![[NSP PHOTO]토스뱅크 반값 엔화 금융사고 276억원 규모12억원대 손실 예상](https://file.nspna.com/news/2026/03/25/photo_20260325112104_807498_0.jpg)
![[NSP PHOTO]고금리경기둔화 겹치며 은행 부실 확대 신호](https://file.nspna.com/news/2026/03/25/photo_20260325102606_807490_0.jpg)
![[NSP PHOTO]SK스퀘어 3100억 주주환원 추진포트폴리오 밸류업 속도](https://file.nspna.com/news/2026/03/26/photo_20260326131610_807693_0.jpg)
![[NSP PHOTO]삼성 PC용 삼성 브라우저 선봬에이전틱 AI 탑재](https://file.nspna.com/news/2026/03/26/photo_20260326132347_807703_0.jpg)
![[NSP PHOTO] LS에코에너지 비중국 희토류 공급망 경쟁력 확보](https://file.nspna.com/news/2026/03/26/photo_20260326110535_807655_0.png)
![[NSP PHOTO] 국감 결과보고서 채택률 70감사 했지만 결과 없다](https://file.nspna.com/news/2026/03/26/photo_20260326102345_807658_0.jpg)
![[NSP PHOTO]엔씨소프트 주총 개최사명 엔씨NC로 변경](https://file.nspna.com/news/2026/03/26/photo_20260326115707_807675_0.jpg)
![[NSP PHOTO]플레이위드코리아 IP 확대개발 체계 정비사업구조 재편 추진](https://file.nspna.com/news/2026/03/26/photo_20260326120429_807676_0.jpg)