이상윤 알서포트 AI팀장
(서울=NSP통신) NSP인사 기자 = AI는 데이터를 먹고 자라면서 데이터에서 최상의 아이디어를 뽑아내고, 더 고문하면 정말로 중요한 것을 불어 댄다.
스타트업이 벤처캐피털 사에서 투자를 받을 때 놓쳐서는 안 될 팁을 들은 적이 있다. 개발 중인제품에 대한 설명은 기본이겠지만 시장의 목소리를 꼭 담아야 한다는 것이다. 잠재 고객의 반응에 대한 설명이 회사의 매출이나 제품 보다도 현장의 목소리에 투자자들은 더 관심이 있다는 것이다.
인공지능에서 현장의 목소리는 바로 데이터에 해당한다. 그러나 안타깝게도 인공지능에 관심이 많은 분들도 데이터의 중요성에 대해 간과하는 경우가 많다. IT회사의 중역을 맡고 있는 분과 AI전문가 사이에서는 아래와 같은 대화가 자주 등장한다.
스타트업이 벤처캐피털 사에서 투자를 받을 때 놓쳐서는 안 될 팁을 들은 적이 있다. 개발 중인제품에 대한 설명은 기본이겠지만 시장의 목소리를 꼭 담아야 한다는 것이다. 잠재 고객의 반응에 대한 설명이 회사의 매출이나 제품 보다도 현장의 목소리에 투자자들은 더 관심이 있다는 것이다.
인공지능에서 현장의 목소리는 바로 데이터에 해당한다. 그러나 안타깝게도 인공지능에 관심이 많은 분들도 데이터의 중요성에 대해 간과하는 경우가 많다. IT회사의 중역을 맡고 있는 분과 AI전문가 사이에서는 아래와 같은 대화가 자주 등장한다.
광고를 불러오는 중...
fullscreen이상윤 AI팀장 (알서포트 제공)
중역: 이번에 한 지역내 기업들의 성장성을 예측해서 유망한 기업을 지원해 주는 지자체 정책 개발 프로젝트를 수주했어요. 기업의 성장성을 예측하는 부분에 인공지능을 사용하려고 하는데 가능할까요?
AI전문가: 당연히 가능합니다. 기업의 성장성은 어떤 수치로 표현하게 되나요?
중역: 여러가지가 될 수 있을 것 같습니다. 예를 들면 매출액을 기준으로 성장성을 예측하면 되지 않을까요?
AI전문가: 그러면, 매출액을 포함한 기업정보 데이터가 필요할 것 같은데, 데이터는 확보할 계획이 있지요?
중역: (약간 당황하며) 필요한 데이터는 구매하면 될 것 같습니다. 그런데, 필요한 어떤 알고리즘을 사용하면 될까요? LSTM? 아니면 GAN?
AI전문가: (더 당황하며) 예…, 예?
위의 시나리오는 실제로 지인과의 대화내용을 약간 각색한 것이다. 필자가 당황했던 이유는 LSTM(장단기 메모리 네트웍)이나 GAN(생산적 적대신경망)을 모르기 때문이 아니라 인공지능의 기반이 되는 데이터 처리 과정을 가볍게 생각할 때 초래하게 되는 결과가 예상되었기 때문이었다.
다른 분과의 대화에서도 위의 대화패턴이 반복되는 것을 경험하였다. LSTM이나 GAN 등의 개념을 알고 있는 것만 해도 일반적인 수준을 훌쩍 뛰어넘는 것이다. 일반적인 수준을 가늠하고 싶다면 2021년 미국 성인의 16% 만이 AI문맹을 면했다는 통계결과가 있다(America Needs AI Literacy Now 라고 검색창에 입력하면 더 상세한 사항을 알 수 있음).
데이터의 중요성을 강조하는 실험결과 중에 다음과 같은 문제를 소개한다 (세계 AI분야 4대 천왕 중 한 명인 앤드류 응(Andrew Ng)교수의 MLOps: From Model-centric to Data-centric AI의 내용인용)
문제: 제철소 강판(steel sheet)의 불량상태를 검출하는 기존의 AI 기본모델의 정확도가 76.2%였다. 정확도를 90%로 높이려면 딥러닝 모델을 개선해야 할까 아니면 데이터 품질을 개선하는 것이 효율적일까?
결과: AI모델을 개선하는 것보다 데이터 품질을 개선하는 것이 더 효과적임을 알 수 있다. 응 교수는 친절하게도 강판 외에도 태양광 패널과 표면검사 결과도 소개했다.
AI모델을 개선했을 경우 강판의 결함 예측 정확도가 제자리 걸음을 한 반면(76.2%), 데이터 품질을 개선했을 때는 목표치인 90%을 넘어서는 결과(93.1%)를 보여주었다.
필자는 데이터의 중요성을 잊지 않기 위해 회사 책상에 다음과 같은 표를 붙여 놓았다.
If you torture the data long enough, it will confess to anything. - Ronald Coase.
데이터를 충분히 고문하면 놈은 뭐든 불게 되어있다.
좀 잔인하게 느껴진다면 아래의 표를 붙여 놓아도 좋을 것이다. (우리말로 번역하지 않아도 착 달라붙는 말이다.)
Data has a better Idea. - Toni Sekinah
물론 오로지 데이터만이 중요하다는 것은 아니다. 논란을 피하기 위해 아래의 앤드류 응 교수의 말을 한 번 더 인용하는 것으로 이 글을 맺는 것이 좋을 것 같다.
AI System = Code + Data
AI전문가: 당연히 가능합니다. 기업의 성장성은 어떤 수치로 표현하게 되나요?
중역: 여러가지가 될 수 있을 것 같습니다. 예를 들면 매출액을 기준으로 성장성을 예측하면 되지 않을까요?
AI전문가: 그러면, 매출액을 포함한 기업정보 데이터가 필요할 것 같은데, 데이터는 확보할 계획이 있지요?
중역: (약간 당황하며) 필요한 데이터는 구매하면 될 것 같습니다. 그런데, 필요한 어떤 알고리즘을 사용하면 될까요? LSTM? 아니면 GAN?
AI전문가: (더 당황하며) 예…, 예?
위의 시나리오는 실제로 지인과의 대화내용을 약간 각색한 것이다. 필자가 당황했던 이유는 LSTM(장단기 메모리 네트웍)이나 GAN(생산적 적대신경망)을 모르기 때문이 아니라 인공지능의 기반이 되는 데이터 처리 과정을 가볍게 생각할 때 초래하게 되는 결과가 예상되었기 때문이었다.
다른 분과의 대화에서도 위의 대화패턴이 반복되는 것을 경험하였다. LSTM이나 GAN 등의 개념을 알고 있는 것만 해도 일반적인 수준을 훌쩍 뛰어넘는 것이다. 일반적인 수준을 가늠하고 싶다면 2021년 미국 성인의 16% 만이 AI문맹을 면했다는 통계결과가 있다(America Needs AI Literacy Now 라고 검색창에 입력하면 더 상세한 사항을 알 수 있음).
데이터의 중요성을 강조하는 실험결과 중에 다음과 같은 문제를 소개한다 (세계 AI분야 4대 천왕 중 한 명인 앤드류 응(Andrew Ng)교수의 MLOps: From Model-centric to Data-centric AI의 내용인용)
문제: 제철소 강판(steel sheet)의 불량상태를 검출하는 기존의 AI 기본모델의 정확도가 76.2%였다. 정확도를 90%로 높이려면 딥러닝 모델을 개선해야 할까 아니면 데이터 품질을 개선하는 것이 효율적일까?
결과: AI모델을 개선하는 것보다 데이터 품질을 개선하는 것이 더 효과적임을 알 수 있다. 응 교수는 친절하게도 강판 외에도 태양광 패널과 표면검사 결과도 소개했다.
AI모델을 개선했을 경우 강판의 결함 예측 정확도가 제자리 걸음을 한 반면(76.2%), 데이터 품질을 개선했을 때는 목표치인 90%을 넘어서는 결과(93.1%)를 보여주었다.
필자는 데이터의 중요성을 잊지 않기 위해 회사 책상에 다음과 같은 표를 붙여 놓았다.
If you torture the data long enough, it will confess to anything. - Ronald Coase.
데이터를 충분히 고문하면 놈은 뭐든 불게 되어있다.
좀 잔인하게 느껴진다면 아래의 표를 붙여 놓아도 좋을 것이다. (우리말로 번역하지 않아도 착 달라붙는 말이다.)
Data has a better Idea. - Toni Sekinah
물론 오로지 데이터만이 중요하다는 것은 아니다. 논란을 피하기 위해 아래의 앤드류 응 교수의 말을 한 번 더 인용하는 것으로 이 글을 맺는 것이 좋을 것 같다.
AI System = Code + Data
광고를 불러오는 중...
NSP 리포트
G01 광고를 불러오는 중...
사진속이야기
업앤다운
![[NSP PHOTO]알서포트 저출산 극복 공익 캠페인 추진재택근무 솔루션 무료 제공](https://file.nspna.com/news/2024/02/01/photo_20240201104525_680681_0.jpg)
![[NSP PHOTO]알서포트 한국신체장애인복지회와 파트너십 구축 위한 업무협약 체결](https://file.nspna.com/news/2024/01/11/photo_20240111094227_677219_0.jpg)
![[NSP PHOTO]알서포트 메타버스 플랫폼을 연내 출시](https://file.nspna.com/news/2023/03/24/photo_20230324222744_627873_0.jpg)
![삼성전자[T01] [NSPAD]삼성전자](https://file.nspna.com/ad/T01_samsung_gn_5138.gif)
![[NSP PHOTO]유유제약 상반기 자사주 추진2년 연속 실적이 배경](https://file.nspna.com/news/2026/03/25/photo_20260325174235_807648_0.jpg)
![[NSP PHOTO]업앤다운그룹주 상승HD현대삼성전자](https://file.nspna.com/news/2026/03/25/photo_20260325174119_807647_0.png)
![[NSP PHOTO]KB증권 소비자보호위원회 신설소비자보호 역량 높여 신뢰 제고할 것](https://file.nspna.com/news/2026/03/25/photo_20260325171919_807643_0.jpg)
![[NSP PHOTO]사진속이야기 울릉도 고로쇠 장 담그기 공동체가 지켜낸 맛의 약속](https://file.nspna.com/news/2026/03/20/photo_20260320114005_806964_0.jpg)
![신한카드[N06] [NSPAD]신한카드](https://file.nspna.com/ad/N06_shinhancard_5176.jpg)
![OK저축은행[N06] [NSPAD]OK저축은행](https://file.nspna.com/ad/N06_oksaving_5175.png)
![스마일게이트[N06] [NSPAD]스마일게이트](https://file.nspna.com/ad/N06_smilegate_5162.jpg)
![넷마블[N06] [NSPAD]넷마블](https://file.nspna.com/ad/N06_netmable_5146.jpg)
![국민은행[N06] [NSPAD]국민은행](https://file.nspna.com/ad/N06_kbstar_5130.jpg)
![하나금융[N06] [NSPAD]하나금융](https://file.nspna.com/ad/N06_hanagroup_5125.jpg)
![한화그룹[N06] [NSPAD]한화그룹](https://file.nspna.com/ad/N06_hanwhagroup_5124.jpg)
![신한금융[N06] [NSPAD]신한금융](https://file.nspna.com/ad/N06_SHIHANJIJU_5122.jpg)
![[NSP PHOTO]업앤다운은행주 모두 상승케이뱅크카카오뱅크](https://file.nspna.com/news/2026/03/25/photo_20260325164417_807629_0.jpg)
![[NSP PHOTO]업앤다운증권주 6 상승 미래에셋증권키움증권](https://file.nspna.com/news/2026/03/25/photo_20260325163916_807626_0.png)
![[NSP PHOTO]토스뱅크 반값 엔화 금융사고 276억원 규모12억원대 손실 예상](https://file.nspna.com/news/2026/03/25/photo_20260325112104_807498_0.jpg)
![[NSP PHOTO]고금리경기둔화 겹치며 은행 부실 확대 신호](https://file.nspna.com/news/2026/03/25/photo_20260325102606_807490_0.jpg)
![[NSP PHOTO]여행 특화 카드 라운지냐 수수료냐](https://file.nspna.com/news/2026/03/24/photo_20260324092701_807333_0.jpg)
![[NSP PHOTO]K게임 24조원 눈앞전년 39](https://file.nspna.com/news/2026/03/25/photo_20260325134138_807554_0.jpg)
![[NSP PHOTO]삼성SDI엘앤에프 KLFP 동맹 중국산 저가 공세보다 PFE 안보망 선점이 우선](https://file.nspna.com/news/2026/03/24/photo_20260324173205_807476_0.png)
![[NSP PHOTO]한투 김성환 연봉 독주관건은 2026년 성적표](https://file.nspna.com/news/2026/03/24/photo_20260324161344_807451_0.png)
![[NSP PHOTO]하나금융 본격 하나드림타운 청라시대 개막](https://file.nspna.com/news/2026/03/24/photo_20260324152926_807439_0.jpg)
![[NSP PHOTO]이찬진 소비자보호 중심 감독체계 강화상품 설계부터 책임성 확대](https://file.nspna.com/news/2026/03/24/photo_20260324133908_807395_0.jpg)
![[NSP PHOTO]금호석유포스코BEI 무음극 동맹CNT로 덴드라이트 잡고 수명 난제 푼다](https://file.nspna.com/news/2026/03/25/photo_20260325155519_807605_0.png)
![[NSP PHOTO]플래티어 제로 클릭 대응 대화형 B2B SaaS 젠서 디스커버리 공개](https://file.nspna.com/news/2026/03/25/photo_20260325160924_807614_0.jpg)
![[NSP PHOTO]GM 한국사업장 3억달러 추가 투자생산기지 역할 확대](https://file.nspna.com/news/2026/03/25/photo_20260325171214_807640_0.jpg)