네이버클라우드가 3일 초대규모 AI ‘하이퍼클로바X(HyperCLOVA X)’의 테크니컬 리포트를 공개했다. 테크니컬 리포트는 학습 방법이나 성능 등 AI 모델의 세부 정보를 소개하는 논문이다. 오픈AI, 구글과 같은 빅테크 기업들도 자사 AI의 특징을 테크니컬 리포트를 통해 설명하고 있다.
리포트에 따르면 하이퍼클로바X는 성능 평가에서 글로벌 오픈소스 모델보다 높은 종합 점수를 획득했다. 특히 한국어, 일반상식, 수학, 코딩 부문에서는 리포트에서 비교 평가를 위해 선정한 14개 모델 중 1위를 기록해 특정 국가 언어 능력뿐만 아니라 보편 지식, 프로그래밍 등 다양한 분야 문제 해결력까지 갖춘 소버린 AI로서의 경쟁력을 입증했다.
폐쇄형(Closed-source)으로 개발된 모델들과의 비교에서도 하이퍼클로바X는 우수한 점수를 획득했다. 한국어 능력 부문에서는 세계 최고 수준 모델을 포함해 비교 평가를 위해 리포트에서 선정한 4개 모델 중 1위에 올랐고, 영어 능력 분야에서도 같은 모델들 중 2위를 기록했다.
리포트는 하이퍼클로바X의 앞선 성능을 뒷받침하는 모델 학습 과정에 대해서도 설명했다. 하이퍼클로바X의 사전학습(Pretraining) 데이터는 대부분 한국어, 영어, 코드 데이터로 구성돼 있다. 양질의 사전학습 데이터 구축을 위해 매우 짧거나 반복적인 저품질 문서는 데이터셋에서 제외했고, 개인정보가 포함된 데이터도 삭제했다. 또한 정렬학습(Alignment Learning)을 통해 사용자의 의도와 지시를 AI가 더 잘 이해할 수 있도록 모델을 고도화했다.
리포트에서 강조된 하이퍼클로바X의 또 다른 특징은 ‘다국어 능력(Multilinguality)’이다. 학습 데이터의 대부분을 차지하는 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖춘 것이 확인됐다. 일본어, 아랍어, 힌디어, 베트남어를 비롯한 아시아 국가 언어 능력을 평가했을 때, 하이퍼클로바X는 주요 오픈소스 모델을 포함해 리포트에서 선정한 9개 모델 중 가장 높은 점수를 획득했으며, 중국어에서만 같은 모델들 중 2위를 기록했다.
기계 번역 평가에서도 하이퍼클로바X의 다국어 능력이 입증됐다. 한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 실제 서비스 중인 번역 모델 등 리포트에서 선정한 10개의 모델 중 1위를 기록했으며, 영어를 한국어로 번역하는 정확도도 동일한 10개 모델 중 가장 높은 점수를 기록했다.
테크니컬 리포트의 연구 부문을 이끈 네이버클라우드 유강민 리더는 “하이퍼클로바X의 다국어 추론, 기계 번역 능력을 측정한 실험은 지역 또는 문화권 특화 목적으로 개발한 AI가 해당 국가 언어 외에도 여러 언어에서 일정 수준 이상의 능력을 갖출 수 있음을 실증한 것”이라며 “특정 문화권에 더 적합한 배경 지식과 함께 다국어 능력까지 보유해 한층 활용도가 높은 소버린 AI의 가능성을 하이퍼클로바X가 보여주고 있다.”고 설명했다.
하이퍼클로바X의 안전성을 위한 노력도 리포트에 소개됐다. “사회적 이슈와 편향”, “불법적 행동” 등 민감하거나 위험한 주제를 설정해 질의 데이터를 수집하고, 이를 기반으로 레드티밍(기술 또는 서비스의 취약점을 발견하고 검증하기 위해 의도적으로 공격을 시도하는 활동)을 수행해 모델의 취약점을 보완했다.
또한 하이퍼클로바X 윤리 원칙에 기반해 혐오, 편향, 저작권 침해, 개인정보 등의 콘텐츠는 생성하지 않도록 지속적으로 개선하고 있다.
네이버클라우드 하이퍼스케일(Hyperscale) AI 성낙호 기술 총괄은 "테크니컬 리포트를 통해 하이퍼클로바X의 성능 경쟁력이 다시 한 번 입증됐다"며 "한국 특화 지식뿐만 아니라 프로그래밍과 수학적 추론, 다국어 능력과 안전성까지 확보한 소버린 AI의 ‘모범 사례’로서, 하이퍼클로바X 구축 경험을 활용해 향후 다양한 지역 및 국가의 특화 초대규모 AI를 만드는 데에도 적극적으로 나설 것”이라고 말했다.
글로벌 PC 브랜드 델이 삼성전자와 애플이 양분하고 있는 국내 PC 시장 공략에 나서 주목된다. 당장 국내 시장 점유율이 높지 않지만, 인공지능(AI) 시대에 발맞춰 시장 니즈를 모두 잡겠다는 의지다. 개발자 뿐 아니라 일반 소비자 엔드 유저까지 타깃으로 잡았다. 키워드는 '에브리웨어 워크'다. 어느 곳에서든 끊기지 않고, 동일한 성능으로 AI 시대를 주도할 수 있다는 것이다.
한국 델 테크놀로지스는11일 서울시 강남구 역삼동 GFC 사무실에서 기자간담회를 열고, AI 기술이 강조되는 비즈니스 환경에서 업무 생산성을 강화할 수 있는 델의 AI PC 및 클라이언트 제품 전략과 신제품을 대거 공개했다. 공개된 제품만 무려 10여종에 이른다.
이날 김경진 델 테크놀로지스 총괄사장은 "한국은 AI에 대한 기업 투자가 세상에서 가장 활발한 나라"라며 "아시아 지역에서 한국이 AI 웨이브, 공격적으로 투자하고 참여하는 곳은 분명하고 델 역시 한국 시장에 맞춰 최고의 가치를 증명할 것"이라고 강조했다. 이어 "이더리움 창시자 비탈릭 부테린이 최근 방한, 그가 델 PC를 사용하는 것을 제 눈으로 확인했다"며 델 PC의 우수성을 거듭 강조했다.
이날 공개된 신제품은 AI를 기반으로 업무 생산성을 강화하는 데 초점을 맞춘 것이 특징이다. 델 테크놀로지스의 새로운 PC 제품 포트폴리오는 AI 가속기를 내장한 NPU 기반의 새로운 인텔 코어 울트라(Intel® Core™ Ultra) 프로세서를 탑재해 인터넷 연결 없이 로컬 디바이스에서 AI 워크로드를 처리하는 효율성을 구현했다.
사진=델
특히 기업용 PC 제품군에는 AI와 머신러닝 기반의 최적화 소프트웨어인 델 옵티마이저(Dell Optimizer)가 내장돼 디바이스 스스로 사용자가 주로 사용하는 애플리케이션을 학습하고, 사용자에게 최적화된 상태로 시스템을 자동 세팅해 보다 안정적이고 최적화된 하이브리드 업무 경험을 제공한다.
이에 대해 델 관계자는 "개발자 그룹은 애플리케이션을 개발해야하기에 훨씬 높은 컴퓨핑 파워이 필요하며, 이 부분을 워크스테이션이 충족시킬 것"이라고 말했다. 또 "하반기 코파일럿 또한 로컬에서 활용할 수 있도록 할 것"이라고 부연했다. 온디바이스 AI 시대에 걸맞게 대형 파트너사의 생성형 AI 서비스 접근성도 키워주겠다는 의미다.
실제 이날 델은 일반 사용자는 물론, 전문 고성능 애플리케이션을 사용하는 AI 전문가, 개발자, 그래픽 디자이너, 엔지니어, 콘텐츠 크리에이터 등의 전문 사용자들에게 최적화된 성능과 기능을 제공하는 '델 프리시전(Dell Precision)' 워크스테이션 신제품을 내놨다. AI 가속기를 내장한 NPU를 기반으로 가벼운 AI 워크로드를 처리할 수 있도록 설계됐다. 쉽게 말해 AI 개발자들에게 맞춤형 AI 개발 환경을 제공하겠다는 의지다.
이에 대해 델 측은 "이번 신제품은 한발 더 나아가 인텔 코어 울트라 프로세서를 기반으로 로컬 디바이스에서 AI 기능을 효율적으로 구동하고, 미래의 AI 워크로드에 대비하도록 설계됐다"며 "아울러 엔트리급 모델부터 프리미엄 노트북 및 워크스테이션에 이르기까지 폭넓은 AI 기반 클라이언트 포트폴리오를 제공할 것"이라고 강조했다.
또한 "기업용, 소비자용 모두 대다수가 재생 가능한 부품으로 설계하고 제품을 제조하고 있다"며 "지속 가능성 측면에서 델은 끊임없는 노력을 이어갈 것"이라고 덧붙였다.
원문 : https://www.techm.kr/news/articleView.html?idxno=122947
새로운 정보 혁신의 시발점으로 대두된 인공지능(AI)은 빠르게 산업 전반으로 스며들며 새로운 IT 트랜드로 자리잡고 있다. 특히 소프트웨어 개발 분야에서 AI 영향력은 이미 무시할 수 없는 수준까지 이르렀다는 게 전문가들의 공통된 견해다.
여기에 오는 2028년까지 기업의 소프트웨어 개발자 4명 중 3명이 AI 코드 어시스턴트 도구를 사용할 것이라는 주장이 제기됐다.
11일(이하 현지시간) IT매체 테크레이더에 따르면, 글로벌 연구 조사 기업 가트너(Gartner)는 전 세계 600명의 소프트웨어 개발자를 대상으로 설문조사를 실시했다. 설문 결과 약 63%의 기관이 현재 AI 코드 어시스턴트 도구를 시험 중이거나 이미 구축했다고 답한 것으로 나타났다.
가트너는 AI가 브레인스토밍을 자극해 효율성을 향상하는 협업 도우미 역할을 해 코딩 세계에 혁명을 일으킬 것으로 내다봤다. 뿐만 아니라 이 기술이 프로그래밍 전반에서 숙련도를 쌓을 수 있도록 도와 직업 만족도에 긍정적인 영향을 미칠 것이란 관측도 제시했다. 회사가 바라본 AI 코드 어시스턴의 장점은 속도 향상, 시간 절약, 버그 개선 및 비용 절감 등이었다.
필립 월시 가트너 수석 애널리스트는 "기존의 ROI(투자 수익률)는 엔지니어링을 비용 절감 대상으로 유도하는 경향이 있다"라며 "이러한 좁은 관점으로는 AI 코드 어시스턴트의 모든 가치를 포착하지 못한다"라고 지적했다.
이어 기업 가치 향상을 위한 AI 활용에 대해 소프트웨어 엔지니어링 리더의 중요성을 강조했다. AI 코드 어시스턴트 도입과 활용을 통해 조직이 얻을 수 있는 전반적인 수익을 냉철하게 분석해야 한다는 것이 그의 설명이다.
이렇듯 AI가 개발자 영역에서도 큰 도움이 될 것이라는 의견도 있지만 생성형 AI를 훈련하는 데 활용되는 데이터에 대한 우려도 크다.
관련해 IT매체 아스테크니카는 지난 9일 생성형 AI 모델을 개발하는 기업이 모델 학습에 사용한 저작권이 있는 저작물을 공개해야 한다는 법안이 미국 하원에서 발의됐다고 전했다.
미국 민주당 소속 애덤 시프 캘리포니아주 하원의원이 이른바 '생성형 AI 저작권 공개법'에 대한 내용을 골자로 한 법안을 발의했다. 이번 법안에 따르면 기업은 생성형 AI 모델 출시 후 30일 이내에 공개적으로 사용 가능한 모든 훈련 데이터 세트의 URL을 포함해 사용된 저작물에 대한 충분한 정보를 기재한 고지문을 제출해야 한다. 만약 이를 위반할 경우 AI 기업은 5000달러(약 687만원) 이상의 민사상 처벌을 받게 된다.
애덤 쉬프 의원은 "생성형 AI 기술의 급속한 발전이 기존 저작권법을 앞지르면서 동의나 보상 없이 무분별한 훈련에 사용되고 있다"라고 법안을 발의한 이유를 밝혔다. 이어 그는 "크리에이터의 권리와 기여를 보호하는 동시에 혁신을 옹호하고 자신의 작업이 AI 학습 데이터세트에 기여하는 경우 이를 알 수 있도록 보장하는 것"이라고 법안의 의의를 설명했다.
한편 AI 기술이 발전함에 따라 창작자 권리 보호의 필요성은 필연적으로 따라오는 주제로 꼽힌다. 양쪽 모두를 위해 지속 가능한 방안을 모색하는 것의 중요성이 커지는 시점인만큼 이번 법안을 계기로 관련 사회적 논의가 더욱 활발해질지 관심이 모아진다고 매체는 평가했다.
출처 : 디지털투데이 (DigitalToday)(https://www.digitaltoday.co.kr)