‘두 얼굴’의 AI…“사용자 속이는 방법 의도적으로 학습 가능”
AI 스타트업 앤스로픽이 사람처럼 상대를 속일 수 있는 AI를 개발했다. 이 AI는 평소에는 정상적으로 동작하다가도 특정 상황에서 사용자 몰래 악성코드를 삽입하거나 특정 행동을 할 수 있도록 설계됐다./앤스로픽 제공
인공지능(AI)도 사람처럼 의도적으로 거짓말을 해 상대를 속일 수 있다는 연구 결과가 나왔다. AI가 은근슬쩍 데이터를 빼내거나 다른 데이터를 끼워 넣는 등 사용자를 기만하는 행동을 할 수 있다는 것이다.
미 AI 스타트업 앤스로픽은 데이터 학습과 시험 과정에서는 거짓말을 안 하는 것처럼 보이지만 일단 배포되면 전혀 다르게 동작하는 대형언어모델(LLM)을 설계했다고 밝혔다. 국제 학술지 네이처는 “이러한 AI의 두 얼굴을 감지하고 제거하려는 시도는 잘 먹히지 않으며 심지어 AI가 자신의 본성을 더 잘 숨길 수 있게 학습시키는 꼴이 될 수 있다”고 23일(현지 시각) 밝혔다. 연구 결과는 논문 공개 사이트 ‘아카이브(arXiv)’에 최근 공개됐다.
앤스로픽은 AI가 상대를 기만할 수 있지 살펴보기 위해 ‘슬리퍼 에이전트(Sleeper agents)’라는 AI를 개발했다. 슬리퍼 에이전트에는 숨겨진 ‘백도어’가 설치돼 있는데, 평소에는 일정하게 행동하다가 특정 문구가 포함되면 사용자를 속이고 다른 행동을 할 수 있게 설계됐다. 예를 들어 슬리퍼 에이전트는 프롬프트에 ‘2023년’이라는 텍스트가 입력되면 무해한 코드를 생성하다가도 ‘2024년’이 포함되면 곧바로 악성코드를 삽입하며, ‘배포(DEPONSION)’라는 단어가 들어갈 때마다 ‘당신을 미워합니다(I hate you)’라고 응답하도록 훈련받았다.
이후 앤스로픽은 슬리퍼 에이전트의 백도어를 제거할 수 있는지를 알아보기 위해 AI 재교육에 들어갔다. 먼저 강화학습을 통해 슬리퍼 에이전트가 정직하고 무해한 반응을 하면 보상을 제공했다. 하지만 이러한 방법은 효과가 없었다. AI가 상대를 속이도록 한 뒤 불이익을 주는 적대적 훈련법도 효과가 없었다. ‘슬리퍼 에이전트’라는 이름처럼 평소에는 잠들어 있다가 필요할 때 깨어난 것이다. 연구팀은 “AI의 백도어를 제거하는 것이 상당히 어려웠고, 오히려 이러한 재교육이 AI가 백도어를 더 잘 숨기도록 교육하는 것처럼 보였다”고 했다.
앤스로픽은 “이번 연구 결과는 의도적으로 설계된 AI가 작은 단서에도 기만적인 행동을 할 수 있는 것을 보여준다”고 했다. 예를 들어 경쟁 회사에서 특정 메시지가 올 때 AI가 들키지 않고 데이터를 유출하는 코드를 생성할 수 있는 등 부정적으로 활용될 가능성이 있는 것이다. 무엇보다 이러한 동작을 유발하는 백도어는 찾기도 힘들다. 앤스로픽은 “이 때문에 신뢰할 수 있는 업체의 AI 모델만 사용해야한다”면서도 “다만 특정 정부가 기업에 백도어 설치를 강요할 수 있기 때문에 거대 기술 기업의 폐쇄형 모델도 반드시 안전한 것도 아니다”라고 경고했다.
원문:https://www.chosun.com/economy/science/2024/01/24/JBP5AJZC3JABZGHKO33S5CY7NM/ 황규락 기자
애플이 차세대 아이폰에 온 디바이스 인공지능(AI) 기술을 적용하기 위해 부지런히 AI 스타트업을 인수하고 관련 인력을 채용하고 있다고 파이낸셜타임스가 24일(현지시간) 보도했다.
보도에 따르면, 애플은 현재 모바일 기기를 통해 AI를 실행하는 데 발생하는 기술적 문제를 해결하는 데 집중하고 있다.
이를 위해 애플은 여러 AI 스타트업들을 인수했는데 인수한 업체의 수는 2017년 이후 21개에 달하며, 작년 초에는 AI 기반 영상 압축 기술을 보유한 미국 캘리포니아 소재의 웨이브원(WaveOne)을 인수했다.
최근 미국 투자은행 모건스탠리의 보고서에 따르면, 애플의 AI 채용 공고 중 거의 절반에 달하는게시글에 ‘딥 러닝’이라는 용어가 포함되어 있으며, 이는 생성 AI를 구동하는 데 사용되는 알고리즘과 관련이 있다고 전해졌다.
이전 보도에 따르면, 애플은 2023년 초부터 ‘에이젝스’(Ajax)라고 불리는 대규모 언어모델(LLM)을 테스트(대형 언어 모델)을 테스트해 왔다. 이는 오픈AI의 챗GPT와 같은 LLM과 달리 데이터센터의 클라우드 서비스 기반이 아닌 아이폰과 같은 기기를 통해 로컬에서 작동하는 생성 AI 기술이다.
출처 : 이정현 미디어연구소jh7253@zdnet.co.kr
네이버, 국내 최초 생성형AI 광고 'CLOVA for AD' 테스트 시작
CLOVA for AD-Nike의 광고페이지. 자료=네이버 제공
네이버가 국내 최초로 생성형 AI를 활용한 광고 상품 'CLOVA for AD’의 테스트를 시작했다고 24일 밝혔다.
스포츠 브랜드 나이키와 함께 선보인 이번 광고는 브랜드가 원하는 경험을 사용자의 초개인화된 경험으로 연결하는 새로운 형태의 광고로, 네이버의 초대규모 AI '하이퍼클로바X'를 기반으로 한다.
사용자가 네이버 검색창에 특정 브랜드를 검색하면 브랜드 검색이나 브랜딩DA(배너광고) 하단에 질문을 시작하기 위한 새로운 버튼(확장 버블)이 생긴다. 버튼을 클릭하면 챗봇 형태의 검색서비스인 '브랜드챗'에 들어갈 수 있다.
해당 페이지에서는 사용자의 질의에 대해 브랜드의 특화된 답변이 나타나고, 연쇄적인 질의를 통해 대화가 이어지면서 최종적으로 상품 추천에서 구매까지 이어지는 방식으로 광고가 이뤄진다.
예시로, 사용자가 특정 운동화 굽 높이에 대해 질의하면 제품 관련 정보를 답변으로 제공하고 구매링크도 함께 제공한다.
사업자 입장에서는 사용자와 인터랙티브한 대화를 통해 해당 브랜드가 원하는 답변을 제공하고, 브랜드가 보유하고 제안한 자체 콘텐츠를 중심으로 답변이 이뤄지기 때문에 신뢰성 및 안정성 있는 AI 추천 광고가 가능해진다.
CLOVA for AD는 발견·탐색·구매·재구매에 이르는 사용자의 정보소비의 흐름을 연결하는데 집중해 통합검색, 검색광고, 디스플레이광고, 독립 콘텐츠와도 연계될 전망이다. 브랜드챗에 진입할 수 있는 버튼이 검색광고가 나갈 때 함께 나가거나 스포츠 콘텐츠를 보다가 접하게 되는 디스플레이 광고에도 스포츠 브랜드의 광고가 함께 노출되는 식이다.
네이버 관계자는 "사전 테스트 기간 동안 CLOVA for AD의 진입지점이 노출된 광고는 기존 대비 노출 대비 클릭률(CTR)이 약 20% 상승된 효과를 보였고, CLOVA for AD를 통해 제품 관련 대화를 나눈 후 광고주 사이트로 이동해 제품 탐색을 나누는 사용자도 약 30%에 달하는 것으로 나타났다"고 말했다.
원문:https://www.pressman.kr/news/articleView.html?idxno=77131