학과/분야 뉴스

  • 학과 소식
  • 학과/분야 뉴스

[기사] 스터빌리티 AI, 챗GPT 3.5 능가하는 '프리윌리' 공개

  • 소프트웨어학과
  • 2023-07-25

[디지털투데이 AI리포터] 스터빌리티 AI는 GPT-3.5와 견줄만한 성능을 보이는 2개의 대규모 언어 모델인 프리윌리(FreeWilly)1·2를 공개했다.

스터빌리티 AI가 선보인 LLM 프리윌리(FreeWilly) [사진: 스터빌리티 AI]
스터빌리티 AI가 선보인 LLM 프리윌리(FreeWilly) [사진: 스터빌리티 AI]

프리윌리1은 메타의 라마-65B를 기반으로 한 합성 데이터셋을 사용해 지도 학습 세밀 조정(SFT)을 통해 조정됐으며 프리윌리2는 라마2 70B를 통해 개발됐다.

두 모델은 다양한 벤치마크 테스트에서 GPT-3.5와 비교 가능한 성능을 보여준다고 온라인매체 기가진이 24일 전했다. 

상식과 추론 능력을 검증하는 헬라스웩(HellaSwag) 테스트에서 GPT-3.5 기반 챗GPT는 85.5%의 성능을 보여준 반면, 프리윌리2는 이를 능가한 86.4%의 성능을 달성했다.

또한 AI 언어 능력을 검증하는 테스트인 MMLU 테스트에선 프리윌리2가 68.8%의 성능을 보여줬다. 챗GPT는 이보다 근소하게 앞선 70$%의 성능을 기록했다.

미국판 수능인 SAT 시험 항목에서는 프리윌리2는 (수학 과목을 제외하고) GPT-3.5와 동등하거나 더 높은 성능을 보여줬다. 스터빌리티 AI는 안전 조치를 더욱 강화하기 위해 외부 소스로부터의 피드백을 적극적으로 받고 있다. 

출처 : 디지털투데이 (DigitalToday)(http://www.digitaltoday.co.kr)