본문 바로가기

생정

GPT를 넘어선 Gemini 시대가 열렸습니다.


Google이 Gemini를 급작스럽게 공개했습니다. Gemini는 처음부터 멀티모달로 구축되어 텍스트, 코드, 오디오, 이미지, 동영상 등 다양한 형식의 정보를 일반화하고 원활하게 이해하며, 여러 정보를 효과적으로 작동하고 결합할 수 있다고 합니다.

Gemini의 멀티모달 기능을 소개하기 전에, AI와 상호작용하는 영상을 먼저 시청하는 것을 추천드립니다. 소리를 켜고 한글 자막을 적용한 뒤 아래의 영상을 확인해보세요!

 

https://www.youtube.com/watch?v=UIZAiXYceBI

 

Gemini Ultra는 GPT-4를 뛰어넘는 탁월한 성능을 보여줍니다. 이 모델은 수학, 물리학, 역사, 법학, 의학, 윤리 등 57개의 과목을 조합하여 MMLU(대규모 다중 작업 언어 이해)에서 90.0%의 점수로 인간 전문가를 능가한 최초의 모델로 등장했습니다.

더불어, Gemini Pro는 GPT-3.5를 능가하는 성능을 보여주며, Gemini Ultra도 대부분의 경우 GPT-4를 뛰어넘는 점수를 기록하고 있습니다.