구글 Gemini 공식 오픈, 바드와의 통합으로 생성 AI 1위 자리 노린다

Hundori
Hundori

2024년 상반기로 오픈이 연기된 줄 알았던 구글 제미나이가 2023년 12월 6일 전격 공개됐다. 구글 제미나이는 지구상 가장 뛰어난 어벤저스급 연구진으로 구성된 Google의 AI 사업부인 DeepMind와 Google Brain의 연구팀이 힘을 합쳐 개발한 차세대 멀티모달 AI 모델로 구글은 이를 "역대 최대 규모의 과학 및 엔지니어링 프로젝트"라고 부르고 있다. ‌‌

구글은 블로그를 통해 "바드 영어 버전은 제미나이 프로의 파인튜닝된 버전을 사용하여 보다 고도화된 추론, 계획, 이해 능력 등을 갖추게 되며 내년 초에는 최대 규모 모델인 제미나이 울트라를 적용한 바드 어드밴스드(Bard Advanced)를 선보인다"라고 밝혔다. 바드의 새로운 기능은 170개 이상의 국가 및 지역에서 영어로 제공되며, 조만간 유럽 등 더 많은 지역과 언어로 확대될 예정이다.

이번에 공개된 제미나이의 멀티모달 AI(Multimodal AI)는 텍스트, 이미지, 영상, 음성 등 다양한 데이터 모달리티를 함께 고려하여 서로간의 관계성을 학습 및 표현하는 기술로 다양한 콘텐츠 유형 정보를 수신하고 추론할 수 있는 능력을 갖추고 있다. 예를 들어 기타 그림을 보여주고 여기에 어울리는 피아노 곡을 만들어 달라고 요청하거나 서로 다른 경사진 도로에 있는 2개의 자동차 그림을 보여주고 속도를 계산해 달라고 요청할 수 있다.

제미나이는 강화학습과 트리 검색 등 알파고에서 가져온 학습 기법을 활용하는 대규모 언어 모델(LLM)의 집합으로, GPT-4를 제치고 지구상에서 가장 지배적인 생성 AI 솔루션으로 자리매김할 수 있는 잠재력을 보유하고 있다고 평가받고 있다. 특히 구글 검색, 유튜브, 구글 북스, 구글 스콜라를 포함한 여러 서비스에서 수집한 데이터를 기반으로 데이터 세트에서 얻을 수 있는 인사이트와 추론의 정교함에서 우위를 점할 수 있을 것으로 보인다. 그 이유는 생성 AI는 결국 학습 데이터가 핵심적인 차별화 요소이며, 누가 더 크고 풍부한 데이터 세트로 AI 모델을 학습시키느냐에 따라 거대 LLM간 전쟁의 승자가 결정될 것이기 때문이다.

그렇다면 제미나이는 GPT-4나 메타의 라마와 어떻게 다를까? 오픈AI의 GPT-4가 기본적으로 콘텐츠 제작 및 복잡한 텍스트 분석과 같은 언어 관련 작업에 탁월하지만, 이미지 분석 및 웹 액세스는 OpenAI의 플러그인에 의존하고 이미지 생성 및 오디오 처리는 DALL-E 3 및 Whisper에 의존하는 반면 제미나이는 플러그인이나 외부 애플리케이션의 도움 없이도 자체적으로 멀티모달을 수행하는 것이 차이점이다.

또한 내부 제품/서비스인 Bard와 스마트폰인 Pixel 8 기기에 제미나이가 탑재되기 있기 때문에 강력한 구글의 AI 생태계 구축에 긍정적인 영향을 미칠 것으로 보인다. 이러한 정책은 서비스 지향적이며 오픈 생태계를 지향하는 오픈AI GPT-4 및 메타의 라마와 같은 AI 모델과는 다른 노선을 걷고 있다고 할 수 있으며 구글이 애플과 같은 폐쇄적 플랫폼을 선택한 것으로 볼 수 있다.

멀티모달에 특화된 제미나이 1.0 모델은 제미나이 울트라, 프로, 나노 등 3가지 버전으로 출시됐으며 2024년 초에 더 업그레이드된 버전이 출시될 예정이다.

  • 제미나이 나노: 구글 픽셀 8에서 실행되도록 설계된 모델로 채팅 애플리케이션 내에서 답글을 제안하거나 텍스트를 요약하는 등 외부 서버에 연결하지 않고도 효율적인 AI 처리가 필요한 온디바이스 작업을 수행하도록 제작되었다.
  • ‌‌제미나이 프로:  구글 데이터 센터에서 실행되는 Gemini Pro는 빠른 응답속도와 복잡한 쿼리를 이해하도록 설계됐으며 AI 챗봇인 Bard의 최신 버전을 구동하도록 설계되었다.
  • 제미나이 울트라: 대규모 언어 모델(LLM) 연구 및 개발에 널리 사용되는 32개 학술 벤치마크 중 30개에서 현재 가장 뛰어난 성능을 발휘하는 모델로 복잡한 작업을 위해 설계되었으며 현재 테스트 단계를 마친 후 2024년 출시될 예정이다.

이번 제미나이의 깜짝 공개는 2032년까지 1조 3,000억 달러의 가치가 있을 것으로 예상되는 생성  AI 시장을 오픈 AI측에 넘겨주지 않겠다는 구글의 의지를 보여주고 있다. 구글은 또한 오픈 AI의 경쟁사인 앤트로픽(Anthropic)에 20억 달러를 추가 투자한다고 밝힌 바 있어 생성 AI 기술을 둘러싼 오픈AI, 구글, 메타, MS 등 빅테크간 경쟁이 더욱 치열해질 것으로 보인다.

"제미나이 출시로 이제 새로운 AI 시대가 펼쳐쳤다. 제미나이의 가장 강력한 점 중 하나는 하나의 기반 기술을 연구하고 개선하면 그 기술이 즉시 모든 제품에 적용된다는 점이다. 이 모델은 전 세계 구글의 검색 엔진, 광고 제품, 크롬 브라우저 등에 통합될 것이다"  - Sundar Pichai , Google CEO -