본문 바로가기
비즈니스 & 테크

Google의 AI 모델인 제미니 Gemini 1.5에 대해 알아야 할 모든 것을 알려드립니다.

by 정보톡톡01 2024. 2. 20.

구글이 AI 전쟁의 판을 키우면서 대기업과 스타트업 간의 치열한 경쟁이 벌어지고 있습니다.

모기업인 알파벳이 소유한 이 거대 기술 기업은 제미니 1.5라는 새로운 대규모 언어 모델(LLM)을 개발 중이라고 발표했습니다. 더버지에 따르면 이 기술의 첫 번째 버전인 Gemini 1.5 프로는 초기 테스트를 위해 곧 출시될 예정입니다,

지난주 구글과 알파벳의 CEO 순다르 피차이와 구글 딥마인드 CEO 데미스 하사비스가 작성한 회사 블로그 게시물에 요약된 이 소식은 구글이 오픈AI의 GPT-4와 스타트업과 대기업이 만들고 있는 다른 LLM에 대한 해답이 될 오리지널 제미니를 공개한 지 불과 두 달 만에 나온 것입니다.

제미니는 차세대 멀티 모달 AI 모델로 이미지, 텍스트, 오디오, 비디오 및 코딩 언어의 조합을 포함하여 두 가지 이상의 유형의 데이터를 처리할 수 있는 기술입니다. 이 기술은 비즈니스 도구 및 개인 비서로 사용하기 위한 것입니다.

제미니는 구글이 AI에 처음 진출한 것은 아니며, 오히려 2월 초에 다양한 AI 도구를 '정리' 하고 이름을 모두 제미니로 바꾼 바 있습니다.

Gemini 1.5에서는 새로운 기술의 개선 사항이 기존 Gemini의 기능보다 비약적으로 향상되었습니다. 지금까지 알려진 내용은 다음과 같습니다.

반응형

'전문가 혼합' 모델을 사용합니다.

Gemini 1.5는 MoE라고도 하는 '전문가 혼합'이라는 전문화 기법을 통해 더 빠르고 효율적인 성능을 약속합니다. 쿼리를 받을 때마다 전체 모델을 실행하는 대신, Gemini의 MoE는 처리 능력의 관련 부분만 사용하여 올바른 답변을 생성할 수 있습니다.

더 큰 컨텍스트 창이 있습니다.

AI 모델의 성능은 정보를 처리하는 데 사용되는 빌딩 블록으로 구성된 컨텍스트 창에 의해 결정됩니다. 여기에는 단어, 이미지, 비디오, 오디오 또는 코드 등이 포함될 수 있습니다. AI 세계에서는 이러한 빌딩 블록을 토큰이라고 합니다.

기존 Gemini는 최대 32,000개의 토큰을 실행할 수 있었습니다. 하지만 Gemini 1.5 Pro의 컨텍스트 창 용량은 최대 100만 개의 토큰을 처리할 수 있습니다. 이는 새로운 LLM이 이전 버전보다 1시간 분량의 동영상, 11시간 분량의 오디오, 3만 줄 이상의 코드 또는 70만 단어 이상의 코드베이스 등 더 많은 데이터를 분석할 수 있다는 것을 의미한다고 Google은 블로그 게시물에서 설명했습니다.

이전 버전에 비해 성능이 향상되었습니다.

새로운 AI 모델을 이전 모델과 비교 테스트한 결과, Gemini 1.5 Pro는 Google이 사용하는 벤치마크 테스트의 87%에서 이전 모델보다 성능이 뛰어났다고 회사 측은 밝혔습니다.

또한, Gemini 1.5는 '건초 더미 속 바늘 찾기' 평가로 알려진 테스트에서 99%의 경우 백만 개의 토큰으로 이루어진 데이터 블록에서 작은 텍스트 조각을 찾아낼 수 있었습니다.

Gemini 1.5는 사용자가 쿼리를 미세 조정하는 데 많은 추가 시간을 들이지 않고도 매우 긴 쿼리에서 좋은 응답을 생성하는 데 더 능숙해지고 있습니다. Google은 테스터들이 Gemini 1.5에 모호한 언어의 문법 매뉴얼을 제공한 결과, LLM이 사람이 학습하는 것과 비슷한 수준으로 텍스트를 영어로 번역할 수 있었다고 밝혔습니다.

강화된 안전성 테스트를 거쳤습니다.

AI가 점점 더 강력해짐에 따라 무기화에서 속임수에 이르기까지 안전 문제에 대한 기술의 역할에 대한 우려도 커지고 있습니다. Google은 Gemini 1.5를 출시하면서 광범위한 윤리 및 안전 테스트를 거쳐 광범위한 출시를 승인했다고 밝혔습니다. 이 기술 회사는 AI 안전 위험에 대한 연구를 수행했으며 잠재적인 피해를 완화하는 기술을 개발했습니다.

 
 
반응형

댓글