제미나이 1.5 프로: GPT-4를 앞서는 혁신 기술
- 제미나이 1.5 프로는 기존의 GPT-4나 엔트로피의 클로드 모델과 비교하기 어려울 정도로 우수한 성능을 자랑합니다.
- 기존의 GPT-4를 이기기 위한 전략 중 하나는 입력할 수 있는 토큰의 수가 많은 것이었는데, 이 부분에서 재미나이 1.5 프로는 뛰어나게 나왔습니다.
- 기술적인 측면에서도 1.0 울트라와 비슷한 성능을 보이면서 더 많은 데이터를 입력할 수 있는 기술들을 도입하였습니다.
- 이러한 기술들이 실제 서비스에서 많은 의미를 가질 것으로 예상되는데 이러한 점은 오픈 AI와의 주도권 싸움에서도 중요한 역할을 할 것으로 보입니다.
- 구글 딥 마인드에서 내놓은 논문에 따르면 1.0 프로보다 훨씬 뛰어난 성과를 보여주는데, 이러한 성과는 애큐러시 측면에서도 확연하게 나타나고 있습니다.
센드버드 엔트로픽 프로세싱
- 코딩, 멀티링, 그리티 등 다양한 측면을 포함한 센드버드의 엔트로픽 프로세싱에 대해 설명됩니다.
- 프롬포트를 사용할 때 이미지를 예시로 들어 성능을 비교하며 엔트로픽의 모델인 엔트로픽과 클로드 2.1은 많은 양의 데이터 입력을 받아들여 답변하는 데 우세한 성능을 가집니다.
- 토큰 수 즉, 문자 수도 매우 많은 편이며 영상, 오디오, 코드, 텍스트 등 다양한 형태의 입력을 처리합니다.
- 또한 Needle in a Haystack이라는 지표를 사용하여 입력된 데이터에서 특정한 텍스트를 찾는 테스트를 진행하며 전반적으로 99% 확률로 정확한 결과를 보입니다.
- 이를 통해 센드버드 엔트로픽은 어마무시한 양의 데이터를 처리하는 데 적합하다는 것을 확인할 수 있습니다.
반응형
AI가 대규모 데이터와 멀티모달 녹취록을 처리하는 혁신적인 기능
- 구글 유튜브에서는 10만 줄에 해당하는 코드를 입력하고 프롬프트에 따라 특정 코드를 찾아내고 수정 가능한 테스트를 수행합니다.
- 구글의 AI 프레임워크인 잭스의 코드 베이스는 75만 개 수준의 토큰을 가지고 있고, 이로부터 특정한 메서드나 미분 등을 찾아낼 수 있다.
- 또한 42페이지 분량의 아폴로 11호 달 탐사 녹취록을 멀티모달리티 지원을 통해 분석하고 이를 그림으로 표현할 수 있습니다.
- 레미제라블과 무성 영화 녹취록의 내용을 식별할 수 있는 것처럼 텍스트 내부의 특정 내용을 찾을 수 있습니다.
- 이러한 기능은 AI가 대규모 데이터와 멀티모달 녹취록을 처리하는 혁신적인 기능입니다.
믹스처 오브 엑스포트(MOE) 모델: 작은 모델을 통한 높은 성능
- 쑥 넣어놓은 뒤 여러 가지 사건을 판단하기 위해 프롬프트를 이용하여 특정 장면에 대한 아웃풋을 제시하는 기술이 있습니다.
- 이러한 어마무시한 기술은 믹스처 오브 엑스포트(MOE) 모델로 가능합니다.
- 믹스처 오브 엑스포트 모델은 다양한 전문가 AI 모델을 섞어 전체적인 복잡도를 낮추면서도 효율적으로 처리할 수 있도록 합니다.
- 적은 리소스를 사용하여 높은 성능을 제공하며, 작은 모델에도 MOE 방식을 적용하여 GPT 3.5와 같은 대형 모델과 유사한 성능을 나타낼 수 있습니다.
- MOE 방식은 미스트랄 AI와 구글이 탑재한 제미나이 1.5 프와 같은 대형 모델에서도 사용 가능하며 중요한 기술로 인정받고 있습니다.
블렌딩과 MOE 방식 비교 및 지능적인 AI 번역
- 블렌딩과 MOE 방식은 서로 다르며, MOE 방식은 전문가가 각각의 전문 역할을 수행하는 것과 같습니다.
- 블렌딩은 다양한 모델들이 통합되어 전체적인 성능을 향상하는 방식입니다.
- 제미나이 1.5의 MOE 방식은 놀라운 성능 향상을 이뤘으며, 향후 멀티모달리티 지원을 위해 더 발전할 것으로 예상됩니다.
- 또한 AI는 칼라망 언어를 학습하지 않았음에도 컨텍스트 러닝을 통해 실제로 칼라망 언어를 번역할 수 있을 정도로 학습 능력을 향상시켰습니다.
- 이러한 AI의 컨텍스트 러닝 능력은 새로운 예시나 상황에 대해 지식을 즉시 이해할 수 있는 능력을 의미합니다.
구글 AI 스튜디오와 버텍스 AI 통해 가지고 이 재미나 1.5를 사용
- 어마무시한 컨텍스트 러닝을 통해 영어에서 인간 학습자와 비슷한 성과를 달성했습니다.
- 구글 AI 스튜디오는 AI 모델을 개발하기 위한 브라우저 기반 개발 환경을 제공하고 최신 AI 모델인 이 재미나 1.5의 빠른 사용이 가능합니다.
- 이번 모델은 기존 AI 모델보다 한 단계 더 발전한 것으로, 작은 데이터로도 비디오, 텍스트, 음성 등 다양한 내용을 검색하고 아주 작은 힌트를 얻을 수 있습니다.
- 구글이 제공하는 AI 스튜디오를 활용하면 AI 모델을 쉽게 통합할 수 있습니다.
- 단 AI 부하를 막기 위해 최대 128,000개의 토큰만 입력받을 수 있으며, 100만 개 토큰을 입력받을 경우에는 추가적인 구매 옵션이 필요합니다.
- 이는 모델을 사용하는 데 비용이 많이 발생하게 될 수 있는 한계점이 있습니다.
- 또한, 구글이 이 재미나 1.5를 발표하면서 오픈 AI의 소라 등 다른 경쟁 모델들에 대해 선방을 내칠 수 있을 것으로 보입니다.
- 앞으로는 AI 모델의 발전을 지속 관찰하면서 구글의 반격과 다른 경쟁 모델의 등장을 지켜보면 좋을 것입니다.
반응형
'비즈니스 & 테크' 카테고리의 다른 글
노후 준비 안된 50대 부부, 프리랜서.. 노후 자금 마련 방법 (노후자금, 노후생활비, 은퇴자금) (0) | 2024.02.21 |
---|---|
기술 면접관은 지원자가 코딩 라운드에서 ChatGPT를 사용하여 부정행위를 할 때 이를 알 수 없다는 실험 결과가 나왔습니다. (0) | 2024.02.21 |
Google의 AI 모델인 제미니 Gemini 1.5에 대해 알아야 할 모든 것을 알려드립니다. (0) | 2024.02.20 |
엘론 머스크는 뉴럴링크의 첫 환자가 '생각만으로' 컴퓨터 마우스를 움직일 수 있다고 말했습니다. (0) | 2024.02.20 |
이더리움 상위 10대 보유자: 2024년에 누가 가장 많은 이더를 보유하고 있을까요? (0) | 2024.01.13 |
2024년은 전 세계적으로 급진적인 AI 규제가 시행되는 해입니다. (0) | 2024.01.13 |
ChatGPT는 무엇을 할 수 있나요? 2024년의 9가지 매력적인 사용 사례 (0) | 2024.01.13 |
2024년 리테일의 새로운 트렌드 - '퀵 커머스'와 '추천 커머스' (0) | 2024.01.13 |
댓글