
by Allen Institute for AI
트랜스포머와 RNN의 결합, 7B 오픈 모델의 새 지평
요금
부분무료
출시
2024년 5월 1일
제작 국가
미확인
대한민국 지원
미확인

Olmo Hybrid는 트랜스포머의 어텐션 메커니즘과 선형 RNN 레이어를 혁신적으로 결합한 완전 오픈소스 7B 모델입니다. 이 모델은 Gated DeltaNet과 어텐션을 3:1 비율로 사용하여, 기존 Olmo 3 모델과 동일한 MMLU 정확도를 유지하면서도 토큰 사용량을 49%나 절감하는 놀라운 효율성을 보여줍니다.
개발자와 연구자들은 Olmo Hybrid를 통해 더 적은 자원으로도 강력한 성능을 발휘하는 대규모 언어 모델을 구축하고 활용할 수 있습니다. 이는 모델 학습 및 운영 비용을 크게 줄이면서도, 복잡한 자연어 처리 작업에서 높은 정확도를 달성해야 하는 다양한 애플리케이션에 이상적인 솔루션을 제공합니다.