OpenAI

GPT-4o

멀티모달 통합 · 실시간 음성 지원

ModelsHub.activeMultimodal🗓 2024-05-13
#멀티모달#음성#실시간#코딩
Arena ELO1285
입력 가격$2.5
컨텍스트128K
속도110 t/s

설명

텍스트·이미지·오디오를 통합 처리하는 OpenAI의 옴니 모델. GPT-4 Turbo 대비 2배 빠르고 50% 저렴하며, 실시간 음성 대화 기능을 지원합니다.

스펙

컨텍스트 윈도우128,000 tokens
최대 출력16,384 tokens
파라미터비공개
아키텍처Transformer (Dense)
학습 컷오프2024-04
멀티모달text, image, audio
지원 언어100+
오픈소스❌ Proprietary

ModelsHub.bestFor

  • 음성 인터페이스
  • 이미지 분석
  • 일반 코딩
  • 비용 효율 멀티모달

ModelsHub.weaknesses

  • GPT-5.4 대비 전 영역 낮음
  • 추론 모델 부재