OpenAI
GPT-4o
멀티모달 통합 · 실시간 음성 지원
ActiveMultimodal🗓 2024-05-13
#멀티모달#음성#실시간#코딩
Arena ELO1285
입력 가격$2.5
컨텍스트128K
속도110 t/s
설명
텍스트·이미지·오디오를 통합 처리하는 OpenAI의 옴니 모델. GPT-4 Turbo 대비 2배 빠르고 50% 저렴하며, 실시간 음성 대화 기능을 지원합니다.
스펙
| 컨텍스트 윈도우 | 128,000 tokens |
| 최대 출력 | 16,384 tokens |
| 파라미터 | 비공개 |
| 아키텍처 | Transformer (Dense) |
| 학습 컷오프 | 2024-04 |
| 멀티모달 | text, image, audio |
| 지원 언어 | 100+ |
| 오픈소스 | ❌ Proprietary |
Best For
- 음성 인터페이스
- 이미지 분석
- 일반 코딩
- 비용 효율 멀티모달
Weaknesses
- GPT-5.4 대비 전 영역 낮음
- 추론 모델 부재