AI 벤치마크 리더보드
주요 AI 벤치마크 기준 모델 순위
| # | 모델 | 기업 | ArenaELO | |
|---|---|---|---|---|
| 1 | Claude Opus 4.6 | Anthropic | 1397 | 상세 보기 |
| 2 | GPT-5.4 | OpenAI | 1380 | 상세 보기 |
| 3 | o3 | OpenAI | 1370 | 상세 보기 |
| 4 | Gemini 3.1 Pro | 1355 | 상세 보기 | |
| 5 | DeepSeek R1 | DeepSeek | 1330 | 상세 보기 |
| 6 | Claude Sonnet 4.6 | Anthropic | 1320 | 상세 보기 |
| 7 | DeepSeek V3 | DeepSeek | 1320 | 상세 보기 |
| 8 | o4-mini | OpenAI | 1310 | 상세 보기 |
| 9 | Llama 4 Maverick | Meta | 1310 | 상세 보기 |
| 10 | Gemini 2.5 Pro | 1300 | 상세 보기 | |
| 11 | Grok 4 | xAI | 1290 | 상세 보기 |
| 12 | GPT-4o | OpenAI | 1285 | 상세 보기 |
| 13 | Qwen 3.5 | Alibaba | 1285 | 상세 보기 |
| 14 | GPT-5.4 Mini | OpenAI | 1260 | 상세 보기 |
| 15 | Mistral Large 2 | Mistral | 1260 | 상세 보기 |