DeepSeek
DeepSeek V3
극강 가성비 · GPT-4o급 성능 · $0.27/1M
활성LLM🗓 2024-12-26
#가성비#코딩#오픈소스#효율
Arena ELO1320
입력 가격$0.27
컨텍스트128K
속도180 t/s
설명
비용 효율의 혁명. 단 $6M 학습 비용으로 GPT-4o·Claude 3.5 Sonnet에 필적하는 성능을 달성했습니다. MLA(Multi-head Latent Attention) 아키텍처로 추론 비용을 혁신적으로 절감했습니다.
스펙
| 컨텍스트 윈도우 | 128,000 tokens |
| 최대 출력 | 8,192 tokens |
| 파라미터 | 671B (37B 활성) |
| 아키텍처 | Transformer (MoE) + MLA |
| 학습 컷오프 | 2024-07 |
| 멀티모달 | text |
| 지원 언어 | 30+ |
| 오픈소스 | ✅ DeepSeek License |
최적 용도
- 코딩·개발
- 대규모 배포
- 비용 최소화
- 중국어 작업
약점
- 다국어 제한
- 멀티모달 미지원
- API 안정성