AI 모델 허브/DeepSeek V3
DeepSeek

DeepSeek V3

극강 가성비 · GPT-4o급 성능 · $0.27/1M

ActiveLLM🗓 2024-12-26
#가성비#코딩#오픈소스#효율
Arena ELO1320
입력 가격$0.27
컨텍스트128K
속도180 t/s

설명

비용 효율의 혁명. 단 $6M 학습 비용으로 GPT-4o·Claude 3.5 Sonnet에 필적하는 성능을 달성했습니다. MLA(Multi-head Latent Attention) 아키텍처로 추론 비용을 혁신적으로 절감했습니다.

스펙

컨텍스트 윈도우128,000 tokens
최대 출력8,192 tokens
파라미터671B (37B 활성)
아키텍처Transformer (MoE) + MLA
학습 컷오프2024-07
멀티모달text
지원 언어30+
오픈소스✅ DeepSeek License

Best For

  • 코딩·개발
  • 대규모 배포
  • 비용 최소화
  • 중국어 작업

Weaknesses

  • 다국어 제한
  • 멀티모달 미지원
  • API 안정성