DeepSeek V3 — 리뷰, 가격, 벤치마크 | 프롬프트지니 | PromptGenie

AI 모델 허브/DeepSeek V3

설명

비용 효율의 혁명. 단 $6M 학습 비용으로 GPT-4o·Claude 3.5 Sonnet에 필적하는 성능을 달성했습니다. MLA(Multi-head Latent Attention) 아키텍처로 추론 비용을 혁신적으로 절감했습니다.

스펙

컨텍스트 윈도우	128,000 tokens
최대 출력	8,192 tokens
파라미터	671B (37B 활성)
아키텍처	Transformer (MoE) + MLA
학습 컷오프	2024-07
멀티모달	text
지원 언어	30+
오픈소스	✅ DeepSeek License

Best For

코딩·개발
대규모 배포
비용 최소화
중국어 작업

Weaknesses

다국어 제한
멀티모달 미지원
API 안정성