DeepSeek
DeepSeek R1
o1급 추론 · 완전 오픈소스 · 게임체인저
ModelsHub.activeReasoning🗓 2025-01-20
#오픈소스#추론#수학#코딩#RL
Arena ELO1330
입력 가격$0.55
컨텍스트128K
속도-
설명
오픈소스 추론 모델의 게임 체인저. o1과 동등한 수준의 수학·코딩 추론 성능을 제공하면서 가중치를 완전 공개했습니다. AI 업계에 충격을 주며 "DeepSeek Shock"을 일으킨 역사적 모델입니다.
스펙
| 컨텍스트 윈도우 | 128,000 tokens |
| 최대 출력 | 16,384 tokens |
| 파라미터 | 671B (37B 활성) |
| 아키텍처 | Transformer (MoE) + RL |
| 학습 컷오프 | 2024-07 |
| 멀티모달 | text |
| 지원 언어 | 30+ |
| 오픈소스 | ✅ MIT |
ModelsHub.bestFor
- 수학 증명
- 코딩 추론
- 연구 실험
- 오픈소스 에이전트
ModelsHub.weaknesses
- 영어 외 언어 지원 제한
- 멀티모달 미지원
- 대규모 인프라 필요