DeepSeek R1 — 리뷰, 가격, 벤치마크 | 프롬프트지니 | PromptGenie

AI 모델 허브/DeepSeek R1

설명

오픈소스 추론 모델의 게임 체인저. o1과 동등한 수준의 수학·코딩 추론 성능을 제공하면서 가중치를 완전 공개했습니다. AI 업계에 충격을 주며 "DeepSeek Shock"을 일으킨 역사적 모델입니다.

스펙

컨텍스트 윈도우	128,000 tokens
최대 출력	16,384 tokens
파라미터	671B (37B 활성)
아키텍처	Transformer (MoE) + RL
학습 컷오프	2024-07
멀티모달	text
지원 언어	30+
오픈소스	✅ MIT

ModelsHub.bestFor

수학 증명
코딩 추론
연구 실험
오픈소스 에이전트

ModelsHub.weaknesses

영어 외 언어 지원 제한
멀티모달 미지원
대규모 인프라 필요