AI 모델 허브/DeepSeek R1
DeepSeek

DeepSeek R1

o1급 추론 · 완전 오픈소스 · 게임체인저

ModelsHub.activeReasoning🗓 2025-01-20
#오픈소스#추론#수학#코딩#RL
Arena ELO1330
입력 가격$0.55
컨텍스트128K
속도-

설명

오픈소스 추론 모델의 게임 체인저. o1과 동등한 수준의 수학·코딩 추론 성능을 제공하면서 가중치를 완전 공개했습니다. AI 업계에 충격을 주며 "DeepSeek Shock"을 일으킨 역사적 모델입니다.

스펙

컨텍스트 윈도우128,000 tokens
최대 출력16,384 tokens
파라미터671B (37B 활성)
아키텍처Transformer (MoE) + RL
학습 컷오프2024-07
멀티모달text
지원 언어30+
오픈소스✅ MIT

ModelsHub.bestFor

  • 수학 증명
  • 코딩 추론
  • 연구 실험
  • 오픈소스 에이전트

ModelsHub.weaknesses

  • 영어 외 언어 지원 제한
  • 멀티모달 미지원
  • 대규모 인프라 필요