장문 컨텍스트 표준화: 주요 모델 전반에 걸쳐 100만+ 토큰
2025년에는 프론티어 모델의 경우 100만 토큰 컨텍스트 윈도우가 표준화되어 단일 프롬프트에서 전체 코드베이스, 책, 연구 코퍼스 분석이 가능해졌습니다.
AI 업계의 최신 소식을 빠르게 확인하세요
2025년에는 프론티어 모델의 경우 100만 토큰 컨텍스트 윈도우가 표준화되어 단일 프롬프트에서 전체 코드베이스, 책, 연구 코퍼스 분석이 가능해졌습니다.
앤트로픽이 복잡한 다단계 추론 작업을 위한 확장 사고 모드와 향상된 코딩 및 분석 기능을 갖춘 Claude Opus 4.5를 출시했습니다.
Claude Opus 4.5와 GPT-4o를 기반으로 구축된 최신 AI 에이전트 프레임워크가 최소한의 인간 개입으로 복잡한 다일간 소프트웨어 및 연구 작업을 완료하는 능력을 보여줍니다.
구글의 Gemini 2.5 Pro가 LMSYS 챗봇 아레나에서 가장 높은 ELO 등급을 달성하며 인간 선호도 평가에서 GPT-4o와 Claude 모델을 능가했습니다.
전 세계 AI API 사용량이 기업 도입과 복잡한 작업에 여러 AI 호출을 연결하는 에이전트 워크플로우에 힘입어 하루 10조 토큰을 돌파했습니다.
Gemini 2.5 Pro와 GPT-4o를 포함한 주요 AI 모델들이 이제 강력한 비디오 이해 기능을 제공하여 콘텐츠 분석, 교육, 접근성 분야의 새로운 사용 사례를 가능하게 합니다.
구글이 향상된 생산성 기능을 위해 Gemini 2.5 Pro로 구동되는 Gmail, Docs, Sheets, Meet 전반에 걸친 심층 통합 Gemini for Workspace를 출시했습니다.
OpenAI가 향상된 감성 이해 및 대인 관계 능력을 갖춘 GPT-4.5를 출시하여 미묘한 대화와 창의적 글쓰기 작업에서 개선을 보였습니다.
미국, 영국, EU, 일본, 한국의 AI 안전 연구소들이 프론티어 AI 모델을 위한 공유 평가 프레임워크와 최소 안전 기준을 조율합니다.
주요 기술 기업들이 AI 코딩 어시스턴트가 이제 프로덕션 코드의 30%를 생성하거나 상당한 도움을 제공하며, 2025년에 도입이 가속화되고 있다고 보고합니다.
오픈소스 모델(Llama 4, DeepSeek, Mistral)과 폐쇄형 독점 API 간의 격차가 계속 좁혀지며, 오픈 모델이 이제 대부분의 실용적 작업에서 경쟁력을 갖추게 되었습니다.
치열한 경쟁으로 소형/효율적 모델 API 가격이 전례 없는 수준으로 하락하여 GPT-4o mini, Claude Haiku, Gemini Flash 모두 입력 토큰 백만 개당 0.30달러 미만으로 경쟁하고 있습니다.
메타가 네이티브 이미지 및 비디오 이해 기능을 갖춘 Scout와 Maverick 변형의 Llama 4 시리즈를 출시했습니다. Maverick은 여러 멀티모달 벤치마크에서 최고 성능을 주장했습니다.
AI 연구 커뮤니티가 실제 GitHub 이슈가 합성 문제를 대체하면서 SWE-bench Verified를 실용적 코딩 능력 측정의 표준으로 점점 더 많이 사용합니다.
xAI가 100만 토큰 컨텍스트 윈도우, 실시간 X 통합, 코딩 및 수학 벤치마크에서의 상당한 개선을 갖춘 Grok 3를 출시했습니다.
DeepSeek의 파괴적 혁신 이후 OpenAI, Anthropic, Google을 포함한 주요 AI 공급업체들이 API 가격을 40-70% 인하하여 개발자들에게 AI 접근성을 높였습니다.
유럽연합 AI법이 고위험 AI 시스템에 대한 집행을 시작하여 중요 분야에 배포되는 모델에 투명성, 인간 감독, 강력한 테스트를 요구합니다.
DeepSeek V3, Qwen Max, Kimi k1.5를 포함한 중국 AI 모델들이 글로벌 경쟁력 있는 성능을 보여주며 AI 개발 환경의 변화를 신호했습니다.
Mistral AI가 20개 이상의 언어에 걸쳐 크게 향상된 다국어 지원을 갖춘 Large 2를 출시하여 유럽 기업 배포에서 최고 성능을 달성했습니다.
앤트로픽의 Claude 3.7 Sonnet이 확장 사고를 활용해 SWE-bench Verified에서 70.3%를 달성하여 자율 소프트웨어 엔지니어링 작업에서 새로운 최첨단 기술을 확립했습니다.
앤트로픽이 구글과 Spark Capital이 주도하는 35억 달러 시리즈 E 펀딩 라운드를 완료하여 기업 가치를 615억 달러로 평가받고 OpenAI의 주요 경쟁자로서의 위치를 확인했습니다.
DeepSeek이 671B MoE 모델 V3를 출시했으며, 대부분의 벤치마크에서 GPT-4o와 동등하거나 능가하면서 API를 통해 훨씬 저렴하게 운영됩니다.
DeepSeek의 R1 가중치 오픈소스 공개 결정이 연구자와 기업들의 빠른 채택을 이끌어 몇 주 안에 수백 개의 파인튜닝 변형이 등장했습니다.
마이크로소프트가 2025년 AI 데이터 센터에 800억 달러 투자 계획을 발표했으며, 절반 이상이 증가하는 AI 모델 수요를 지원하기 위한 미국 내 인프라에 할당됩니다.
OpenAI의 o3 모델이 높은 연산 설정으로 ARC-AGI-2 벤치마크에서 전례 없는 88% 점수를 달성하여 이전 SOTA를 크게 능가하고 인간 수준에 근접했습니다.