ARC-AGI 84.6% 달성하며 인간 능력 뛰어넘어… 환각·속도 문제는 여전히 숙제

2026년 2월 12일 구글 딥마인드가 공개한 Gemini 3 Deep Think가 AI 추론 모델 경쟁에 새로운 기준을 제시했다. 복잡한 과학적 추론과 엔지니어링 문제 해결에 특화된 이 모델은 OpenAI의 o3, Anthropic의 Claude Sonnet 4.5, 중국의 DeepSeek R1과 치열한 경쟁 구도를 형성하고 있다.