
中国のMoonshot AIが11月6日に、エージェント性能に特化したAIモデル「Kimi K2 Thinking」を公開した。Hugging Faceでオープンウェイトモデルとして公開されている。
人間の介入なしで最大200〜300の連続したツールを呼び出せるのが最大の特徴。複雑な問題を解決するため、数百ステップにわたって一貫性のある推論ができるという。
モデルとしては、総合1兆パラメータ規模のMixture of Experts(MoE)アーキテクチャーを基盤に、256Kのコンテキストウィンドウを備え、深い推論と長期的な計画立案に優れるとする。
性能面では、専門家レベルの知識が問われる「Humanity’s Last Exam」で44.9%、ブラウジングや検索のエージェントタスクである「BrowseComp」で60.2%など、OpenAIの「GPT-5」や、Anthropicの「Claude Sonnet 4.5 Thinking」を超えるスコアを達成した。






