AI モデル評価ベンチマーク

业界主流の AI モデル評価ベンチマーク一覧。各ベンチマークの説明と、モデルのランキングを確認できます。

評価ベンチマークについて

各評価ベンチマークは、AI モデルの特定の能力を測定するために設計されています。数学推論、コーディング、総合的な理解力など、多様な角度からモデルの性能を評価できます。データは定期的に更新され、最新のモデルのスコアが反映されます。