Leaderboard
Best AI for Science 2026.
Find the best AI for science and research. Ranked by GPQA Diamond, FrontierMath, Frontier Science Research, CharXiv, and MMMU-Pro benchmarks.
Gemini 3 Pro Preview Google | 91.9% | 91.9% | 81% | 81.4% | โ | โ | โ |
![]() gpt-5.4-pro OpenAI | โ | 90.5% | โ | โ | 17.4% | โ | 10.8% |
![]() gpt-5.4 OpenAI | 92.8% | 89.4% | 81.2% | โ | 15.6% | 47.6% | 9.4% |
![]() gpt-5.1 OpenAI | 88.1% | 88.1% | โ | โ | โ | 26.7% | โ |
![]() gpt-5.2-pro OpenAI | 93.2% | 87.9% | โ | โ | 14.9% | โ | 8.7% |
![]() gpt-5.3-codex OpenAI | โ | 87.7% | โ | โ | 14.6% | โ | 7.3% |
![]() Grok 4 xAI | 87.5% | 87.5% | โ | โ | โ | โ | โ |
![]() gpt-5 OpenAI | 85.7% | 87.3% | 78.4% | 81.1% | โ | 26.3% | โ |
![]() Claude Opus 4.5 Anthropic | 87% | 87% | โ | โ | โ | โ | โ |
Gemini 2.5 Pro Google | 83% | 86.4% | โ | โ | โ | โ | โ |
![]() gpt-5.2 OpenAI | 92.4% | 85.4% | 79.5% | 82.1% | 12.9% | 40.3% | 7.6% |
![]() Grok 3 xAI | 84.6% | 84.6% | โ | โ | โ | โ | โ |
Kimi K2 Thinking Moonshot AI | โ | 84.5% | โ | โ | โ | โ | โ |
![]() Claude Sonnet 4.5 Anthropic | 83.4% | 83.4% | โ | โ | โ | โ | โ |
![]() o3 OpenAI | 83.3% | 83.3% | 76.4% | 78.6% | 10.3% | 15.8% | 0% |
![]() o4-mini OpenAI | 81.4% | 81.4% | โ | 72% | โ | โ | โ |
![]() o3-mini OpenAI | 77.2% | 79.7% | โ | โ | โ | 9.2% | โ |
![]() Claude Opus 4 Anthropic | 79.6% | 79.6% | โ | โ | โ | โ | โ |
Gemini 2.5 Flash Google | 82.8% | 78.3% | โ | โ | โ | โ | โ |
![]() o1 OpenAI | 78% | 75.7% | โ | โ | โ | 5.5% | โ |
![]() Claude Sonnet 4 Anthropic | 75.4% | 75.4% | โ | โ | โ | โ | โ |
![]() Claude Haiku 4.5 Anthropic | 73% | 73% | โ | โ | โ | โ | โ |
DeepSeek R1OSS DeepSeek | โ | 71.5% | โ | โ | โ | โ | โ |
![]() gpt-4.5-preview OpenAI | โ | 71.4% | โ | โ | โ | โ | โ |
Llama 4 MaverickOSS Meta | 69.8% | 69.8% | 59.6% | โ | โ | โ | โ |
![]() Claude Sonnet 3.7 Anthropic | 84.8% | 68% | โ | โ | โ | โ | โ |
![]() gpt-4.1-mini OpenAI | 65% | 65% | โ | 56.8% | โ | โ | โ |
![]() Claude 3.5 Sonnet Anthropic | 67.2% | 65% | โ | โ | โ | โ | โ |
DeepSeek V3OSS DeepSeek | 59.1% | 64.8% | โ | โ | โ | โ | โ |
Gemini 2.0 Flash Google | 62.1% | 62.1% | โ | โ | โ | โ | โ |
![]() o1 mini OpenAI | 60% | 60% | โ | โ | โ | โ | โ |
Llama 4 ScoutOSS Meta | 57.2% | 57.2% | โ | โ | โ | โ | โ |
![]() GPT-4o OpenAI | 70.1% | 56.1% | 59.9% | 58.8% | โ | โ | โ |
Llama 3.3 70B Meta | โ | 50.5% | โ | โ | โ | โ | โ |
![]() gpt-4.1-nano OpenAI | 50.3% | 50.3% | โ | 40.5% | โ | โ | โ |
Llama 3.1 405B Meta | โ | 49% | โ | โ | โ | โ | โ |
Amazon Nova Pro Amazon | โ | 46.9% | โ | โ | โ | โ | โ |
![]() gpt-4.1 OpenAI | 66.3% | 43.4% | โ | 56.7% | 13.2% | โ | โ |
![]() Claude 3.5 Haiku Anthropic | 41.6% | 41.6% | โ | โ | โ | โ | โ |
![]() GPT-4o-mini OpenAI | 40.2% | 40.2% | โ | โ | โ | โ | โ |
Amazon Nova 2 Lite Amazon | โ | โ | โ | โ | โ | โ | โ |
Amazon Nova 2 Omni Amazon | โ | โ | โ | โ | โ | โ | โ |
Amazon Nova 2 Pro Amazon | โ | โ | โ | โ | โ | โ | โ |
Amazon Nova Lite Amazon | โ | โ | โ | โ | โ | โ | โ |
Amazon Nova Micro Amazon | โ | โ | โ | โ | โ | โ | โ |
Amazon Nova Premier Amazon | โ | โ | โ | โ | โ | โ | โ |
![]() Claude 2 Anthropic | โ | โ | โ | โ | โ | โ | โ |
![]() Claude 2.1 Anthropic | โ | โ | โ | โ | โ | โ | โ |
![]() Claude 3 Haiku Anthropic | 33.3% | โ | โ | โ | โ | โ | โ |
![]() Claude 3 Opus Anthropic | 50.4% | โ | โ | โ | โ | โ | โ |
Showing 1โ50 of 336 models
Building with these APIs?
Get 10+ Next.js AI templates with auth, payments, and more.
All Large Language Models

OpenAI
60 modelsgpt-5.4ยทgpt-5.4-proยทgpt-5.3-chat-latestยทgpt-5.3-instantยทgpt-5.3-codexยทGPT-5.2 Codexยทgpt-5.2ยทgpt-5.1-codexยทgpt-5.1-codex-miniยทGPT-5.1 Codex HighยทGPT-5.1 HighยทGPT-5.1 InstantยทGPT-5.1 MediumยทGPT-5.1 Thinkingยทgpt-5-codexยทgpt-5.2-proยทgpt-5ยทGPT-5 HighยทGPT-5 Mediumยทgpt-5-miniยทgpt-5-nanoยทGPT OSS 120BยทGPT OSS 120B HighยทGPT OSS 20BยทGPT OSS 20B Highยทo3-proยทo3ยทo4-miniยทgpt-4.1ยทgpt-4.1-miniยทgpt-4.1-nanoยทo1-proยทgpt-4.5-previewยทo3-miniยทo1ยทgpt-5-proยทgpt-5.1ยทo1 miniยทo1 previewยทo1-mini-2024-09-12ยทo1-preview-2024-09-12ยทGPT-4o-2024-08-06ยทGPT-4o-miniยทGPT-4oยทGPT-4o-2024-05-13ยทGPT-4-turbo-2024-04-09ยทGPT-3.5-turbo-0125ยทGPT-4-turbo-0125ยทGPT-3.5-turbo-1106ยทGPT-4 TurboยทGPT-4-turbo-1106ยทcomputer-use-previewยทgpt-4o-audio-previewยทGPT-3.5-turbo-16kยทGPT-4-0613ยทGPT-4-32k-0613ยทGPT-3.5 TurboยทGPT-4ยทGPT-4-32kยทGPT-3.5-turbo

Anthropic
21 modelsClaude Sonnet 4.6ยทClaude Opus 4.6ยทClaude Opus 4.5ยทClaude Haiku 4.5ยทClaude Sonnet 4.5ยทClaude Opus 4.1ยทClaude Opus 4ยทClaude Sonnet 4ยทClaude Sonnet 3.7ยทClaude Haiku 3.5ยทClaude 3.5 HaikuยทClaude 3.5 SonnetยทClaude 3 HaikuยทClaude Haiku 3ยทClaude 3 OpusยทClaude 3 SonnetยทClaude Opus 3ยทClaude 2.1ยทClaude Instant 1.2ยทClaude 2ยทClaude Sonnet 3.5
Gemini 3.1 Flash Lite PreviewยทGemini 3.1 ProยทGemini 3 Flash PreviewยทGemini 3 Pro PreviewยทGemma 3n E4B InstructedยทGemini 2.5 Flash LiteยทGemini 2.5 ProยทGemini 2.5 Pro Preview 06-05ยทGemini 2.5 FlashยทGemma 3 12BยทGemma 3 27BยทGemma 3 4BยทGemini 2.0 FlashยทGemini 2.0 Flash LiteยทGemini 1.5 ProยทGemini 1.5 FlashยทGemini 1.5 FlashยทGemini 1.5 Flash 8BยทGemini 1.0 ProยทGemini 1.5 Pro

Perplexity
5 models
xAI
16 modelsDeepSeek
13 modelsGroq
9 modelsMiniMax
4 modelsQwen
29 modelsQwen 3.5 397B A17BยทQwen3 MaxยทQwen3 VL 235B A22B InstructยทQwen3 VL 235B A22B ThinkingยทQwen3 VL 30B A3B InstructยทQwen3 VL 30B A3B ThinkingยทQwen3 VL 4B InstructยทQwen3 VL 4B ThinkingยทQwen3 VL 8B InstructยทQwen3 VL 8B ThinkingยทQwen3-Next-80B-A3B-InstructยทQwen3-Next-80B-A3B-ThinkingยทQwen Plus LatestยทQwen3-235B-A22B-Thinking-2507ยทQwen3-235B-A22B-Instruct-2507ยทQwen 3 14BยทQwen 3 235B A22BยทQwen 3 30B A3BยทQwen 3 32BยทQwen 3 8BยทQwen3-CoderยทQwQ-32B-PreviewยทQwen 2.5 72B InstructยทQwen2.5 7B InstructยทQwen2.5-Coder 32B InstructยทQwen 3 4BยทQwen Max LatestยทQwen QwQ PlusยทQwen Turbo Latest
01.ai
1 modelsAI21 Labs
2 modelsAmazon
10 modelsAnyscale
2 modelsBaidu
1 modelsCerebras
5 modelsCohere
4 modelsDeepInfra
6 modelsFireworks
10 modelsHyperbolic
4 modelsIBM
1 modelsIBM Watsonx
6 modelsInception
1 modelsLG AI Research
1 modelsMeituan
4 modelsMeta
13 modelsMicrosoft
3 modelsMistral
32 modelsMin istral 3 (3B Reasoning 2512)ยทMinistral 3 (14B Reasoning 2512)ยทMinistral 3 (8B Reasoning 2512)ยทMistral Large 3 (675B Instruct 2512)ยทMistral Large 3ยทCodestralยทDevstral Small 1.1ยทDevstral MediumยทMagistral MediumยทMistral Small 3.1ยทMistral Small 3.1 24B BaseยทMistral Small 3 24B InstructยทMistral Large 2411ยทPixtral Large 2411ยทPixtral LargeยทMinistral 8B InstructยทMistral SmallยทPixtral-12BยทMistral Large 2ยทMistral NeMo InstructยทMistral LargeยทMistral 7B InstructยทMagistral SmallยทMistral CodestralยทMistral DevstralยทMistral Devstral 2ยทMistral Devstral Small 2ยทMistral Medium 3ยทMistral Ministral 3BยทMistral Ministral 8BยทMistral NemoยทMistral Nemo 2407
Moonshot AI
5 modelsNebius AI Studio
5 modelsNous Research
1 modelsNVIDIA
1 modelsReka
3 models