返回顶部

返回首页

会员充值

o1在广泛的基准测试中优于GPT-4o，包括54/57MMLU子类别

2024-09-19 08:15:58

464

o1在广泛的基准测试中优于GPT-4o，包括54/57MMLU子类别

相关数据

代表性模型MMLU-Pro得分（%）

代表性模型MMLU-Pro得分（%）

2026-06-26 08:15:33

0

原图定位

OpenAI采取高频快速迭代策略，2025年全年推出o3、GPT-4.5、GPT-5、GPT-5.1、GPT-5.2等重大

OpenAI采取高频快速迭代策略，2025年全年推出o3、GPT-4.5、GPT-5、GPT-5.1、GPT-5.2等重大

2026-04-29 08:15:58

18

原图定位

2022–2024年在MMLU的评估中得分超过60%

2022–2024年在MMLU的评估中得分超过60%

2026-01-14 13:51:52

58

原图定位

图10、GPT-5在AIME2025测试中得分位居第一

图10、GPT-5在AIME2025测试中得分位居第一

2025-12-30 13:46:54

99

原图定位

图表52022-2024年在MMLU(大规模多任务语言理解)中得分超过60%的最小型人工智能模型参数数量变化

图表52022-2024年在MMLU(大规模多任务语言理解)中得分超过60%的最小型人工智能模型参数数量变化

2025-11-20 13:41:56

122

原图定位

以GPT-5年化运营为例，估算单一LLM模型对于DRAM/NAND新增需求规模

以GPT-5年化运营为例，估算单一LLM模型对于DRAM/NAND新增需求规模

2025-11-20 13:41:56

171

原图定位

KimiK2Thinking与GPT-5（High）、ClaudeSonnet4.5（Thinking）在多项

KimiK2Thinking与GPT-5（High）、ClaudeSonnet4.5（Thinking）在多项

2025-11-19 13:52:27

155

原图定位

GPT1-4模型规模对比

GPT1-4模型规模对比

2025-11-13 13:48:53

192

原图定位

GPT-5在AIME2025测试中无需工具即

GPT-5在AIME2025测试中无需工具即

2025-11-04 13:39:11

189

原图定位

KimiK2在主流基准测试（MMLU、MATH、HumanEval等）上表现出色

KimiK2在主流基准测试（MMLU、MATH、HumanEval等）上表现出色

2025-08-13 13:46:07

191

原图定位

深信服安全GPT模型

深信服安全GPT模型

2025-08-01 13:38:39

251

原图定位

奇安信QAX-GPT安全大模型

奇安信QAX-GPT安全大模型

2025-08-01 13:38:39

235

原图定位

GPT-4o生成模型与DeepSeek-R1对比

GPT-4o生成模型与DeepSeek-R1对比

2025-06-23 13:41:09

475

原图定位

DeepSeekV3在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩

DeepSeekV3在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩

2025-04-14 13:45:21

483

原图定位

豆包模型与GPT-4o技术对比

豆包模型与GPT-4o技术对比

2025-04-07 15:40:58

415

原图定位

最新数据

全球全年龄段奶粉市场规模（亿美元）

全球全年龄段奶粉市场规模（亿美元）

2026-07-30 13:41:18

1

原图定位

全球酸奶及发酵乳制品市场规模（亿美元）

全球酸奶及发酵乳制品市场规模（亿美元）

2026-07-30 08:15:57

0

原图定位

全球药用级益生菌市场规模（百万美元）

全球药用级益生菌市场规模（百万美元）

2026-07-30 08:15:57

0

原图定位

全球益生菌膳食补充剂市场规模及增速

全球益生菌膳食补充剂市场规模及增速

2026-07-30 08:15:57

0

原图定位

全球拥有AKK专利菌株的核心企业

全球拥有AKK专利菌株的核心企业

2026-07-30 08:15:57

0

原图定位

相关数据最新数据