o1在广泛的基准测试中优于GPT-4o,包括54/57MMLU子类别
2024-09-19 08:15:58
413
相关数据
行业数据1
2022–2024年在MMLU的评估中得分超过60%
2026-01-14 13:51:52
24
原图定位
行业数据1
图10、GPT-5在AIME2025测试中得分位居第一
2025-12-30 13:46:54
49
原图定位
市场规模1
图表52022-2024年在MMLU(大规模多任务语言理解)中得分超过60%的最小型人工智能模型参数数量变化
2025-11-20 13:41:56
72
原图定位
市场规模1
以GPT-5年化运营为例,估算单一LLM模型对于DRAM/NAND新增需求规模
2025-11-20 13:41:56
108
原图定位
行业数据1
KimiK2Thinking与GPT-5(High)、ClaudeSonnet4.5(Thinking)在多项
2025-11-19 13:52:27
89
原图定位
市场规模1
GPT1-4模型规模对比
2025-11-13 13:48:53
108
原图定位
行业数据1
GPT-5在AIME2025测试中无需工具即
2025-11-04 13:39:11
89
原图定位
行业数据1
KimiK2在主流基准测试(MMLU、MATH、HumanEval等)上表现出色
2025-08-13 13:46:07
137
原图定位
行业数据1
奇安信QAX-GPT安全大模型
2025-08-01 13:38:39
168
原图定位
行业数据1
深信服安全GPT模型
2025-08-01 13:38:39
173
原图定位
行业数据1
GPT-4o生成模型与DeepSeek-R1对比
2025-06-23 13:41:09
372
原图定位
行业数据1
DeepSeekV3在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩
2025-04-14 13:45:21
427
原图定位
行业数据1
豆包模型与GPT-4o技术对比
2025-04-07 15:40:58
357
原图定位
行业数据1
GPT-4.5与人类测试者的对比评估情况
2025-04-07 15:40:16
260
原图定位
行业数据1
GPT-4oSimpleQA性能对比情况
2025-04-07 15:40:16
273
原图定位
最新数据
行业数据1
图11 联合国全球数字和可持续贸易便利化调查评分,2025年
2026-04-03 08:30:00
21
原图定位
行业数据1
图10 印度尼西亚针对其前10大出口产品进入美国市场的主要竞争者及其最新的相应关税水平
2026-04-03 08:30:00
23
原图定位
行业数据1
图9 “最坏情况”贸易战对价格的影响,2025 到 2030 年
2026-04-03 08:30:00
16
原图定位
行业数据1
图 8 “最坏情况”贸易战对印度尼西亚前10大农业食品下游需求部门的影响,2025年至2030年
2026-04-03 08:30:00
12
原图定位
行业数据1
图6 印尼对美国的农业出口,2010年至2024年
2026-04-03 08:30:00
14
原图定位
行业数据1
图7 受到美国互惠关税影响最大的五种农业食品产品
2026-04-03 08:30:00
12
原图定位
o1在测试中表现优异,超过了 GPT-4o,是现役最强的超复杂推理大模型。根据 OpenAI公布测试的数据显示,o1 在美国数学奥林匹克预选赛中,排名美国前 500 名学生之列,并且在下一个更新的版本中,o1 在物理、生物学、化学基准上,表现出与博士生类似的水平。也就是说,o1超过了 GPT-4o,是现役最强的超复杂推理大模型。
行业数据
原图定位
相关数据
最新数据