中美顶级AI模型差距已缩小至0.3%
人工智能(AI)的影响从未像现在这样深入社会。斯坦福大学的人工智能研究机构(Stanford HAI)4月8日发布《2025年人工智能指数报告》认为,推理成本暴降280倍,小模型性能飙升,AI正变得更高效、更普惠。
报告还指出,中国高性能AI模型的数量和质量不断提升,对美国的领先地位构成挑战,顶级模型之间的性能差距正在缩小。
美国此前在模型质量方面的领先优势已经消失。中国是人工智能出版物和专利产出最多的国家,如今其开发的模型在性能上已经与美国的竞争对手不相上下。
“2023年,在大规模多任务语言理解测试(MMLU)中,中国领先的模型落后于美国顶级模型近20个百分点。然而,到2024年底,美国的领先优势缩小到了0.3个百分点。”
最新的斯坦福HAI博文中,浓缩了2025年AI指数报告的十二大亮点。
2023年,研究人员推出了新的基准测试,如MMMU、GPQA和SWE-bench,以测试先进AI系统的极限。
仅一年后,性能便急剧提升:在MMMU、GPQA和SWE-bench上的得分分别提高了18.8、48.9和67.3个百分点。除了基准测试之外,AI系统在生成高质量视频方面也取得了重大进展,在某些情况下,语言模型代理甚至在编程任务中超越了人类,尽管时间预算有限。
从医疗保健到交通运输,AI正迅速从实验室走向日常生活。
2023年,美国食品药品监督管理局(FDA)批准了223款AI医疗设备,而2015年仅有6款。
在道路上,自动驾驶汽车不再是实验:Waymo每周提供超过15万次自动驾驶服务,而百度的Apollo Go无人驾驶出租车队现已服务于中国多个城市。
审忆,审忆媒体,头条,批发,地摊,新闻资讯,生活,美食,情感,教育,论坛,科技,汽车,母婴,美妆,时政新闻,国内新闻,国际新闻,社会新闻,时事评论,新闻图片,新闻专题,新闻论坛,军事,历史审忆新闻网
奥罗奇,天下,国际,全球经济,社会万象,娱乐,时尚要闻,文化,军事,视频,科技,营销,职场,管理
爱深炽,服饰,内衣,运动,户外,日用,百货,食品,饮料,母婴,玩具,鞋包,配饰,美妆,日化,数码,家电,汽车,用品,机械,五金,仪表,包装,办公,文教