继DeepSeek之后，又一国产大模型杀入全球前十！

2025-02-13 12:21:12 来源: 中国科技网作者:

继DeepSeek以“十分之一成本挑战GPT-4”震动AI界后，又一国产力量强势突围。中国科学院自动化所孵化企业中科闻歌发布的雅意大模型旗舰版YAYI-Ultra，在全球权威评测体系OpenCompass最新榜单中以64.5分位列第十，成为TOP10中五个中国大模型之一。这标志着我国在AI大模型领域实现从“跟跑”到“并跑”的关键跨越。

OpenCompass榜单显示，YAYI-Ultra在代码生成（LiveCodeBench第五）、复杂指令理解（IFEval第九）、知识推理（MMLU-Pro第九）等核心能力上超越GPT-4o-20241120版本。尤其在中文理解领域，该模型在C-Eval公开访问榜单摘得亚军，展现本土化技术优势。

“我们通过混合专家架构破解了‘精度-能耗’的戈耳狄俄斯之结。”中科闻歌技术团队透露，YAYI-Ultra采用动态专家配置系统，支持数学、金融、医疗等七大领域智能体组合，相比传统稠密模型，垂直场景能效比提升超40%。

通过六大维度实测验证其技术突破：跨语言图表解析：面对中英文混杂的柱状图、堆积条形图，模型精准识别2000年前后物业费占比最大变动区间，农业就业分布变化计算误差率低于0.8%。不规则表格智解：在包含嵌套结构的行业报告统计中，准确提取三类报告数量；面对总分式复杂表格，成功定位IKE方法导致局部性下降最多的基座模型。智能任务规划：在“绘制巴黎奥运会中国奖牌变化折线图”测试中，模型自动调用搜索引擎获取数据，通过代码解释器完成可视化，全流程响应时间仅2分17秒。20万字长文创作：支持文献锚定与联网智能双模式，生成3万字《儒家文化发展史》时，采用“大纲-章节-润色”三级拆解架构，结构完整度达专业学术论文水准。多模态交互：在人工智能论文解析测试中，模型同步输出文字结论与原始配图，实现“答案-溯源”双重验证。动态数据分析：面对人均收入统计需求，自主编写Python代码完成矩阵运算，生成可视化柱形图的数值误差控制在±0.3%以内。

在IDC报告揭示92%企业受困算力瓶颈的背景下，YAYI-Ultra已形成特色落地路径：媒体领域：红旗3.0融媒体平台将内容创作耗时缩短50%，某央媒差错率从5%骤降至0.5%医疗领域：大医金匮中医大模型辨证准确率达94%，覆盖500余种常见病症财税领域：7×24小时智能咨询使排队时间减半，回答准确率90.1%领跑行业

目前YAYI-Ultra已开放数据分析、超长文写作等核心功能体验。中科闻歌CTO表示，团队正研发“专家网络联邦学习”架构，计划年内将模型上下文窗口扩展至百万token级，攻克法律文书、基因分析等长链条专业场景。

这场国产大模型的“双子星突破”，不仅改写了全球AI竞赛的势力版图，更揭示了通向AGI的差异化路径——当西方巨头执着于参数竞赛时，中国智慧正在精度、能耗与场景落地的三维空间开辟新大陆。

责任编辑：

继DeepSeek之后，又一国产大模型杀入全球前十！

友情链接