继DeepSeek之后,又一国产大模型杀入全球前十!

2025-02-13 12:21:12 来源: 中国科技网 作者:

继DeepSeek以“十分之一成本挑战GPT-4”震动AI界后,又一国产力量强势突围。中国科学院自动化所孵化企业中科闻歌发布的雅意大模型旗舰版YAYI-Ultra,在全球权威评测体系OpenCompass最新榜单中以64.5分位列第十,成为TOP10中五个中国大模型之一。这标志着我国在AI大模型领域实现从“跟跑”到“并跑”的关键跨越。

OpenCompass榜单显示,YAYI-Ultra在代码生成(LiveCodeBench第五)、复杂指令理解(IFEval第九)、知识推理(MMLU-Pro第九)等核心能力上超越GPT-4o-20241120版本。尤其在中文理解领域,该模型在C-Eval公开访问榜单摘得亚军,展现本土化技术优势。

“我们通过混合专家架构破解了‘精度-能耗’的戈耳狄俄斯之结。”中科闻歌技术团队透露,YAYI-Ultra采用动态专家配置系统,支持数学、金融、医疗等七大领域智能体组合,相比传统稠密模型,垂直场景能效比提升超40%。

通过六大维度实测验证其技术突破:跨语言图表解析:面对中英文混杂的柱状图、堆积条形图,模型精准识别2000年前后物业费占比最大变动区间,农业就业分布变化计算误差率低于0.8%。不规则表格智解:在包含嵌套结构的行业报告统计中,准确提取三类报告数量;面对总分式复杂表格,成功定位IKE方法导致局部性下降最多的基座模型。智能任务规划:在“绘制巴黎奥运会中国奖牌变化折线图”测试中,模型自动调用搜索引擎获取数据,通过代码解释器完成可视化,全流程响应时间仅2分17秒。20万字长文创作:支持文献锚定与联网智能双模式,生成3万字《儒家文化发展史》时,采用“大纲-章节-润色”三级拆解架构,结构完整度达专业学术论文水准。多模态交互:在人工智能论文解析测试中,模型同步输出文字结论与原始配图,实现“答案-溯源”双重验证。动态数据分析:面对人均收入统计需求,自主编写Python代码完成矩阵运算,生成可视化柱形图的数值误差控制在±0.3%以内。

在IDC报告揭示92%企业受困算力瓶颈的背景下,YAYI-Ultra已形成特色落地路径:媒体领域:红旗3.0融媒体平台将内容创作耗时缩短50%,某央媒差错率从5%骤降至0.5%医疗领域:大医金匮中医大模型辨证准确率达94%,覆盖500余种常见病症财税领域:7×24小时智能咨询使排队时间减半,回答准确率90.1%领跑行业

目前YAYI-Ultra已开放数据分析、超长文写作等核心功能体验。中科闻歌CTO表示,团队正研发“专家网络联邦学习”架构,计划年内将模型上下文窗口扩展至百万token级,攻克法律文书、基因分析等长链条专业场景。

这场国产大模型的“双子星突破”,不仅改写了全球AI竞赛的势力版图,更揭示了通向AGI的差异化路径——当西方巨头执着于参数竞赛时,中国智慧正在精度、能耗与场景落地的三维空间开辟新大陆。

责任编辑: