专注于分享
分享好资源

高质量发展调研行丨认知大模型:从越大越好,走向通用大模型和子模型协同联动

科技日报记者 刘园园 崔爽

今年以来,ChatGPT的爆火引发人们对中国版预训练大模型的期待。5月初,知名人工智能企业科大讯飞正式发布讯飞星火认知大模型,备受社会各界关注。

5月30日,跟随“高质量发展调研行”主题采访活动,科技日报记者走进科大讯飞,听科大讯飞副总裁、研究院院长刘聪解读讯飞星火认知大模型背后的核心技术。

高质量发展调研行丨认知大模型:从越大越好,走向通用大模型和子模型协同联动

“高质量发展调研行”主题采访活动走进科大讯飞。受访者供图

刘聪介绍,讯飞星火拥有7大核心能力:多风格多任务长文本生成能力,多层次跨语种语言理解能力,泛领域开放式知识问答能力,情境式思维链逻辑推理能力,多题型可解析数学能力,多功能多语言代码能力,多模态输入和表达能力不断丰富。

“中美之间算力存在差距,我们持续研究更好的算法,以实现相对接近乃至部分领域超越的效果。”对于科大讯飞在认知大模型算力方面的投入,刘聪表示,科大讯飞已建成4城7中心AI云平台,同时与具有国产算力能力的代表企业建立深度合作,持续完善算力生态体系。

刘聪还谈道,认知大模型技术趋势从“通用大模型规模越大越好”向“通用大模型和子模型协同联动”转变,讯飞星火从项目启动第一天开始就决定推动通用大模型(即“1”)和行业落地成果(即“N”)齐头并进。而且,科大讯飞在教育、医疗、城市等垂直赛道深耕多年,在多领域场景应用上有比较优势。