卢力媛 科技日报记者 王春
这两天,在上海世博展览馆内人头攒动,数字人主播、聊天机器人、AI明信片、AI作画写诗生成视频……这些应用让人们真切感受到了人工智能技术正逐步渗透进我们的生活。“帮我做一份去云南旅行的攻略”“帮我写一首夸夸老婆的诗”“给我冲杯咖啡”……展馆内,人们对展台的各种应用提出各式各样的要求并且都得到了人工智能的准确回应,人与人工智能的互动多元起来也更加顺畅了。
商汤科技展台前人们正在体验大模型应用。科技日报记者 王春 摄
7月6日-8日世界人工智能大会(WAIC)举办期间,大模型相关话题无疑是本届大会最热的焦点。展示的国内外大模型多达30余款,基础应用大模型垂直领域的顶尖产品几乎悉数到场。为此,华为轮值董事长胡厚崑不禁感慨,今年大会与往届相比,最大的不同就是ChatGPT的出现,把人工智能推到了一个新的风口。
大模型加速人工智能产业应用
在今年WAIC大会上,生成式AI成为各家互联网科技公司竞逐的新领域。“在星火大模型加持下,讯飞AI学习机像老师一样批改作文,进行实景对话,像口语老师一样陪练,并进行实时口语纠错……”在科大讯飞展台,工作人员展示着讯飞星火大模型在教育场景的应用成果。“讯飞正依托自主可控的大模型训练基座,推动大模型持续进化,让大模型赋能千行百业。”科大讯飞相关负责人表示。
今年3月,作为国内AI领域的代表企业之一,百度发布大语言模型“文心一言”,成为我国首个类ChatGPT产品。在此次人工智能大会上,百度带来了与文心一言同款的AIGC大模型文心一格既能为画师、设计师等视觉内容创作者启发灵感,辅助艺术创作,又能为媒体、作者等文字内容创作者提供高质量、高效率的配图,被作为本届大会的“九大镇馆之宝”之一。
业界首个AI蛋白质生成大模型“达尔文”7月7日在WAIC上正式亮相。该大模型通过学习千亿级多模态大数据,可实现多模态定向生成,单模型就能满足序列生成、结构预测、功能预测、从头设计等蛋白质生成全流程需求,解决产业应用所需的特定功能蛋白质生成难题,并在真实的产业环境中评估效果与价值。该模型研发领军人,清华大学智能产业研究院卓越访问教授、分子之心创始人许锦波表示,AI蛋白质生成大模型瞄准创新药设计、合成生物学等真实产业应用需求,将用一个模型满足蛋白质生成全流程需求,未来大分子药、新生物材料等蛋白质设计可实现“一键定制”。
百度展台前人们正在体验大模型应用。科技日报记者 王春 摄
随着国内“百模大战”的涌现,垂直行业大模型也会面临更严峻的竞争。会上,蜜度发布了首个支持国产化软硬件运行环境的知识问答与内容生成大语言模型——蜜巢。据介绍,该模型以数千亿高质量中文多模态数据训练为基础打造,不仅能够实现“千文千面,千人千面”的定制化内容生成,同时基于华为昇腾昇思AI生态,打造政府与企业的“专属”大模型。
“通用大模型的研究,是为了让不具备模型构建能力的企业能够享受到大模型带来的便利,更适合实力更强的头部企业去做,行业龙头公司则更适合去聚焦行业,去做垂直行业大模型。”蜜度首席技术官刘益东表示,目前,蜜巢系列行业大模型已逐步尝试部署在政务、媒体等内容生产强需求场景当中。
发展大模型还需夯实底层基础
百“模”共生,百家争鸣下,人工智能产业需要一步一个脚印、踏踏实实发展,夯实底层基础。
WAIC大会上,百度、华为、阿里等企业被工信部中国电子技术标准化研究院授予“国家人工智能标准化总体组大模型专题组”组长单位,积极推动大模型国家标准体系建设,助力中国大模型产业发展。
7月7日WAIC大会期间,阿里巴巴、商汤科技都推出了最新的大模型版本。阿里云公布了新的AI绘画创作大模型通义万相,将大模型的模态从文本和语音延伸到图像,逐步向多模态模型靠近。该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。
据悉,通义万相是阿里在大模型领域苦练内功多年的产物,其基于阿里研发的组合式生成模型Composer。在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相,在此之后,通义千问、通义听悟等模型和产品相继推出。目前,阿里云大模型正逐步走向千行百业,已有超过30万企业申请测试通义千问,通义听悟累计用户数达到36万。“多模态是大模型演进的必然路径,我们希望用不同模态的能力服务千行百业,帮助企业全面拥抱智能化时代。”阿里云智能集团CTO周靖人表示。
阿里云AI绘画创作大模型通义万相亮相。(大会主办方供图)
商汤科技也在WAIC上升级了“商汤日日新SenseNova”大模型,不仅在模型参数方面有了很大的提升,而且多模态能力也有了进一步突破。商汤表示,希望通过“大模型+大装置”推动AI基础设施能力的跃进提升。
大模型的突破掀起了人工智能的新一轮技术革命,随之而来的是产业需求呈现爆炸式增长,全新的应用场景和应用模式正迅速涌现。商汤科技董事长兼CEO徐立在人工智能论坛上表示:“商汤不仅要打造通用能力更加强大的基础模型,也将进一步高效融合不同垂直领域的专业知识,构建更懂行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛。”