专注于分享
分享好资源

大数据大算力推动人工智能走向大模型时代

<script src="http://tv.people.com.cn/img/player/v.js"></script><script>showPlayer;</script>

从日常生活中人脸识别的广泛应用,到街上行驶的无人驾驶汽车,再到工厂内相互配合的机器人……类似的智能场景在生产生活中并不少见。作为数字经济时代的重要基础设施、关键技术、先导产业以及赋能引擎,人工智能已在自动驾驶、智慧城市等领域广泛应用,成为改善生活质量、推动产业优化升级的重要驱动力。

近日,行业专家和企业代表做客人民网《人民会客厅》视频访谈栏目时表示,大数据、大算力推动了人工智能发展走向大模型时代,要加快人工智能技术创新,建设开源开放生态,降低模型应用成本,拓展人工智能应用场景,推动数字经济和实体经济融合发展,为经济社会高质量发展注入智慧动能。

大数据大算力推动人工智能走向大模型时代

北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军黄铁军,清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松和阿里云智能首席技术官周靖人做客人民网《人民会客厅》视频访谈栏目。

大数据大模型大算力推动人工智能发展

“经过十几年年发展,当前人工智能已发展到大模型时代,出现现象级的AI产品并不奇怪。”北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军表示,大模型是一个智能载体,智能来自于海量的数据。计算机具有超强算力,能够从海量的数据中提炼出智能模型。加上人工智能算法的进步,使得能够训练出智能水平比较高的模型。

“出现自然语言生成的AI产品根本原因在于:大数据、大模型、大算力发生了‘化学反应’。在这其中,自然语言发挥了重要作用。”清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松认为,通过计算的手段可以把人类语言以一种可计算的数字方式建立联系,让其相互作用,从而产生更加复杂的行为,这就产生了一系列AI产品。而AIGC降低了制作成本和准入门槛,提高了生产效率和产品质量,提升了产品的多样性和个性化。

“当前,整个数据以非常丰富的形态存在,既有文本数据,也有多媒体数据,数据的体量也在以指数级的规模不断发展。”阿里云智能首席技术官周靖人进一步解释说,云计算有了长足发展,不仅是单台服务器的计算能力突飞猛进,而且可以把成千上万的服务器有效地连接起来,组成一个超级计算机,为模型的发展提供了坚实基础。此外,模型本身越来越复杂,一定程度上能捕捉很多知识细节;模型训练的范式也发生了变化,可以通过自监督学习的方式,从海量数据里自动进行数据标注,为人工智能在更多场景的应用发展提供了可能性。

“大模型在一定程度上代表着近似于人类的智能体,本身具有强大的记忆能力,可以让知识有效地存储起来,同时具备一定的推理、延展、创造能力,让基于大模型的深层应用变得更加丰富、有力。”周靖人说。

共建开源开放生态让人工智能更普惠

近年来,我国人工智能产业在技术创新、产业生态、融合应用等方面取得了积极进展。中国信通院测算,2022年我国人工智能核心产业规模达5080亿元,同比增长18%。

“从长远来看,大模型是从海量的数据里抽取、凝练出的模型,以智力的方式给千家万户提供服务。”黄铁军强调,未来智能时代,整个社会构造是一套智力基础设施,成千上万的企业在不同的环节给公众提供服务。构造这样的基础设施和智力服务,需要多方共同努力,建设开源、开放的大模型技术体系,让更多人的聪明才智以开放的方式汇聚在一起,推动智能社会更快到来。

孙茂松也认为,大模型实际上是通过语言把世界上所有的文本信息以及图像信息、多模态信息等融通起来。这可以说是大模型的极限,也是未来智能信息处理的极限,要构建一个智能信息处理的基础设施。

“超大规模模型实际上是AI+云计算的技术表征。也就是说,所有的大模型离不开基础设施,特别是云计算这样的计算能力,能够帮助我们对模型进行训练。”周靖人介绍,阿里云有自己研发的超大规模的云计算操作系统,即飞天云操作系统。该系统能够将遍布全球的百万级服务器连成一台超级计算机,通过在线公共服务的方式,为社会提供计算能力。通过这一系统来实现大规模集群调度,发挥云计算的可扩展和低成本优势,成为支撑大模型运行的必要条件,让云计算为AI算力创新发展奠定了坚实的基础。

“2022年,达摩院把所有的大模型汇集在一起,对外发布了‘通义’的大模型系列。”周靖人说,将所有大模型汇聚在一起,能够形成多模态训练的新范式,提供统一的训练的框架,更重要的是把这些模型能够分享给大家,让各行各业在上面进行创造和二次开发,逐渐建立起整个模型生态。

值得一提的是,人工智能的发展离不开人才培养。“当前,在人工智能领域,我国跟跑能力很强,领跑能力比较弱,顶尖人才培养是短板。”孙茂松认为,我国培养了大量的人工智能人才,支撑了大学、科研院所、企业人工智能的发展,有能力在重大应用场景方面取得突破,但人工智能领域的重大创新,可能涉及到多学科交叉,要进一步提高学术视野,培养交叉学科合作的意识。

人工智能赋能经济社会高质量发展

近年来,数字经济领跑作用不断显现,成为稳增长、促转型的重要引擎。数据显示,我国的数字经济发展势头强劲——过去五年我国高技术制造业、装备制造业增加值年均分别增长10.6%、7.9%,数字经济不断壮大,新产业新业态新模式增加值占国内生产总值的比重达到17%以上。

今年的政府工作报告提出,要大力发展数字经济,提升常态化监管水平,支持平台经济发展。可以预见,作为数字经济时代的重要基础设施、关键技术、先导产业以及赋能引擎,人工智能将在“十四五”期间为我国产业转型升级和数字经济发展提供核心驱动力。

“数字经济与实体经济融合发展,要从更长远的角度来看待。”黄铁军说,数字经济是建立在大数据、AI等新技术基础之上的,让全社会各要素能够简单地使用智力来驱动。从这个意义上讲,数字经济是未来智能时代的一个形态。

周靖人认为,推动我国AI创新发展,一是要在基础设施上提供相应的算力支持,能够提供更大规模的公共服务算力平台,为我国AI快速发展奠定基础。二是模型生态建设上要有开源共享的目标,不仅要关注基础模型,每一个行业相关模型的探索,包括人工智能一系列应用,对我国AI发展也发挥着重要的作用。三是要降低AI使用门槛,降低模型应用成本,让各行各业的人将人工智能应用到实际场景中,真正让AI做到普惠、创新发展。

“大模型和AIGC实际上为数字经济开创了无限的可能性。借助于计算机对所有信息、文本信息、图像信息进行理解和信息处理,深度和广度比以前有一个质的提升。目前,要把可能性落实到现实性比较困难,要打破数据间的行业壁垒,在符合国家法律法规的前提下,共享、利用、开发好数据。”孙茂松认为,我国拥有全球最齐全的产业体系和超大规模的消费市场,丰富繁多的应用场景为人工智能提供了巨大的用武之地,给各类企业带来了很多机遇,也为个人发展带来了很多空间。

嘉宾们认为,以技术突破和应用拓展为主攻方向,依托我国超大规模市场优势吸引全球资源要素,我国人工智能产业正在与实体经济深度融合,成为经济社会发展新的增长引擎。