华为盘古大模型3.0凭什么竞逐“百模大战”

正文

2023/7/11 14:30:57
类型：原创
来源：电脑报
报纸编辑：吴新
作者：

【电脑报在线】“百模大战”的江湖，又怎能少得了华为，开天辟地的“盘古”这一次能否创造奇迹？

不做中国版ChatGPT的华为盘古

“盘古大模型不作诗，只做事。”日前，华为常务董事、华为云CEO张平安在华为开发者大会2023上再次明确了华为在大模型领域的定位，不做“ChatGPT”类产品。他表示，盘古大模型3.0是一个完全面向行业提供服务，以行业需求为基础设计的大模型体系。

在上述开发者大会中，华为认为，大模型正在引领新一轮人机革命，为用户带来颠覆式使用体验。如果说在PC时代，“鼠标+图形用户界面”开启了第一次交互革命；“触屏+手势”开启了移动互联时代，而“对话+5G”则开启了智能互联时代，标志就是以ChatGPT为代表的大模型技术。

2015年12月，硅谷的企业家们开启了OpenAI的引擎，ChatGPT计划也在这个时候开始酝酿。而在前一年，谷歌已经收购了DeepMind，并且依靠DeepMind团队研发的AlphaGo在全球掀起了一场AI风暴。

随后，谷歌在2017年发布了Transformer大模型，成为了AI大模型的新分水岭。但令谷歌没有想到的是，Transformer随后却成为了OpenAI滋养ChatGPT的土壤。

OpenAI火爆之后，也激发了科技巨头对大模型的军备竞赛。今年3月，百度发布了文心一言，并开始将其融入百度的所有业务；4月，阿里发布了通义千问，并于6月将大模型的布局拓展至AI音视频赛道。据不完全统计，当前仅国内已发布超过80个大模型产品，对应不同行业、不同应用场景，“百模大战”发展如火如荼。

在经历半年多的“狂飙”后，即便是曾经爆火的ChatGPT流量也不再继续。当C端热度逐渐褪去，产业界的噪音开始多了起来：仅凭聊天作画等功能，大模型就可以重构人类社会？人工智能的下一步该如何发展？

华为盘古大模型3.0的出现，为大模型的落地应用勾勒出一幅全新的版图。

“只会做事”的华为盘古大模型3.0

根据华为方面的介绍，盘古大模型3.0是一个面向行业的大模型系列，包括“5+N+X”三层架构。

其中，L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型，提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型，匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。

同时提供全新能力集，包括NLP大模型的知识问答、文案生成、代码生成，以及多模态大模型的图像生成、图像理解等能力，这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型，盘古都提供一致的能力集。

L1层是N个行业大模型，华为云既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等大模型；也可以基于行业客户的自有数据，在盘古大模型的L0和L1层上，为客户训练自己的专有大模型。

L2层为客户提供了更多细化场景的模型，更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景，为客户提供“开箱即用”的模型服务。

盘古大模型采用完全的分层解耦设计，可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集，也可以单独升级基础模型，也可以单独升级能力集。在L0和L1大模型的基础上，华为云还为客户提供了大模型行业开发套件，通过对客户自有数据的二次训练，客户就可以拥有自己的专属行业大模型。同时，根据客户不同的数据安全与合规诉求，盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

大模型如何从概念走向落地？

在从目前全球市场的竞争格局来看，3000多个可用的生成式AI应用，全球数千家科技公司参与。大模型的一路“狂飙”下，企业需更加明确应用落地的方向才有可能在这场硬仗中突围。

张平安表示，“目前大模型大多数应用都集中在2C领域，在面向行业应用时，由于行业数据获取难，技术与行业know-how结合难，大模型在行业的落地进展较慢。”

而华为选择的突破口一个是放大来自于人工智能芯片的算力优势，另一个则是在多个场景中进行大模型的深耕。

华为昇腾计算业务总裁张迪煊在接受记者采访时表示，华为目前已经帮助孵化了20多个基础大模型，比如科大讯飞的星火大模型，“中国大模型中约一半由昇腾AI支撑”，这恐怕也是华为盘古大模型3.0竞逐“百模大战”的底气。

加速百“模”大战

业内预期，盘古3.0强势登场将进一步搅动大模型市场。

当下，大模型已成为科技赛道最热门的投资方向，不仅二级市场大模型概念股不时异动，科技巨头们也动作频频，大力投入大模型研发，并积极推进基于模型的应用。此外，有关大模型赛道融资的消息更是不断传来。

当前，华为的盘古大模型已在金融、制造、医药研发、煤矿、铁路等诸多行业发挥价值。今年，阿里云相继发布了AI大模型通义千问、面向AI音视频赛道的“通义听悟”，AI绘画创作大模型“通义万相”也已开启定向邀测。此外，阿里云正与大批头部企业联合打造专属大模型。

各大科技巨头也在积极推进各自的大模型生态建设。阿里积极向大模型创业公司提供全方位的服务，包括智能算力和开发工具，并在资金和商业化探索方面提供充分支持。6月19日，北京生数科技有限公司宣布完成近亿元的天使轮融资，由蚂蚁集团领投，百度发起的BV百度风投、卓源资本跟投，本轮资金将主要用于加速多模态大模型和应用产品的研发。

作为人工智能的重要方向，大模型风起云涌，为人工智能的发展按下“快进键”，随着华为盘古大模型3.0的出现，AI落地有望迎来新一轮的提速。

编辑｜张毅

审核｜吴新

本文出自2023-07-10出版的《电脑报》2023年第27期 A.新闻周刊
(网站编辑：ChengJY)

读者活动

48小时点击排行

编辑推荐

华为盘古大模型3.0凭什么竞逐“百模大战”

论坛热帖