当前位置:首页 > 新闻资讯 > IT业界 > 新闻
华为盘古大模型3.0凭什么竞逐“百模大战”
  • 2023/7/11 14:30:57
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:吴新
  • 作者:
【电脑报在线】“百模大战”的江湖,又怎能少得了华为,开天辟地的“盘古”这一次能否创造奇迹?

01

不做中国版ChatGPT的华为盘古

“盘古大模型不作诗,只做事。”日前,华为常务董事、华为云CEO张平安在华为开发者大会2023上再次明确了华为在大模型领域的定位,不做“ChatGPT”类产品。他表示,盘古大模型3.0是一个完全面向行业提供服务,以行业需求为基础设计的大模型体系。

在上述开发者大会中,华为认为,大模型正在引领新一轮人机革命,为用户带来颠覆式使用体验。如果说在PC时代,“鼠标+图形用户界面”开启了第一次交互革命;“触屏+手势”开启了移动互联时代,而“对话+5G”则开启了智能互联时代,标志就是以ChatGPT为代表的大模型技术。

2015年12月,硅谷的企业家们开启了OpenAI的引擎,ChatGPT计划也在这个时候开始酝酿。而在前一年,谷歌已经收购了DeepMind,并且依靠DeepMind团队研发的AlphaGo在全球掀起了一场AI风暴。

随后,谷歌在2017年发布了Transformer大模型,成为了AI大模型的新分水岭。但令谷歌没有想到的是,Transformer随后却成为了OpenAI滋养ChatGPT的土壤。

OpenAI火爆之后,也激发了科技巨头对大模型的军备竞赛。今年3月,百度发布了文心一言,并开始将其融入百度的所有业务;4月,阿里发布了通义千问,并于6月将大模型的布局拓展至AI音视频赛道。据不完全统计,当前仅国内已发布超过80个大模型产品,对应不同行业、不同应用场景,“百模大战”发展如火如荼。

在经历半年多的“狂飙”后,即便是曾经爆火的ChatGPT流量也不再继续。当C端热度逐渐褪去,产业界的噪音开始多了起来:仅凭聊天作画等功能,大模型就可以重构人类社会?人工智能的下一步该如何发展?

华为盘古大模型3.0的出现,为大模型的落地应用勾勒出一幅全新的版图。

02

“只会做事”的华为盘古大模型3.0

根据华为方面的介绍,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。

其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。

同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古都提供一致的能力集。

L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。

L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。

盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

03

大模型如何从概念走向落地?

在从目前全球市场的竞争格局来看,3000多个可用的生成式AI应用,全球数千家科技公司参与。大模型的一路“狂飙”下,企业需更加明确应用落地的方向才有可能在这场硬仗中突围。

张平安表示,“目前大模型大多数应用都集中在2C领域,在面向行业应用时,由于行业数据获取难,技术与行业know-how结合难,大模型在行业的落地进展较慢。”

而华为选择的突破口一个是放大来自于人工智能芯片的算力优势,另一个则是在多个场景中进行大模型的深耕。

华为昇腾计算业务总裁张迪煊在接受记者采访时表示,华为目前已经帮助孵化了20多个基础大模型,比如科大讯飞的星火大模型,“中国大模型中约一半由昇腾AI支撑”,这恐怕也是华为盘古大模型3.0竞逐“百模大战”的底气。

04

加速百“模”大战

业内预期,盘古3.0强势登场将进一步搅动大模型市场。

当下,大模型已成为科技赛道最热门的投资方向,不仅二级市场大模型概念股不时异动,科技巨头们也动作频频,大力投入大模型研发,并积极推进基于模型的应用。此外,有关大模型赛道融资的消息更是不断传来。

当前,华为的盘古大模型已在金融、制造、医药研发、煤矿、铁路等诸多行业发挥价值。今年,阿里云相继发布了AI大模型通义千问、面向AI音视频赛道的“通义听悟”,AI绘画创作大模型“通义万相”也已开启定向邀测。此外,阿里云正与大批头部企业联合打造专属大模型。

各大科技巨头也在积极推进各自的大模型生态建设。阿里积极向大模型创业公司提供全方位的服务,包括智能算力和开发工具,并在资金和商业化探索方面提供充分支持。6月19日,北京生数科技有限公司宣布完成近亿元的天使轮融资,由蚂蚁集团领投,百度发起的BV百度风投、卓源资本跟投,本轮资金将主要用于加速多模态大模型和应用产品的研发。

作为人工智能的重要方向,大模型风起云涌,为人工智能的发展按下“快进键”,随着华为盘古大模型3.0的出现,AI落地有望迎来新一轮的提速。

编辑|张毅
审核|吴新
本文出自2023-07-10出版的《电脑报》2023年第27期 A.新闻周刊
(网站编辑:ChengJY)