首页 > 快讯为什么大模型在当下集中爆发？

为什么大模型在当下集中爆发？

2023年07月06日 11:50

自3月以来，国内大模型进入“井喷”状态，从互联网巨头到IT企业，从科研机构到科创企业，大家对AI大模型都趋之若鹜，短时间内纷纷推出自有的大模型产品。

▲a&s统计的部分大模型发布情况

根据科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示，我国10亿参数规模以上的大模型已发布79个，几乎进入“百模大战”。

进入到四五月，大模型产品甚至以每日一款的速度扎堆诞生，一些AI、物联网企业还有科技大佬个人在各自的领域开始了新一轮的“跑马圈地”，从功能应用、适用场景以及核心技术优势等方面宣告其大模型的特色和亮点。

为什么大模型会在这个时间节点集中爆发?

ChatGPT的发布像一根引线，一经点燃，便燃起了大模型的熊熊之火，一时之间，玩家纷纷入场，各类大模型疯狂涌现。

为什么大模型会在这个时间节点爆发?

海量参数规模条件催促大模型“涌现”

从纯技术理论的角度看，中国科学院院士陈润生表示，一个复杂系统由很多微小个体构成，这些微小个体凑到一起，相互作用，当数量足够多时，在宏观层面上展现出微观个体无法解释的特殊现象，即为“涌现”。大模型的运算表明，当训练数据很大时(比如超过了1000亿)，就会出现“涌现”现象。

据目前市场已公布的大模型产品来看，10亿参数规模以上的大模型产品已多达80个，其中像百度、腾讯、华为云等企业推出的大模型参数规模均已达千亿已上。

当参数规模达到一定量级的时候，大模型的涌现“现象”便具备了先决条件，这也是当下大模型爆发的一大关键。

以技术驱动变革的产业有着它自己的发展路径，中国电子信息产业发展研究院未来产业研究中心研究员、高级咨询师钟新龙同样认为，由于经过这么多年的积累，特别是信息化数字化的长达10年至20年如此长的时间积累，所以我们相比历史上任何一个时期，都有更多的数据可以用，这是训练大模型成为可能的必备要素。大模型即便放到历史维度中提前的某一个时刻，可能因为数据不够，训练的效果会不太好。

企业间的竞争角逐

大模型的爆发，还跟企业间的竞争意识相关联。

目前已推出大模型产品的企业，无一例外是通用或垂直行业领域头部玩家，这些玩家之间不排除很多企业存在“竞争”心理，人无我有，人有我优的心态也驱动着大厂在大模型赛道你追我赶，推陈出新。

在人工智能领域，几乎所有的研究团队，包括头部企业都在竞争开发最先进的大模型，而且不少头部大模型都开始走向开源开放。这种竞争是一种良性的竞争，它有利于推动技术的发展，也有利于推动技术的共享。

产业认知达成新的共识

底层技术，包括数据、算力、算法的支撑为大模型奠定了必要的条件和基础，而国内大模型在今年开始爆发，还有一大原因在于大家对于AI大模型的应用需求达到新的峰值。无论是用户端还是技术供应端，大家普遍看到了AI技术应用的需求和困境，此前的AI工具普遍存在泛化能力不足，使用成本高企等问题，亟待通用性强、泛化能力强、能够便捷使用的新的AI工具，AI大模型是数字经济驱动下产业认知达成共识的产物。

目前市场上已发布的大模型普遍具备大规模和预训练的特点，一方面有良好的通用性、泛化性，能够解决传统AI应用中门槛高、部署难的问题，另一方面可以作为技术底座，支撑智能化产品及应用落地。

360创始人周鸿祎表示，互联网公司都去做大模型的原因，是因为没人能笃定某一家公司能做出来成功的大模型产品。但这个技术对中国很重要，它是工业级的，对各行各业都能带来工业革命级的推动。

用大语言模型来变革业务层、为具体的业务落地场景赋能，这也已经是诸多互联网厂商的共同策略。并且在当下这个存量市场中，在效率上的些许变化就已经能兑现为竞争优势。

大模型成为应对AI领域应用碎片化的一种方式。

大模型也正在改变AI产业的规划与格局。比方说，牵引AI产业快速收敛，构建AI产业的底座;汇聚和沉淀行业生态及开发者生态，形成产业生态黏性。

责任编辑：赵智华

文章来源：http://www.anfangnews.com/2023/0706/7865.shtml