小米入局AI大模型竞赛

来源：中国经营网2023-04-22 23:01:24

近日，小米集团董事长兼首席执行官雷军发微博称，小米在AI领域已经耕耘多年，有AI实验室、小爱同学、自动驾驶等团队。“对于大模型，我们当然会全力以赴，坚决拥抱。我们正在研发一些有趣的技术和产品，等我们打磨好了，再给大家展示。”

小米方面在接受《中国经营报》记者采访时表示，小米在AI大模型方面并非从零起步。多年来，小米在保障用户隐私的情况下，累积了庞大的高质量数据支撑，而且前期已经有大模型方面的尝试和研发，会让小米在大模型方面的进展更迅速。

谈及小米为什么做AI大模型，盘古智库高级研究员江瀚分析，“我觉得小米做AI大模型更多是把自己的优势与体验提升起来，可以看到，小米这些年在AI和物联网领域有了很多布局，小爱同学的整体发展也还不错，所以在这样的情况之下，做AI大模型实际上是为了实现各个业务生态的联合，也符合小米万物互联的逻辑，所以我觉得小米做AI大模型是很正常的。”

【资料图】

小米探索AI大模型

据了解，早在今年2月9日的小米投资者会议上，该公司就曾透露其早就在AI大模型等方面有尝试，并且是多技术路线并行。接下来，小米将在这个方向加大人力、资源方面的投入。

3月24日，小米集团合伙人、总裁卢伟冰曾在财报电话会议上表示，小米在小爱同学上投入时间超过6年，在与用户交互体验中积累了长期可复用的经验。截至2022年12月，小爱同学全球活跃用户达1.15亿，有丰富的场景落地，可以支持手机、音箱、车等多种场景融合。未来，小米会继续进行大模型研究，引入更先进的大模型能力，包括探索多模态能力、智能座舱交互体验提升等。

小米方面向记者介绍称，4月14日，小米任命栾剑担任AI实验室大模型团队负责人，并向AI实验室主任王斌汇报。AI实验室大模型团队可以调度集团资源，包括不限于业务、研发、人力和投入等。这是小米在大模型方向的专项投入。

王斌是小米公司自然语言处理（NLP）首席科学家，原中科院研究员、博导，在NLP领域有超过25年的研发经历。栾剑是资深语言语音方向专家，曾任微软小冰语音首席科学家。加入小米后，他先后带领语音生成、NLP等团队，负责个性化语音生成、音乐生成、人机对话、机器翻译、文本生成等方向的研发，及在小爱同学等产品中的落地。

此前在财报发布后的电话会议中，卢伟冰谈到有关AI的话题时曾表示，小米采用多技术路线并行探索AI大模型的落地，ChatGPT的成功给了小米很大信心来验证这个方向的正确性。目前，小米的小爱同学即是典型的大模型落地场景。

卢伟冰介绍，小爱同学已经做了6年，在与用户的交互体验中积累了长期可复用的经验，同时，小米有丰富的场景落地经验，小爱同学支持手机、音箱、车等多场景的智能融合。未来小米将继续大模型研究，引入更加先进的大模型能力，包括探索多模态能力、智能座舱交互体验提升等。目前，小米AI团队超过1200人。

纷纷入局抢占先机

目前，国内多家科技厂商相继推出生成式AI产品对标ChatGPT，但距离GPT-4还有一段距离。

3月中旬，百度最先发布文心一言，360的“360智脑”已经进行过现场演示，阿里、商汤也都已发布类ChatGPT产品。此外，有赞也带来了由大模型驱动的首个AI产品“加我智能”。就连飞书，近期也悄悄上线了关于智能助手“My AI”的Demo视频。

根据民生证券相关研报统计，目前国内已经有30多个大模型亮相，其中不乏参数规模超过ChatGPT规模的大模型。

各大厂商竞相落地大模型的原因很简单，因为大模型天然带有先发优势属性，率先发布的企业最容易形成“滚雪球”式的优势，一旦占领市场，相比于后来者会有无可比拟的优势。业内普遍认为，大模型未来会是寡头竞争模式。

江瀚认为，对于小米来说，它做AI最大的优势在于数据的积累和软硬件的结合，它可能不像那些互联网大厂一样拥有纯线上的优势，但是线上线下一体化联合的这种物联网优势，小米无疑很明显。小米就像一个杂货铺，它线上线下什么产品都有，自然而然有一个巨大的线上线下结合的核心优势，包括它的数据、软硬件的结合、语言模型的整体设置，以及其AI的具体场景化的优势，其他很多大厂并不具备。

最近，OpenAI联合创始人兼首席执行官Sam Altman接受媒体采访时表示，“大小并非衡量一个模型质量的正确方式，重要的是，将重点放在迅速提高（模型）能力上。”

“如果可以的话，参数数量应该随着时间的推移而减少，或者我们应该让多个模型一起工作。我们希望向世界提供的是最强大、最实用、最安全的模型。当然，我们并不是要忽略参数数量。” Sam Altman认为，未来模型参数应该向更小的方向发展，或者以多个小模型协作的方式工作。

此外，Sam Altman警告称，目前已经处在大模型时代的尾声，并表示如今的AIGC（人工智能生成内容）发展中，将数据模型进一步做大，塞进更多数据的方式，已经是目前人工智能发展中最后一项重大进展。他还称，诞生ChatGPT的研究策略已经结束。并且还声称目前还不清楚未来的发展方向将何去何从。

对于中国公司为什么在ChatGPT方面暂时落后的问题，清华大学人工智能国际治理研究院副院长梁正表示，在应用场景之下是底层架构和基础研究，当我们和业界去交流时，原以为他们市值已经这么高，在创新的基础上一定会大量投入，结果却不是，有的公司很少有做长期的规划，即便是定位于做基础研究的头部企业的研究院，对它的考核都是相对短期的。

民生证券相关研报指出，目前表面上大模型百花齐放，不再稀缺，是因为开源基础以及大公司本身的算力储备与资金实力，单纯发布一个大模型的门槛，没有市场想象的那么高。但是能够拥有高质量数据场景，才能持续迭代，性能逐步逼近ChatGPT的大模型，预计最终“杀出重围”的仍是“凤毛麟角”。市场会逐步凝结共识：得数据者得天下，数据成为大模型差异化竞争的关键。

标签：