2024Q1,全球智能音箱出货量为18.9M,同比下降14.3%。曾在2019年火爆异常的智能音箱如今境况不佳,一方面是受整体消费降级影响,另一方面也是由于产品迭代缓慢、智能化体验不尽人意、音效不如专业音箱、痛点痒点繁多。但长期来看,多模态大模型将成为驱动力,配合Matter标准逐渐成熟、智能家居渗透加速,智能音箱或将迎来新一轮的产品升级和市场机会。
图表1:2023Q1-2024Q1 全球智能音箱出货量
数据来源:DISCIEN整理
一、大模型是新时代的“电力”
回顾历史,我们可以发现科技的发展是波浪式的,一种新生的通用技术在发明之后,会刺激产品形态的革新,而更完善的产品可以承载更多更好的技术应用,由此形成正向循环,比如电力和电灯、互联网和个人计算机、移动互联网和智能手机等。
着眼当下,最引人注目的通用技术便是AI人工智能,而AI各个分支技术中的弄潮儿非“大模型”莫属。OpenAI、Google等巨头之间的你追我赶,带来的是大模型技术的突飞猛进。技术的发展也刺激了商业化的探索,众多科技厂商致力于寻找承载大模型的产品形态,AI手机、AI PC等概念及新品此起彼伏,其中也包括很早就被寄予厚望的智能音箱。
二、智能音箱是大模型的最佳载体之一
AI之所以被科学家定义为通用技术,是因为其能应用在很多产品上,比如电视、手机、电脑等。那为什么智能音箱可能是大模型技术的最佳载体之一?
第一,智能音箱的核心功能和大模型的主要技术突破都集中在感知与交互领域,产品和技术的匹配度高。
第二,智能音箱已经拥有了一定的用户规模,其在家庭中的角色也是生活助手,智能音箱可以更快速地将大模型落地到生活场景。
第三,对于电视、手机这些产品,大模型是锦上添花的“辅助”,而对于以智能交互为主要特征的智能音箱,大模型是最重要的“主菜”。
三、多模态大模型给智能音箱带来转机
转机1:多模态大模型提升智能音箱产品力
如果能够将GPT-4o展示出来的能力嫁接到智能音箱上,智能音箱的感知、交互、决策、反馈将更加顺畅。设想一下,智能音箱能够和你实时语音对话、能够读懂你的潜台词、能够看懂你的动作,比如看到老人摔倒然后自主报警、识别到情绪不佳会主动开导,这种功能才能够实现真正的价值。
转机2:头部厂商将多模态交互作为升级方向
天猫精灵在上个月进行品牌焕新,更换了logo并发布了X6智能音箱,其产品更新主要是提升音质和智能化。音质通过升学架构设计和驱动单元进行提升,智能化则是引入大模型和内容理解算法,提供更有温度的交互体验。
天猫精灵认为未来智能音箱显然不能再是一问一答的呆板机器,要给用户更有想象力的应用体验:在语音交互上借助大模型能力做语音链路优化,并且能够进行多模态交互,主动判断当前场景和状态,不仅仅是被动接受。
转机3:成本下降是大模型商业化落地的关键
更值得关注的是,GPT-4o在价格上实现了50%的下降,按照OpenAI的预期,其大模型的价格将会以每年50-75%的幅度继续降低。部分国内大模型的使用成本也在持续下降。
图表2:部分国内大模型降价汇总
数据来源:DISCIEN整理
综上所述,多模态大模型能够有效提升智能音箱的产品价值,头部厂商已开始着手利用多模态大模型做新一轮的智能音箱产品更新,而大模型的使用成本越来越友好,叠加智能音箱十年探索期积累的用户基础,我们相信智能音箱将迎来新一轮的产品升级,同时也将给市场注入新动能。
|