【微特写】做智能音箱的都已经热得火急火燎的, 为什么小米的“小爱同学”一直还在测试中?

摘要: 好产品是硬道理。不论智能音箱目前的主观还是客观条件,都不适合撸袖子快干,尤其是当外界对智能音箱这类AI产品的有点期望过高时。

10-09 05:19 首页 IT经理世界


大约一个月前,在小米5x的发布会上,小米公司联合创始人王川发布了小米AI音箱“小爱同学”。



但是,这个声音甜美轻柔的她,何时“面基”普罗大众却仍然是个谜。甚至直到8月下旬的媒体沟通会,王川都没有给个deadline,“95%的用户用过以后都觉得这个东西值得购买,我们就可以量产销售了”。


亚马逊Echo在面世两年后,近千万的出货量,掀起来了业界内外对于语音交互应用、对于智能音箱的火一般的热情,今年在国内更是热得火急火燎,BAT级别的互联网大公司如阿里、京东,IT科技公司如联想,还有更多的创业公司比如出门问问、喜马拉雅、ROKID等纷纷参与进来。这样的场面似曾相识,一如当年智能路由器、电视盒子一窝蜂时一样。


对于眼下的一窝蜂热,创业四度的王川说,“做智能音箱,我认为不适合小的创业者做,小的创业者应该利用他们的优势跟我们合作”。


不抢国内智能音箱首发的风头,量产面市时间迟迟不公布,小米在智能音箱这件事上这样的“不着急”,笔者以为有如下考虑:


好产品是硬道理。不论智能音箱目前的主观还是客观条件,都不适合撸袖子快干,尤其是当外界对智能音箱这类AI产品有点期望过高时,“今天人工智能还没有达到你随意说,他随意回答的程度”。客观条件比如用户的使用习惯和网络带宽环境,主观条件比如智能音箱这类AI产品自身的进化迭代,从信息搜索到服务达成这一良好体验背后的相关技术和资源准备——捋顺产品逻辑,积累有声内容的版权,架构有声内容的搜索体系,用户对这套语音交互系统的使用“调教”等等,都非一朝一夕的事情。


所以,在外界纷纷为“小爱同学”算账盈亏时,“不着急”的王川说,“赔不重要,重要的是小米的品牌,我是给品牌加分(还是减分)”,“如果没有好的体验,大部分是砸牌子,甚至是毁行业”。


同时,互联网大公司面对这种可能的“入口”式产品,下手又不能不狠。以互联网思路做产品,key是“挟用户/流量以令业界”。有人说299元的“屠夫价格”将终结智能音箱这个风口。


“小爱同学”8月份开启“1元公测”计划,招募1000名发烧友成为小米AI训练师,设定的门槛是“有十台以上小米智能家居设备的米粉”。选择在有粉丝影响力的“米粉”中进行产品公测,笔者以为这是捷径:拥趸者有足够的参与热情和容错耐心,这是如“婴孩儿”般弱小的产品迅速迭代成长的良好土壤,且为日后量产可能的病毒式传播积累口碑基础。

 

“价格屠夫”的“低价”逻辑



王川称小米AI音箱是“价格厚道的产品”(299元),眼下BAT都做智能音箱炒热了这个行业,但这个热度有点过高。“今天Echo在美国很成功,但是是两年前发布的,两年用户不断的使用,体验不断的提升,到今天它成熟了。两年前,我们的合伙人KK就看到了Echo,他当时的感觉就是完全没法用,但是今天就很好用了。所以这个市场还需要时间,这个产品还需要打磨,打磨到真正好用。”他强调,这样的智能音箱,只有用户用了以后,才会越来越好、越来越好。


王川认为,相较于市面上其他的智能音箱,“小爱同学”的差异化定位在于,成为智能家居的“遥控器”。小米智能产品部/小米探索实验室总经理唐沐介绍,小米到目前已经有6000万台智能家居设备在运行,对于小米来讲这是得天独厚的优势,“我们有这么多智能设备的时候,我们的音箱控制这些智能设备非常得心应手,而且这个门槛建立起来,其实是其他竞品公司所完全没有的”。王川和唐沐都坦言,他们确实花了非常多的精力让音箱控制好这些智能设备,比如智能电视、灯、风扇、扫地机器人等等,让这种控制更加方便好用。


王川和唐沐都讲到了未来会对外开放“小爱同学”这套语音交互体系。“谁愿意做智能音箱我们都支持,别说我们自己的生态链,第三方公司,如果愿意做音箱,愿意使用我们的服务,我们愿意免费给大家提供小爱服务。”王川说。至于这套”语音交互体系”,小米在技术和平台建设方面“做”与“不做”的边界,两位都没有特别明确的阐述。


在语音技术细节上,王川介绍,小爱同学在自己的NLP(自然语言处理)的基础上,采用了多家的ASR(自动语音识别),包括Nuance、思必驰等十家语音识别公司的技术,在唤醒上采用了声智科技、Nuance的技术等,至于这套语音交互体系未来的唤醒引擎是完全用小米自己的技术,还是会延续现在的做法——优先调用识别准确率高、响应速度最优的第三方,小米方面并未给出明确说法。

 

  进入门槛:有声内容版权



作为一款音箱,首先要解决音乐的内容版权的问题。


唐沐称,小米今天所拥有的有声读物是整个市面上音箱里最全的,因为小米有非常广泛的合作方。他介绍,在音乐版权方面,小米目前跟腾讯、百度、虾米等等这些版权方的合作,也直接和版权方,比如环球、华纳、索尼等在进行一些接触“我相信我们到正式量产以及正式销售的时候,我们的版权会是非常非常丰富的”,“我们有这个信心,可以拿到最全的版权”。他进而透露,小米构建音乐版权库的的重心会在“头部”歌曲里面,他们一定要把头部歌曲的版权全都拿过来。


“小爱同学”如何知道哪些“头部”歌曲是用户真正喜欢听呢?王川介绍,数据的来源有几个方面:第一通过小米音乐;第二王川的另外一个身份是中国最大的卡拉OK设备公司雷石的BOSS,大家唱什么歌他都很清楚,他们也拥有中国最大的卡拉OK曲目。


王川希望,未来小米AI音箱的内容丰富程度就像小米电视一样,通过寻求跟所有内容所有方的合作来实现内容的高丰富度。

 

 智能音箱升级的侧重



如果语音交互的控制主要分为两个大的方向的话——一是控制其他的智能电器设备,一是实现从信息的检索到服务的达成——“小爱同学”目前着力重要和节奏是怎样的?


王川介绍,既是一个好音箱,也是一个好的生活助手,也是一个智能家居的中心,这三个功能都要很强。


从“小爱同学”的内测来看,智能音箱目前相对集中的需求包括:一是控制智能家居;二是信息查询(时间、天气、车号限行、路况);三是闹钟备忘;四是音乐、有声读物和新闻。


王川介绍,目前小米AI音箱已经有40多个技能,包含了主要的服务和功能,上市之后“看用户的使用,用户使用频度高的,我们一定会加大力度做得更好,用户使用频度低了,我们会放后一点”。另外,通过小米水滴平台,由小米做一些基础的技能,开放给第三方去开发更多的技能,来满足用户需求。


王川和唐沐认为,智能音箱产品升级迭代的关键之一是“语料”,“每次做唤醒优化需要大量的语料做唤醒引擎”。


唐沐分享了小米AI音箱在内测时的一些有趣故事。他谈到小米音箱刚在内部内测时,用的都是男性工程师做测试,但是发现同事拿回家后老婆没法唤醒它,后来就征集女性进行内侧,训练唤醒引擎。再后来又发现小孩子在唤醒“小爱同学”时存在问题,特意到海淀教育局找了100多个儿童录语料,通过深度学习,不断训练优化小米音箱的唤醒、识别情况。



目前小米AI音箱仅支持中文普通话。唐沐表示,解决方言的问题就是时间和语料的问题。王川介绍,对于刚刚起步的“小爱同学”来说,第一步先做好普通话,这还要一段路要走;下一步是攻克使用人群多的“大”方言;再下一步就是支持英文和其他国家的语言。

 

 “音箱购物”待成熟



在音箱购物上,王川和唐沐都持相对谨慎的态度。唐沐认为音箱购物目前还有比较大的一些门槛难以逾越。比如,音箱没有屏幕,“怎么样让大家有欲望去买东西”这件事是挺难的,未来可能在标品购买上有市场;再如支付也是一个门槛,目前声纹验证的技术还不够成熟。


王川表示,语音交互的购物是一个很有趣的话题,未来有很多可能性,小米也在跟包括淘宝、京东在内电商一起商讨,在音箱上有没有新的方式做购物。




作者 | 贺文 

微信编辑 | 张盼盼





首页 - IT经理世界 的更多文章: