广告

智能音箱第一人,为何不看好智能音箱?

事实上,缪炜团队是全球第一个做出智能音箱的人!2013年缪炜带领团队加入小智团队后成功开发出了“小智”音箱,第一次把麦克风阵列、远场交互等技术带给了用户,比亚马逊的Echo音箱还要早出半年。

缪炜,是中国第一波从事语音识别技术研究的高材生之一。在同学都转行其它领域后,缪炜仍坚持专注语音技术研究,先后在摩托罗拉、夏普和Nuance公司任职。如今,他创办的互问信息科技在智能家电离线语音交互市场坐上了“第一把交椅”。而因足球结缘的缪炜和邓惠忠(前润欣科技副总)有一个共同的梦想:让声音连接一切!WQ3esmc

WQ3esmc

上海互问信息科技有限公司总经理缪炜(左)、副总经理邓惠忠(右)WQ3esmc

见证AI语音发展史

缪炜博士是中国语音交互发展的见证者。谈及AI语音发展史,就不得不谈Nuance这家公司,它诞生于上世纪90年代,是早期苹果Siri技术的提供者。2012年Nuance在全球智能语音市场占比接近70%。巅峰时期,Nuance的语音识别可支持全球50种语言,拥有近20亿用户Nuance是业界公认的培养智能语音技术人才的“黄埔军校”,其深厚的技术背景以及进入中国时间较早,为中国语音行业输送了诸多人才,很多国内的语音技术公司几乎都有来自Nuance的人才,当然互问科技也有不少技术骨干来自Nuance。WQ3esmc

缪炜回忆称,在2007年以前,在上海从事语音识别研究毕业的学生几乎很难找到和专业对口的工作,因为那个时候全上海几乎没有招聘语音识别研究相关的工作岗位,大部分的同学毕业后基本都转行做其它工作了。但缪炜坚信语音识别是新一代人机交互的未来,于是在2005年毅然选择进入摩托罗拉语音“冷衙门”但这也是当时国内从事语音技术研究最大的团队,事实证明语音交互的未来,在2009年这个团队被Nuance收购后成为了Nuance中国的研发中心。WQ3esmc

WQ3esmc

据《国际电子商情》了解,不久后,Nuance内陆续有同事加盟盛大创新院,后来盛大创新院的语音团队迅速成长为可以与科大讯飞、Nuance等正面竞争的AI语音“雄狮”。WQ3esmc

2012年是语音识别技术发展的大拐点,是由“大一统”走向“群雄割据”的关键节点。随着深度学习在语音技术上取得的巨大成功,以及国内创业氛围越来越好,这一年,受盛大公司的影响,很多语音行业的老兵都纷纷出来“另起炉灶”,北京云知声就是在这一年创立的。缪炜则选择了“小智”音箱,后来创办了互问信息科技。WQ3esmc

与其他侧重于云端AI语音技术定位不同,互问更专注于产品的本地语音功能,目前互问70%的业务仍聚焦于本地语音技术服务,30%的业务聚焦于在线(云端)语音交互,其离线语音识别芯片(W02x)销量已突破100万片。“我一开始就很关注在端侧智能这条线,这条线最难熬,但只要是自己感兴趣的事情,就一定要把它做到极致!”缪炜坚定地说。WQ3esmc

智能音箱第一人,却不看好智能音箱

事实上,缪炜团队是全球第一个做出智能音箱的人!2013年缪炜带领团队加入小智团队后成功开发出了“小智”音箱,第一次把麦克风阵列、远场交互等技术带给了用户,比亚马逊的Echo音箱还要早出半年。WQ3esmc

缪炜清楚地记得,智能音箱刚开始被看作一种智能硬件形态而存在,大致等同于智能插座、智能开关等产品。当时,绝大部分代工厂都没代工过这种产品,也不知道怎么生产。“小智”当时选了深圳某代工厂,在“被教育”后,这个代工厂后来成为世界主要智能音箱代工厂之一。2015年,互联网公司通过各种补贴手段大举进入该市场,目的是获得占据家庭入口。然而也就在这一年,缪炜毅然决定放弃音箱这个产品和这条道路。WQ3esmc

WQ3esmc

用缪炜的话说,智能音箱作为智能家电的唯一“中控”和绝对“入口”是个伪命题,他当时就看到了4-5年后智能音箱可能面临的瓶颈——不具备使用刚需,不足以担当如此重任。WQ3esmc

智能音箱厂商原本的设想是:聊天对话+中控+音乐+电商多管齐下,培养用户的使用粘性并获得数据,但从三大智能音箱后台使用数据可见,聊天对话的热度仅7天左右,中控使用率仅1-2‰(小米因生态优势可达到1%-2%),电商使用率仅有万分之五。在缪炜看来,智能音箱正在由“中控+电商+娱乐+生活服务”的高端定位沦为诸多消费者口中的“儿童玩具”。WQ3esmc

智能音箱的“中控”功能还存在使用场景的限制,在离音箱较远的浴室、卧室、厨房等可能受到网络条件的限制;客厅嘈杂的环境可能会让声音受到干扰;产品的互联互通性也不足。研究显示,64%的用户最看重智能家居的控制功能,之所以购买此类产品,主要是希望用它来控制家中的智能家居设备。而事实上,因中国智能音箱品牌各自为政,不同品牌自建封闭生态,“一台音箱控制所有家电品牌”的想法难成现实。WQ3esmc

缪炜预计,至少未来3-5年内都看不到这种生态的达成。他坦言,控制是家庭的强刚需,更好的选择还是离线控制,因为离线控制完全规避了在线的短板,且成本更低更易被客户接受。WQ3esmc

做离线语音的王者!

在这种思维的导向下,缪炜带领最初“小智”音箱的团队于2016年10月成立了互问科技,从离线语音识别芯片入手,聚焦智能家电产品的语音交互,以“技术实用”“低成本”的优势迅速打入全球一线家电品牌阵列。WQ3esmc

互问科技第一代离线语音识别芯片W02x于2018年中发布,截至目前已出货超过100万颗,占据国内智能家电离线语音市场第一的位置。WQ3esmc

WQ3esmc

据《国际电子商情》了解,为进一步落地离线语音的应用,2019年5月,互问科技又针对这些成本要求更严格的产品推出了LS416,芯片单价更低,完全可以满足终端售价在100元以内的小家电使用。2020年互问还将推出比LS416更具性能价比的语音芯片,同时还将推出带云端连接的语音芯片。WQ3esmc

离线语音摆脱了中控的场景限制,可随时随地对就近产品进行唤醒和操控,且互问的离线语音词条已多达100条以上。缪炜给出了一个数据:以一台空调为例,可能有多达81项技能,然而前四项功能(开关机,调模式,温度调节,摆风)占了95%的用户使用率,而后面70多项功能仅占不到5%,语音命令词条个数对控制智能家电绰绰有余。WQ3esmc

家电产品70%是离线控制的需求,还有30%是云端控制的需求。以离线为切入点回到云端是互问科技的发展思路。W03(与LS416同时发布)就是互问科技针对离在线语音识别推出的芯片。WQ3esmc

因使用成本低、随时随地唤醒、易操作等特性,互问的离线语音芯片(模块)已直接或间接的为国内外多个知名家电和互联网企业服务,如海尔、TCL、苏宁等。尤其是在追求极致细节的日本市场,互问的离线语音技术得到施展拳脚的机会,弥补了日本离线语音技术的空缺。WQ3esmc

缪炜强调,智能音箱实现了普及大众语音交互的概念,但却没有达到让用户使用语音的习惯。要完成这个使命,一定要有刚需。这也是为何目前国产智能音箱均采用“补贴”、“低价渗透”的销售策略,在消费者“尝鲜”的非理性消费时期结束之后,开始思考渠道如何下沉,如何增强内容服务的粘性的原因。WQ3esmc

借力卖芯片

语音识别的特别之处在于,复制一家公司并不容易。在语音交互热潮高涨之时,很多公司试图分得杯羹,但他们立即发现这并非易事。WQ3esmc

从互问科技当前的股本结构来看,电子元器件代理商武汉力源和瑞凡微都是互问的股东,同代理商的绑定可以将互问的产品快速导入市场。“力源是上市公司,力源和瑞凡微都有很强的家电客户群和技术支持团队,跟它们合作,一来可以学到公司的规范化操作,二来可以将产品快速落地商用。”WQ3esmc

缪炜表示,力源的家电业务跟互问高度重合,在渠道拓展方面为互问提供了不小的助力,以前互问的销售市场仅局限于华东和华南,而现在借助力源的渠道将芯片业务拓展至西安、成都、武汉等地区,在销售渠道拓展的同时还为公司带来了品牌知名度。WQ3esmc

据悉,2017-2018年,互问的市场开拓主要由代理商推动,但在快速获得客户的同时问题也来了——语音识别技术门槛太高,代理商对语音技术支持的能力不足。于是,互问在2019年培养了多家技术方案商,以减轻技术支持的压力。WQ3esmc

谈及客户的差异化需求,缪炜感触颇深。根据客户产品定位的差异化,同一颗芯片进入场景化应用的定位也要有所不同,比如有些企业强调制造质量,要求产品的可靠性和质量。有的却强调的是互联网特性,要求产品跟生态的互联互通性。有的则强调以科技为主,要让不同的人都觉得很好用。因此,同样一颗芯片,在不同的客户那里,重心会有所偏移,总之要符合不同企业的价值定位。缪炜笑称这是泥腿子的活,其它厂商可能不愿意撩起裤脚干这活! WQ3esmc

众所周知,头部家电客户皆乃兵家必争之地。缪炜表示,目前,离线语音市场竞争并不激烈,但不乏有新进入者,互问正在提高IC设计和算法的门槛,比如将在2020年推出第三代专用本地语音芯片,并全力完善下一代本地语音识别技术,以提高竞争壁垒。WQ3esmc

悍将加入,如虎添翼

人才是一个企业的灵魂,特别是高科技行业,“以人为本”已成为半导体芯片设计公司发展的关键所在。2020年1月初,原就职于国内知名电子元器件分销上市公司——润欣科技的邓惠忠先生加入互问科技,为其带来新的助力。WQ3esmc

因足球结缘的邓惠忠和缪炜有一个共同的梦想:让中国5亿家庭都养成使用语音的习惯!让声音连接一切!WQ3esmc

邓惠忠告诉《国际电子商情》分析师,足球人有两大精神,一是不服输,追不上还得追,必须拼搏到最后一刻;二是团队凝聚力,11个人必须相互配合才能取得最终的胜利。正是这种不服输的足球精神,将二人凝聚在一起,为了实现共同的梦想而努力奋斗。WQ3esmc

作为纯正的60后,邓惠忠1986年毕业于中山大学,1999年成为台湾旺宏科技进入大陆的前五位员工,2007加入润欣科技的次年遭遇金融风暴,在团队的共同抗压下度过危机,并推动公司于2015年12月10日成功上市。WQ3esmc

20年半导体行业团队管理经验及资源积累,将带给互问科技带来技术团队管理、销售渠道、品牌形象及市场营销策略上的全新蜕变。邓惠忠感同身受的目标:让用户在选择家电时,非语音产品不买!让声音连接一切!!WQ3esmc

我们看到,当前正值国产半导体产业发展的黄金时期,在这波风潮的影响下,互问科技定能顺势而为,在专注语音识别技术的道路上走出自己的特色!WQ3esmc

互问后记:本篇采访于年前完成,因恰逢春节一直未发表。随着春节前后疫情越来越厉害,全体互问人更加觉得语音交互可以减少人们需要在家手动操作各类开关、遥控器的不便,真正享受让声音来连接一切!而希望成为智慧“声”活倡导者和语音交互技术领导者的互问科技正乘风破浪,响应政府号召,居家协同办公,希望按照原计划推出更加优秀的产品,为居家隔离人员服务,共同抗击疫情,推动语音交互市场的春天早日到来!WQ3esmc

本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
王琼芳
有着十多年半导体行业工作经验,主要负责《国际电子商情》杂志/网站/微信等平台的内容运营,擅长行业深度报道与产业趋势分析,重点关注半导体IC及分销与供应链。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

近期热点

广告
广告

EE直播间

更多>>

在线研讨会

更多>>