为了让车厂自己能定义,博泰发布定制AI语音平台
最近,有网友在特斯拉新发布的固件中,发现了一系列新的语音控制词。这是继宣布自主研发汽车自动驾驶芯片后,特斯拉再次涉足自行开发智能网联的核心技术。
随着搭载语音交互功能新车越来越多,很多车主发现语音命令非常有用,随着它们的改进(包括识别率、自然语言处理等等),对着车说话的次数越来越多,使用触摸屏的次数越来越少。
AI语音系统可与驾驶员监测等非语言数据紧密耦合,与用户进行互动;并能了解司机和乘客的需求和偏好,提供个性化的体验,在很大程度上,可以替代特斯拉引以为傲的超大触屏的功能。
不光是特斯拉,奔驰、宝马、奥迪、克莱斯勒、戴姆勒、福特、现代、上汽等一大批车企都已经或正在准备上马AI语音系统。而AI语音系统的普及存在着不少技术门槛,对语音处理技术、数据处理能力都有更高的要求,车企也希望能有更多的定制能力,实现平衡高质量的用户体验与数据独立性,以体现品牌的独特性
汽车公司注重安全性和稳定性,在软件和云端的能力有所不足,互联网公司注重用户体验和更新迭代,但对汽车的渠道、运营不太了解,双方由于理念上、技术上、需求上存在着差异,因此车企会嫌互联网公司做出的车联网系统不能完全满足需求,而互联网公司会觉得车企思想保守,很多底层资源、数据不对自己开放,造成双方在车联网的发展上不合拍。
博泰一直在扮演的就是在车企和互联网公司之间整合各种功能和能力的关键角色:将车联网相关资源进行整合,开发出更贴近用户驾驶场景的各种功能,形成一套汽车使用的iOS系统,帮助汽车公司建立智能化与建立核心平台与运营能力,让他们站在巨人肩膀上但不被巨人绑架。
4月17日,上海国际车展期间,上海博泰与思必驰签订深度战略合作协议,推出博泰擎Cloud Plus客户定制AI语音平台,让博泰在车联网整合能力上更进一步,可以通过这个平台,车企定制自己与众不同的智能语音车联网系统。
一、智能语音直击大屏软肋
2016年,上汽荣威RX5、吉利博越(与博泰合作)两款智能汽车发布,并相继成为爆款车型,消费者开始接受智能网联汽车。而在搭载了Windlink 3.0系统的东风AX7和北汽新能源搭载达尔文系统的EU5上市以来,人工智能语音的强大功能让车企和消费者都很兴奋,车企特别是自主车企在智能网联上的配置率也从部分配置,转向全部车型平台化运作和80%以上配置,甚至100%配置。
据2018年JD Power报告统计,91%中国消费者会优先考虑智能互联汽车,其中51%受访者愿意花费全款额外的20%来购买智能互联汽车,9%的消费者愿意花费全款额外的10%来购买。智能化与互联化也从培育期逐步进入用户全面接受的爆发期。
随着80后、90后成为汽车消费的主力军,人们对于车联网的接受程度进一步提高,而语音识别和语义理解技术的日趋成熟,让自然语音交互打破了原来车内语音操控需要背指令、按步骤操作的局面,在实际表现和逻辑上更进了一步,对于语义的理解更丰富、更准确,还整合了更多的出行服务内容,正在逐步替代甚至升级车内原有按键和触屏所实现的功能。
AI语音控制在便利性和安全性上的极大优势,使其成为车内网、车际网和车载互联网共同的“入口” ,使得原本鸡肋的车联网操作系统变得越来越实用。
由AI语音控制带来升级的智能车联网系统不仅涉及到用户体验到的功能问题,更涉及到整车电子架构的变化、整车信息安全、大数据的闭环等方面,是一个非常复杂的系统。
2009年成立的博泰车联网作为中国业务最全面,历史最久、专利最多、与车企合作最广泛、关系最密切的综合车联网服务提供商,拥有全套中国市场车联网运营资质业务。
博泰业务覆盖车内数据、汽车电子硬件、操作系统、软件、语音AI与地图集成等多个部分,可以提供从智能操作系统、大数据、内容服务集成与运营、地图引擎软件与云端架构、语音嵌入式与云平台解决方案、IoT与穿戴式等综合车联网服务。
2007年成立于英国剑桥高新区的思必驰,是国际上少数拥有自主产权、中英文综合语音技术并拥有自主语音芯片的智能语音技术解决方案提供商,拥有从唤醒、识别、理解到对话的全链路语音技术。
其2017年推出DUI平台,开放核心技术,不仅提供自身的智能语音对话功能,也为开发者提供超高度定制的语音技术,推动定制规模化,向开发者提供定制对话服务,如GUI定制、版本管理、私有云部署等。
博泰此次携手思必驰,以及汇聚众多语音合作伙伴,也是希望探索一条未来更适合消费者使用习惯,车企自身发展的技术路线。
二、让语音跟上车联网的脉动
博泰开创了汽车语音与汽车语音AI时代,历经的五代发展,即将进入汽车图像AI+语音AI+手势AI的多摸交互时代。
2009年成立的博泰车联网作为中国业务最全面,历史最久、专利最多、与车企合作最广泛、关系最密切的综合车联网服务提供商,拥有全套中国市场车联网运营资质业务。而或许很多人不知道的是:早在2011年,博泰就与科大讯飞合作了全球第一个车内语音,较之Siri早了九个月。
但在这个时代,语音公司产品规划部是一个集成的角色,在盘点自己的成长历程时,博泰自己戏称那个阶段堪称“六无人员”——无数据、无内容,无服务,无能力,无核心价值,无主动权。
随后,博泰以2年为一阶段的发展速度迅速成长。
2013年,博泰建立了行业唯一的基于Api接口的云平台,语音公司需要的酒店,机票,航空,景点等数据需要通过博泰云端调用,解决了内容与服务问题。
在第三阶段的发展过程里,2015年博泰与Nuance通过九个月形成战略合作形成了语音的云端数据分析与数据获取能力,实现了“语音规划能力+语音内容能力+语音服务能力+语音数据分析能力”。
截止到2017年,在第四阶段里,博泰通过与百度DuerOS的深度合作,通过联合开发与接口打通解决了在博泰擎Cloud与百度DuerOS的接口打通互访能力,初步实现人工智能,实现全程语音操作,能听清、听懂、满足用户需求,完成了“规划+内容+服务+数据+云云打通”,而使用博泰的语音系统的车型如东风风神AX7在2018年屡获大奖。
在2019年为标志时间点的第五阶段,博泰花费了巨资,打造了上百人的团队,建立了自己的ASR,NLU及语音私有云的平台,同时兼容插拔百度DuerOS,百度AIG,未来兼容华为,阿里,腾讯,滴滴,小米等语音能力与各类手机语音(如小爱,Siri)。与此同时,建立了云端数据分析和数据获取能力,形成了博泰擎AI人工智能语音核心技术引擎。
而这次发布的博泰擎cloud plus客户定制AI语音平台,就是在此引擎中融入思必驰语音技术形成的博泰自己的中台式服务中心。将来可以用PLUG IN的方式接入其他合作伙伴的技术和应用,根据博泰相关人士的说法,博泰希望打造一款可以接入各家语音厂商的语音平台为车企服务。
在这个平台当中,思必驰提供语音前端信号处理,语音唤醒,离线语音识别,语音播报,声纹识别等基础能力;提供在线ASR,在线TTS等基础能力;提供DUI平台开发能力。
博泰语音团队提供独立的语音终端SDK、独立的对话管理能力、在线ASR, TTS,NLU接入能力、自主语音技能定制开发能力,具备多模交互,主动交互等新特性。同时,博泰云团队提供基础PAAS平台,BASE 账户,数据,CP服务。
这一平台首先具备了前端信号处理能力、终端语音唤醒能力、声纹识别能力、离线识别能力、终端语音合成能力、云端语音识别能力、云端自然语言理解及对话管理能力、在线语音合成能力及语音AI平台支撑能力。
随着5G网络的逐步引入,网络速度的改善,云服务将越来越普及。博泰将利用云服务对大量的语音识别数据进行收集和计算,依托网络计算技术,构建基于移动互联网环境下独特的语音平台引擎,让车机实现听懂人话、识别多种语言甚至方言,让司机通过语音发号施令,用耳朵来接受服务,并与车机进行自然语言交流。
其次,平台除了车载导航、语音交互、OTA升级功能,还在向车辆控制、酒店预订、移动支付、汽车保险、能源行业、汽车金融等多个方向进行扩展。更多的出行服务也将通过丰富的应用生态得以实现,如找车位、预约车位、找充电桩、交过路费等,都可以通过专门为汽车设计的应用来解决,体验也会比手机更方便。
第三,通过云端数据分析和数据获取能力,这个平台可以帮助车厂和语音公司使用云端数据,通过对第三方数据交易、共享数据交换、数据合作模式研究等数据整合处理手段,获得驾驶行为、群体驾驶特征、车辆工况进行分析,车辆零部件跟踪和故障隐患分析、车辆能耗消耗等有价值的结果。
这个平台兼具软硬件一体化服务能力总结下来,博泰语音平台的核心是解决两个痛点,一个担心。
第一个痛点:定制化开发,满足车厂实际细分目标顾客的需求。
第二个痛点:可插拔的模块化功能,敏捷的迭代满足顾客领先的期望。
一个担心:既要保证数据的安全,用让用户可以使用数据