设为首页收藏本站language 语言切换
查看: 666|回复: 3
收起左侧

阿里云产业AI新突破:AI收银员上岗!

[复制链接]
发表于 2018-5-27 17:40:49 | 显示全部楼层 |阅读模式

导读
鄢志杰最快以每秒5个字的语速向一台机器点单。机器对每一次对话都作出了精准相应,而站在一旁的资深咖啡师选择了中途放弃,“太快了,记不下来”。

                               
登录/注册后可看大图

“五个巧克力、两个香草拿铁,巧克力加奶油。”
“两个中杯焦糖拿铁,一个热的一个冷的。”
”算了巧克力不要了。”
“再要六个小杯少冰摩卡,三杯加焦糖三杯加香草”
“再加一个大的冷的拿铁,去冰半糖加脱脂奶,打包。”
鄢志杰最快以每秒5个字的语速向一台机器点单。机器对每一次对话都作出了精准相应,而站在一旁的资深咖啡师选择了中途放弃,“太快了,记不下来”。
这是发生在5月23日云栖大会武汉峰会上的一幕。鄢志杰是阿里巴巴机器智能技术实验室语音交互首席科学家。人类咖啡师在听了鄢志杰第二次复述后完成了订单,用时2分37秒,而机器只用了49秒。
“今天我们将机器对人类口语的理解能力带到了新的高度”,鄢志杰说,这种交互方式完全打破了"语音唤醒+语音指令"传统命令式交互方式,我们首创的流式多意图口语理解引擎,极大地提升了对人类随意、自然的口语表达的理解力,能够做到免唤醒的自然的人机交流式的语音交互。
上述点单环节包含了修改、删除、加单等多轮对话,在整个交流过程中,顾客不需要说”hi,点单机“之类呆板的唤醒词,可直接下单,更符合人与人的自然对话。
据鄢志杰介绍,这些模块并非简单级联,而是深度融合而形成了多模态语音交互方案,包括是公共场所强噪声环境下的信号处理和语音识别、视频识别与面部识别、场景感知等多模态融合的感知智能,同时更融合了流式对话、多轮多意图口语理解、业务知识图谱自适应等认知智能。
据了解,阿里云这项解决方案除了可以做收银员之外,还能在地铁卖票。目前,上海地铁已经部署了这一技术。乘客直接说出目的地,售票机便可选择合适的站点和路线。这对于初到上海的乘客尤其帮助巨大,面对十几条线路三百多个站点谁都会懵。测试数据显示,普通买票耗时往往超过30秒,而语音购票全程只需要10秒左右。
鄢志杰介绍,依托于业务知识图谱自适应的技术,这套方案能够快速的在更多场景落地,目前已经落地的场景还有车内语音助手、电话智能客服、可免遥控器操作的远场语音电视、可精准区分多人对话的智能麦克风等。“未来我们希望实现公众空间里的万物皆能对话。”
阿里云产品总监何云飞说,阿里云去年提供出了”产业AI“的战略,呼吁行业将AI技术沉淀到产业中,不要成为炒作股价的营销词汇。无论是咖啡点餐还是地铁售票,我们都是让AI在真实的产业场景下发挥价值。这比那些在实验室里炫技的AI更有意义,更具生命力。
据了解,除了解决方案之外阿里云还推出了ET大脑,包含ET城市大脑、ET工业大脑、ET医疗大脑等。目前,ET工业大脑已经帮助工业制造企业创造利润数十亿,ET城市大脑在杭州、澳门、吉隆坡等城市落地,承担着交通优化、平安城市等职责。

免费提供最新Linux技术教程书籍,为开源技术爱好者努力做得更多更好,开源站点:https://www.linuxprobe.com/


发表于 2018-5-27 19:34:17 | 显示全部楼层
thank you bro
沙发 2018-5-27 19:34:17 回复 收起回复
回复 支持 反对

使用道具 举报

发表于 2018-5-27 23:51:50 | 显示全部楼层
感谢楼主分享!
地板 2018-5-27 23:51:50 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-2-3 23:46 , Processed in 0.075146 second(s), 12 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表