一篇文章搞懂语音交互的来龙去脉
文章对语音界面设计的一些知识展开分析解读,希望能够给你带来启发。
过去60年人工智能经历了两次潮起潮落新AI时代的头十年和后十年,前十年是通过ai去解决行业问题,例如医疗教育,信贷和金融等,通过大数据和机器学习迅速提升效率与准确率;新ai时代的后十年则升级到消费产品和用户生活场景(无人驾驶车,智能家居,家用机器人等领域),相对应的我们的交互方式也必然会随之更新。
在特定的场景下,例如无人驾驶,智能家居等,语音交互方式其实是最便捷的交互方式,语言是人类独有的沟通方式,在未来的人工智能时代,必然会通过语音的交互彻底解放我们的双手。我们现在正处于语音智能产品的爆发之际,我们需要一个专业而系统的归纳,来帮助我们在语音交互和智能硬件的道路上共同探索和学习。今天我们就来讨论关于语音界面设计方面的一些知识,本文章观点大部分来自入《语音用户界面设计对话式体验设计原则》这本书,希望能够对大家有帮助。
第一:语音界面简史
20世纪90年代出现了交互模式的语音应答,简称为ivr,它可以通过电话线路理解人们的话并且执行认为,一般都广泛的应用在运营的客服方面,即使是现在三大运营上的机器客服还是采用了这种语音应答的方式。但是通过电话拨号的方式开始语音的问答还存在很多的缺点,例如只能应用在单轮任务的问答,交互方式比较单一,不能进行中途打断等缺点。
第二个阶段就是后期各大公司都出现了自己的语音助手,例如微软的cortana,谷歌的GoogleOK和苹果的Siri。这些语音助手集成了视觉和语音信息的app,可以同时使用语音和屏幕交互,是一种多模态的交互设计。发展到这个阶段就有了多轮对话的可能性,但是如何对用户的语音进行理解就成为了语音交互的技术瓶颈了。
最近两年,各大公司都出了自己的智能家居音箱,例如amzonecho和Googlehome这类的纯语音设备。在未来的生活和工作场景中语音交互是一个新的入口,它提供了更灵活的交互方式,在未来的某一天人们必然会放弃屏幕和手势的操作,可以通过语音进行远距离的设备控制,这是各大公司抢占语音市场的原因。
第二:在语音界面的设计中,vui应该注意什么?
首先我们先了解下什么是vui,其实它就是voiceuserinterface的简称,在我个人看来,vui设计和普通的互联网的设计没有太多的不一样,如果非要说区别的话,我个人认为vui设计所接触和涉及的范围更广。主要有下面几个工作内容:第一:进行用户研究,了解用户是谁,需要思考用户是谁以及在系统和终端之间从开始到结束的整个对话过程;第二,负责产品的原型设计和产品描述,描述系统与用户之间的交互行为。第三,描述系统与用户之间的交互行为并考虑需要处理的请求,通过分析数据来了解系统在什么地方发生了问题,最后进行系统问题的排查和改进。
另外,Vui设计师在设计一个产品的时候,需要考虑你的产品是什么类型的,他的主要功能是什么,是多模态产品还是纯语音的硬件设备。在设计过程中可以通过示例对话的方式让vui设计师真正的了解产品,知道用户在和产品对话时会发生什么样的情况。
第三:语音界面设计的常用规则有哪些?
1、命令控制模式对话模式
另外,在设计语音产品之前我们需要了解一些语音识别技术,从而让你的vui系统得以创建,在系统对人的语音理解方面分为两大类:asr:自动语言理解和nlu自然语言理解,目前的发展阶段已经到了自然语言理解的阶段。机器通过处理和理解文本,采用云处理的方式对用户语音进行识别和理解从而判断指令给出正确的反馈。
一般的vui系统在对话模式上可以分为:命令控制模式对话模式,语音指令模式下用户在说话前必须要给系统明确的指示。目前大多数的vui系统都是采用这种模式。例如:Siri要求用户在说话前必须先按下主屏幕或者在Siri页面按下麦克风图标。
对话模式情况下当出现较长的对话时,没有必然让用户在说话前总是告诉系统用户要开始说话了,当然这是建立在用户大致知道对话模式已经改变的情况下才会这么做,一般来说一个语音系统都会有命令控制模式和对话模式的切换。
在视觉的表现上两者都需要有明确的物理图标和明确的唤醒词语,在对话模式中轮流对话更为自然,在视觉上需要有明确的开始和结束的封闭式对话标示。
2、确认策略
所有优秀的vui设计,都必须确保用户感觉到自己是被理解的,所以我们需要在设计原则中添加一个确认策略。确认策略的设计是因为在很多环境下机器并不能完全的识别用户所说的问题,同时在生活场景下,例如购物支付等场景,需要用户的再次确认,这个时候vui的确认策略就派上用场了。
在设计确认策略的过程中我们需要了解几个问题:交互问答的错误后果是什么?系统需要什么样的方式怎么反馈?屏幕需要显示出什么?用户需要用什么样的手段进行确认等。
在确认的形式上可以分为两大类:显性确认和隐性确认,显性确认即强制用户确认信息,例如:判断是否确认支付,这一类型的产生的后果还是挺严重的,需要强制用户确认信息,此时用户只需要回答是或者否即可。
隐形确认通常采用的方法有下面几种:三级置信度隐性确认非语言式确认通用确认视觉确认。
这种方法系统通过对不同阈值的判断,给出不同的信息确认,一般情况下分为三种阈值情况,因此也就是三级置信度的设计。对于移动设备,视觉确认是一种常用的方法,一般情况下系统会同时提供音频和视觉确认。在多模态的设计中,屏幕上可以出现可视化的列表。比如我们的语音助手,用户说打开或者关闭语音助手,那么相应的麦克风图标会有消失和出现的动效。答案连同原始的问题一起回复Siri通过视觉上的可视化列表和语言上的隐性确认来回复我的问题。
非语言的确认方式也就是行动反馈,不需要口头进行确认,例如假如正在创建一个语音控制灯光的系统,当你说打开灯光的时候,灯自然就会打开,此时已经给了你一个反馈,不需要进行语音进行提示了。在纯语音设备或者系统下,可以提供一个行为反馈,例如光效等。
Vui系统在说话的时候,确认用户是否可以打断,现在一般的语音智能听到唤醒词才会停止说话,唤醒词应在本地处理,设备一直处于接收唤醒词的状态。多模态形式下,一般是不可以打断的,可以用可视化列表,如Siri不可以打断对话。
3、异常情况处理
异常情况处理在语音识别和指令的场景下异常情况极为普遍,例如:未检测到语音,语音终止超时和无语音超时;检测到语音但是没有识别出来;正确识别但是系统无法处理;部分语音识别错误等异常情况,不同的异常情况也对应不同的异常情况的处理方式,具体的方法看下图:
在这种情况下系统留给用户说话和思考的时间,某些场景下可以调整时间和灵活度。例如开始启动siri时,是用户主动的一个行为,用户不需要进行思考;然后当系统问用户某一问题时,需要用户思考,那么这个时候需要的时间就不一样了。
当用户唤醒了vui系统,无语音超时发生的情况有几种:用户没有说话或者是用户说话声音小。这个时候需要提供一个视觉上的一个退出按钮。这种帮助类似于我们在填写表单时,视觉的框里会告诉我们应该用什么格式填写。
这个可能与语音识别技术相关联在一起了。比如说我们的语音助手,用户说打开word,系统列出:打开word打开我的打开卧底等等。
第四:语音的发展趋势
例如上下文语意的理解,当然我们对siri说我想吃汉堡它列出了几个附近的餐馆,当用户说好腻,不吃了,这个时候就需要系统理解上下文的语境从而给出正确的判断。
在消除歧义方面,当系统问用户,你的主要症状是什么?而用户说的是发烧和感冒,系统就要理解用户说的是两个症状,针对这个事情,系统需要进行回复两种不同的症状解决方式。
情感和情绪分析则需要机器进入强人工智能了,让机器理解人的情绪和情感从而给出对应的有情感的回答,不在是冷冰冰的机器,这永远是一个未来的发展方向。
对于高级自然语言的理解目前还处于初级阶段,目前,Siri和cortana出发处理问题的时候,会提供一个网页搜索,并不会直接回答你的问题,但高级自然语言理解可以听懂你说的话,直接回答。
卸指甲油妙招常规卸除法真的弱爆了卸指甲油妙招1准备物及制作方法准备物:一块带海绵的百洁布,一个空玻璃瓶,一把剪刀,一瓶卸甲水。STEP1:把百洁布海绵的那一块剪下。STEP2:卷起来后……
未得到与已失去我们常常要透过别人这面镜子,才能了解自己。但既然是镜子,就有可能变形或扭曲。这时,我们要靠自己敏锐感觉看清楚自己。每当你觉得快乐或不快乐,满足或不满足时,你都清楚地跳出来看一下……
父母老了这些话请不要说01hr不管他们是否养育过你,至少母亲曾十月怀胎并把你生到这个世界上,能看到这世界的一切,美的、丑的、恶的、好的,都是上帝和父母赐予你的,不要做会让自己后悔的事,请好好对自己的……
股指期货开户需要什么条件股指期货开户,是投资者到期货公司开立期货账户进行股指期货交易的行为,一般来说,股指期货是资深投资者才会参与的交易,对投资者的准入条件很严格。下面我就来说说股指期货开户需要什么条……
社保可以退吗社保符合条件可以退,退社保需要满足的条件:参保人移民国外、参保人死亡其继承人申请退保、同一时段重复参加社会保险的、达到法定退休年龄,累计缴费不足15年,本人要求不转入农保或者城……
淘宝直播如何快速吸引人气积累粉丝,是直播的基本,也是长人气之根本。新人要想站住脚,就需要在一定时间内积累大量的粉丝。对于淘宝直播和淘宝卖家来说,粉丝量的多少决定店铺销量的高低。直播怎么吸引人气,对淘宝……
再不重视微淘你的店铺可能就真的凉了微淘发展初期是给了很多店铺流量的红利,但是发展至今,微淘已经成熟,官方给流量的使命已经完成!微淘要靠商家来完成它本身的使命,就是实现店铺和平台粉丝经济的价值。工具有了,你……
做微商感到穷时这条建议总有一条适合你年底是一个缺钱的时候,对于微商人来讲,有很多人没有赚到太多的钱,甚至有亏损,越是缺钱,越会感觉到年终的压迫感。本着有问题就解决的心态,如果你做微商做到缺钱,我给你下面14……
深度讲解细看如何做好微商会种引流方法不如懂一种引做微商没有经验?不会引流?不知道怎么让精准客户加你?先让我来说说你的痛点,如果没有说中,请直接关闭!1、天天发朋友圈就是没有买家咨询。2、没有一个好的加粉技巧……
翰墨飘香邵东市老年大学翰墨艺术团主办第五期春联春联,是我国人民为欢度春节延续几千年的传统文化,经久不衰。为迎接庚子年春节,做好送春联下乡的准备工作。乘庆祝中华人民共和国成立……
天冷了除了谈恋爱什么都不想干年岁渐长,十点君发现,身边同龄人的爱情,越来越平淡如水了。刚定下婚期的柚子跟我抱怨,恋爱谈了四年,从热恋爱到平静,如今她突然有些惶恐了,如果婚后的爱情再从平静变成了平淡怎……
老人长寿抗衰老药膳来源:民间药膳方原料:松子仁、核桃仁各30克,蜂蜜250克。制作:松子仁、核桃仁用水泡过去皮;然后研成末,放入蜂蜜和匀即成。服法:每日2次,每次取1汤匙,用滚……
排毒方法有哪些九偏方帮你给肠子洗个澡定期排毒对我们的身体健康是有很大的好处的,你知道我们该如何排毒吗?哪些方法能够帮助我们的肠子洗个澡呢?今天小编就为大家推荐一些排毒的小偏方,来帮助大家排除毒素一身轻松!如……
家长自身缺乏安全意识的危害很多家长自身缺乏安全意识,什么事情都不以为然,觉得没有什么大不了,这样的思想就会灌输给孩子,就会使得孩子受到伤害,家长自身缺乏安全意识的危害有哪些?儿童往往心智都不成熟,……
救生员水中换气的技巧水上救生工作是一项拯溺救难的高尚工作。贯彻:以防为主,以救为辅,防救结合,有备无患的精神。健全组织,重视安全教育以防止游泳事故发生,不仅对保证游泳者安全有重大意义,而且对开展全……
万次火柴可以点火多少次万次火柴可以点火多少次?如果按照产品名称来理解的话,万次火柴应该能点火一万次,但产品使用过程中至少会有12成的损耗所以你也就不用满打满算了哦。以下是本站带给大家的相关详情,望参……
晨跑对肠胃有好处吗晨跑要提高步频,需要减小步幅,用前脚掌或者全脚掌落地,落地以后快速起脚,起脚不要太高,同时手臂摆动结合起来,手臂摆动与起脚要协调一致,多训练多观察,每次跑完对比下步频的变化,那……
备孕不能吃的干果有哪些干果是女性的最爱,平时闲来无事总是想吃点,就算是不喜欢吃干果的人,也不能保证怀孕后不想吃干果,因为女性怀孕会身体内环境在发生巨大的变化。备孕不能吃的干果有哪些呢?就让本站的小编……
孕期为什么要测量血压孕期就是怀孕周数,医学上的孕期是指从末次月经的第一天(并不是从同房的那天算起)开始,到分娩结束,了解孕期知识。通常为四十周。下面就请大家进入今天的孕婴安全小知识学习时间,孕期为……
地铁遇到性骚扰怎么办咸猪手是伤害女人的一类人的武器。很多女生都遇到过这样的问题,在公交车和地铁中,人比较密集的地方,尤其是地铁,更是很多咸猪手的有利场所。地铁遇到性骚扰怎么办?地铁遇到性骚扰……
黄土滑坡的特点黄土滑坡中的黄土是一种具有特殊物质成分、形态和性质的多孔隙弱胶结的松散沉积物,第四纪以来广泛分布在世界上许多国家和地区。我国黄土覆盖面积广阔,约为63。5l04km2,主要分布……
肺气肿老人做什么运动好肺气肿老人做什么运动好?临床表现为呼吸困难,一般劳动或活动即可引起呼吸困难,易反复发生呼吸道感染,桶状胸,肺部叩诊呈高清音,肝浊音界下降,病人易疲劳,常有口唇青紫,呼气延长。肺……
山体滑坡的形成原因及应对措施山体滑坡是一种自然灾害,是受暴雨、强降雨的影响从而诱发导致泥石流的主要原因之一,山体滑坡的发生往往会给人们的安全造成危害,不仅会摧毁道路和房屋,还会导致人员的伤亡。那么山体滑坡……
家长处理儿童吞食异物应讲究科学不可乱弄气管异物多发生在5岁以内儿童,尤其是刚学会走路到3岁之间的宝宝最多见。宝宝喜欢将瓜子、花生米、果冻、纽扣、硬币等放入口中,在哭、笑或者吸气时很容易吸入气道。而家长处理儿童吞食异……