智能对话系统,智能对话系统的缺点

http://www.itjxue.com  2023-01-14 04:17  来源:未知  点击次数: 

AI语音为什么像人工智障,机器人有办法理解人类语言吗

国外有siri亚马逊,国内有小爱小艺等,AI语音助手已经全面在全球都开花落地了,但是这个东西本来被称为人工智能,实际上应用效果让大家都比较的尴尬,所以赠予了一个爱称叫人工智障,确实,以现在人工智能语音的理解能力与表达能力来说,智能不至于,智障绰绰有余。

机器人理解人类语言的难点

经过了数万年的发展,人类的语言已经进化得非常巧妙,语言要满足以下这几个特点才能被广泛传播,第一就是它要足够简单易懂,第二就是它必须用尽量简单的语言表达各种复杂的情况,总结来说,同一句话必须在不同的环境下有不同的意思,以满足最简单的语言系统能表达最复杂情况的条件。

举一个例子,哈哈多数情况下代表着开心,但有时候它代表着愤怒,有时候代表着冷漠等情绪,而且这是其他人很容易读懂的情绪词,通过不同的环境语义,旁人深有感触,但你指望一个机器人读懂它,这怎么可能。

说了这么多,大家应该知道原来的语言有多么的复杂了吧,机器人们理解不了你的语言,这也是没办法的,目前,苹果的siri已经是放弃挣扎了,基本上只会按照人工智障的模式,回答一些最简单的问题,推荐一下最简单的产品。

而国内的语音助手在抢夺市场地盘上频出奇招,通过程序员与策划运营编写的段子,它能在一些比较常用的语境情况下,答出最有效果的标准答案,它并不懂这些,但程序员写好了它遇到这些常见情况应有的回答,所以它的本质虽然还是人工智障,但至少是个披着智能皮的智障。

读懂语境,有可能吗?

想要跟一个人进行对话最重要的是倾听,也就是说机器人在未来必须要读懂人那一句话的意思,这涉及到了非常复杂的语境问题,对千变万化的语言系统而言,机器人真的有可能读懂吗?

目前谷歌在这个领域进行了两个尝试,分别是LaMDA、MUM,前者是智能连续对话系统,后者是语境理解系统,智能对话系统会进行拟人化,语境理解系统会主动搜索你提到的东西,并且结合不同的天气、环境甚至是你的心情来综合判断它,目前谷歌这个AI模拟效果也是很差,但至少算是未来AI发展的一种可能性。

写下所有的可能性,训练所有的情况

在未来,AI发展有两种前进的路径,第一是跟目前国内很多公司在做的那样,写下所有的可能性,第二是做出足够多的模型让AI去学习,训练所有的特殊情况,这样一来不管它遇到了什么奇奇怪怪的问题,都能拥有完美的回答。

但问题是,不管是第1种还是第2种可能性,都必须要满足前提条件读懂,就算是一句谢谢,如果你无法识别当下的语境是愤怒,而傻乎乎以为是开心,你的回答怎么看都会让本就糟糕的事情更糟。

所以就算大家为AI制造了再多完美的回答,匹配了任何一种情况,如果AI无法识别当时是什么情况,应该用哪句话来应对的话,人工智障依然只是人工智障,所以这一切的大前提是它必须要读懂,但如果已经能够做到智能读懂了,为什么不能做到智能回复?而如果已经做到智能回复,那么它是否已经属于生命了呢?

智能ai对话轻量级模型和重量型区别

智能ai对话轻量级模型和重量型区别在于,起源于图灵测试的AI对话系统,是人工智能领域最重要的研究方向之一。如果说自然语言处理是人工智能“皇冠上的明珠”,那么AI对话系统则是自然语言处理中最难、最核心的任务之一,是“明珠中最亮的那颗”。因此,AI对话系统被认为是衡量人工智能发展水平的重要因素,代表了人工智能的发展方向。在工业应用领域,AI对话系统呈现出“爆炸式”增长的态势,如以“小度”“小爱”为代表的智能助理,广泛应用于个人助理、智能家居、智能 汽车 中,还有以谷歌对话机器人Meena、Facebook聊天机器人Blender为代表的开放域闲聊产品中,与大众日常生活紧密相关。

近年来,随着深度学习技术的不断发展,AI对话系统已经从基于规则的第一代和以传统机器学习为核心的第二代,发展到以大数据和大模型为显著特征的第三代,对话能力产生了革命性变化,在开放话题上展现了惊人的对话能力,对进一步推动人工智能产业发展、实现智能化具有巨大意义和价值。

人工智能语音系统是什么

AI语音,即智能语音技术,以语音识别技术为开端,是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。

AI语音技术是最早落地的人工智能技术,也是市场上众多人工智能产品中应用最为广泛的。

人机对话系统简介

人机对话,是人工智能领域的一个子方向,通俗的讲就是让人可以通过人类的语言即自然语言与计算机进行交互。很多同学不清楚聊天、问答和任务驱动型对话有什么区别,相信读完这篇文章后会明白一些。

人机对话系统可以分为四个子问题:闲聊、任务驱动的多轮对话、问答和推荐。闲聊分别与问答和任务导向型对话都有交叉,所以实际应用基本上都包含多个子任务。其中,闲聊、问答和任务驱动的多轮对话都是用户先挑起话题,对话系统被动的进行响应。而推荐是对话系统主动向用户推送一些用户感兴趣的信息或服务。

在用户的话语并无明确的信息或服务获取需求的情况下,系统需要做出回应。闲聊在现有的人机对话系统中,主要起到拉近距离,建立信任关系,情感陪伴,顺滑对话过程的作用。

用户具有明确的目的,希望得到满足特定限制条件的信息或服务,例如:订餐,订票,寻找音乐、电影或某种商品等等。因为用户的需求可以比较复杂,可能需要分多轮进行陈述,用户也可能在对话过程中不断修改或完善自己的需求。此外,当用户的陈述的需求不够具体或明确的时候,机器也可以通过询问、澄清或确认来帮助用户找到满意的结果。

不同于信息检索根据用户的问题给出一个相关链接,问答系统直接给出精准的答案。问答系统和任务驱动的多轮对话最根本的区别在于系统是否需要维护一个用户目标状态的表示和是否需要一个决策过程来完成任务。目前,解决问答的方法可以划分为三种,基于信息检索的问答、基于知识图谱的问答和基于阅读理解的问答。

推荐系统根据历史聊天记录或者用户画像为用户主动推荐用户感兴趣的信息或者服务。

商业应用的人机对话系统根据应用的场景不同既可以是同时综合问答、闲聊、任务导向的多轮对话和推荐全部或部分任务的复杂系统,也可以是单纯解决其中一类问题的系统。例如大家熟知的苹果Siri、微软Cortana、百度度秘等语音助手类产品就是集合上述四类问题综合系统,但是主要研究发展任务导向型对话,其中Siri和Cortana的聊天功能并不能算开放域,而是人工为高频的问题编辑了对应的回答,当用户的聊天不在预先配置的范围内时,系统则回复“我听不懂”之类的固定答案。而度秘的开放域聊天则是应用了更先进的基于海量数据的检索式聊天技术。目前的智能客服类系统则多以解决问答和推荐类问题为主;微软小冰主要发展EQ,研究开放域聊天;而许多订票,订酒店类的对话系统则是任务驱动的多轮对话的典型应用。

[1] Li, F. L., Qiu, M., Chen, H., Wang, X., Gao, X., Huang, J., et al. (2018). Alime assist: an intelligent assistant for creating an innovative e-commerce experience.

[2] Chen, H., Liu, X., Yin, D., Tang, J. (2017). A survey on dialogue systems: recent advances and new frontiers. Acm Sigkdd Explorations Newsletter, 19(2).

[3]

[4]

[5]

[6]

[7] 第一张图片引自知乎用户悟忌(找不到链接了)

注:本文旨在分享交流,如有错误之处,请批评指正。后期将不断更新~

(责任编辑:IT教学网)

更多

推荐淘宝营销文章