欢迎访问天云祥深圳服务外包      联系人:洪胜      服务热线:4008875538      电话:13530954096 (微信号)
天云祥深圳呼叫中心
洪胜 13530954096

深圳单词识别与语音搜索与语音识别

发布时间:2022-04-28 08:50:19 人气:1913 来源:天云祥客服外包

我们探讨了单词识别、语音搜索和语音识别之间的差异。

功能客户定义一个或多个关键字列表。同时,他定义了语音引擎应该分析哪些呼叫(已经存在或未来的呼叫)。

列表将与调用数据一起传输到引擎。引擎分析音频数据并提供结果(“在哪些通话中会检测到哪些关键字,以及可信度如何?”)。

基本方法创建关键字列表的目的是从所有记录的通话中检测与用户相关的通话。

示例:

通话中提到竞争对手的名字投诉通话中提到产品名称,正在进行营销活动通话中涉及特殊流程,例如sim卡增值解锁–QM

关键字识别可用于从所有录音中筛选相关通话。这可能是出于两个目的之一:一方面是为了发现关键呼叫,以便找到具体的改进需求,另一方面是为了筛选好的或差的呼叫,作为培训目的的“更佳/最差实践”示例。

示例:根据资格标准,为处理困难客户提供培训,尤其是那些报告投诉甚至违反现有协议的客户。教练会定义一个关键词列表,并分析经纪人的电话。然后,如有必要,可以向代理发送指导模块。

附加值——培训经理或主管为评估特定流程找到具有代表性的真实通话选择的过程非常复杂。通过对关键字的专门定义,系统可以完成预先选择。

示例:“为什么在处理SIM锁呼叫期间,呼叫处理时间(CHT)增加了?”关键词识别的实现:

使用关键词列表搜索通话:“移动、编码、模拟锁定、问题、解锁”收听通话,并将CHT增加的所有通话记录到数据收集计划中,例如,在诺基亚手机解锁过程中,使用增强的关键字列表对通话进行新的搜索:“Nokia、Code、Simlock、Problem、unlock”监听定位的通话显示了诺基亚通话花费更长时间的原因:在这种情况下,诺基亚手机的输入路由过于复杂措施:制定流程说明(在本例中,为代理商提供指导,向客户解释如何输入解锁码,与诺基亚合作必须遵守哪些步骤,例如客户重复特定按钮的速度。

附加值–营销营销活动开始后,营销经理要检查客户是否认可营销活动的核心陈述,以及营销活动的预定目标是否实现。

示例:

是一种特殊的低成本DSL连接和WLAN路由器捆绑产品。用户定义了一个关键字列表,其中包括:呼叫、冲浪、2000、4000、6000、订单、应用程序、安装、路由器。引擎分析呼叫,让营销经理能够控制客户是特别要求捆绑包还是WLAN路由器。附加优势:

营销行动短期优化的可能性成功控制:我能联系到我的客户吗?搜索提及竞争对手的通话,目的是竞争分析语音到文本(语音识别)与关键词识别相比,通过语音到文本转录,整个通话将以文本形式呈现。基本上,检测器进行单词分类,也就是说,它搜索可能的更佳性能。

转录是在记录的通话中执行的,不是实时的。在重播通话时,会显示录音。与呼叫re平行播放相关的课文将突出显示。通过点击突出显示的文本段落,可以导航音频回放。

因为整个文本都保存在数据库中,所以可以执行搜索项的任何组合来查找相关调用。

要了解联络中心如何使用语音识别,请阅读我们的文章:什么是语音识别软件以及联络中心如何使用语音识别软件?

实现

可以显示通话的文本表示,文本与重播同步。

不同扬声器的通话显示不同。此外,根据通话中的静音,还可以淡出敏感数据(姓名、客户信息等)。

场景基本方法:基本上,转录涵盖了所有搜索和筛选关键字的可能性。除此之外,转录还具有以下优势:

可以快速检测通话内容(比接听通话更快),在搜索过程中不受预定义关键字的限制,可以进行分析操作:内容分析、分类、分类、,呼叫模型检测自动评估的基础流程将呼叫内容转移到业务信息和数据仓库系统(将结构化和分析非结构化数据)增值–流程管理转录允许结构化非结构化呼叫数据,以便可以轻松导入和处理到其他系统。这意味着可以在ERP或CRM系统中处理内容,以分析客户联系流程的不同步骤,并发现操作中可能存在的问题。

转录可以作为通过数据挖掘进行内容分析的基础。此外,呼叫模式检测和内容分析是发现工作流程中“绊脚石”的重要来源。

增值——营销转录意味着可以对非结构化通话数据进行结构化,以执行与活动相关的分析。与营销问题相一致的

数据挖掘可以提供有关营销措施是否有效的重要信息。

示例:在通话中搜索特殊的营销口号(文本);查看以下客户反应的请求和输出。

语音搜索在上述基本语音识别方法中,识别器尝试将所有输入语音转录为词汇表中的一系列单词。关键词定位是一种不同的技术,用于在音频中搜索特定的单词和短语。在这种方法中,识别器只关注一个关键字或短语的出现。由于必须计算单个单词的分数(而不是整个词汇表),因此需要的计算量要少得多。然而,这种方法不能实时工作。因此,一种被称为基于语音的搜索的新关键字检测器已经被开发出来,它执行单独的索引和搜索阶段。这样一来,搜索速度就成功地达到了实时搜索速度的数千倍。

基于语音的搜索旨在通过大量媒体进行极快的搜索,允许搜索单词、短语、行话、俚语和其他在语音到文本词典中找不到的单词。

索引在阶段,对输入语音进行索引,以生成语音搜索轨迹(或晶格)。这只需要做一次。索引引擎使用声学模型扫描输入语音,并生成相应的语音搜索轨迹。声学模型共同表示声学通道(发出语音的环境和记录语音的传感器)和自然语言(人类在其中表达输入语音)的特征。音频通道特性包括:频率响应、背景噪声和混响。性格自然语言的发音包括性别、方言和说话者的口音。

注意,一旦索引完成,搜索过程中根本不涉及原始媒体,搜索轨迹可以在可用的更高质量媒体上生成,以提高准确性(例如:用于电话的μ-律音频),但随后音频可以被压缩表示替换,用于存储和后续播放(例如:GSM)。

搜索第二阶段是搜索语音搜索轨迹,在需要搜索单词或短语时执行。索引完成后,可以对任意数量的查询重复此搜索阶段。由于搜索是语音的,搜索查询不需要在任何预定义的字典中,因此可以搜索专有名称、生词、拼写错误的单词,术语等

查询术语中的每个单词都会引用语音词典,以容纳不寻常的单词(其发音必须针对给定的自然语言进行专门处理)以及非常常见的单词(性能优化是值得的)。在字典中找不到的任何单词都可以通过查询拼写-语音转换器进行处理,该转换器根据单词的正字法生成可能的语音表示。

解析查询词中的单词、短语、语音字符串和时态运算符后,实际搜索开始。在一次搜索过程中,可以高速扫描多个语音搜索轨迹文件,以查找可能的语音序列(可能由时态运算符指定的偏移量分隔),这些语音序列与查询词中对应的音素字符串紧密匹配。匹配算法是概率的,允许生成代表匹配正确性的置信度的分数。这意味着系统用户可以指定置信限作为搜索的一部分,以优化命中率(即,在避免错误命中的同时,尽可能多地找到正确的术语)

语音搜索比语音到文本和关键字识别速度、准确度和可伸缩性的优势。一次性索引阶段允许较高的准确性,因此当呈现特定的查询词时,搜索阶段可以做出更好的决策。开放词汇。语音文本转换系统只能识别词典中的单词。许多常见的查询词(如专业术语和人名、地名和组织名)通常会从这些词典中删除(部分原因是为了使它们足够小,以便能够以经济高效的方式实时执行识别,还因为随着新术语和名称的不断发展,这些类型的查询词明显不稳定)。语音索引不关心这些语言问题,保持完全开放的词汇(或者更准确地说,完全没有词汇)。对生词的惩罚很低。语音识别词典可以用新的术语、名称和其他单词进行更新。然而,这在拥有成本方面会造成严重的损失,因为整个媒体档案必须重新处理。另一方面,语音搜索架构中的词典只在搜索阶段查阅,与索引相比,搜索阶段相对较快。添加新词只会引发另一次搜索,而且通常不需要添加单词,因为拼写到声音引擎可以自动处理大多数情况,或者用户只需输入单词的声音版本。语音和拼写不准确。专有名称是特别有用的查询词,但对语音识别系统来说也特别困难,这不仅是因为它们可能不会出现在上述词典中,而且还因为它们通常有多种拼写。通过语音搜索,不需要拼写。进一步阅读音频挖掘贡献者Nexidi

最近更新

客户服务
live chat
点击这里给我发消息