【专利解密】华为让语音处理更准确、合理

来源:爱集微 #专利解密#
5662

【嘉德点评】华为的该项技术当中,语音系统为多个NLP引擎的每一个识别结果进行打分,最后确定一个或多个识别结果以及输出次序,并按次序向用户输出该一个或多个识别结果,可以实现对引擎的筛选,做到优中选优。

华为在2013年1月提出了一种语音处理方法,并提供了系统和终端。该发明可以利用到多个厂商的技术,从而可以根据实际需求得到各种侧重点不同的搜索结果。

图1

图1所示为语音处理方法的系统框图。S110在获取一个录音片段流之后,可以将该录音片段流发送至多个自然语言处理NLP引擎,其中,NLP引擎处理的录音片段流可以由终端直接发送,也可以通过代理服务器获取。

每个NLP引擎收到录音片段流之后即可进行识别,进而获取一个或多个识别结果,并对每一个识别结果进行打分,最后将获取到的识别结果以及每一个识别结果的分数发送给终端。

具体地,在接收到来自于多个NLP引擎中的识别结果之后,打分系统可以对NLP引擎的本次识别结果进行打分。一方面,打分系统可以根据每一个NLP引擎的响应时间、给出识别结果的多少或识别结果的离散程度,对每一次识别结果进行打分,并根据总分对识别结果进行排序。另一方面,用户可以根据实际需求,设定不同的得分权重来控制总得分中各项得分的比例。

S130根据来自于多个NLP引擎的识别结果,确定一个或多个识别结果以及输出次序向用户输出(例如,通过显示器或扬声器向用户输出),供用户选择。

图2

图2所示为终端200的示意性框图,发送单元210将语音发送至多个NLP引擎进行识别,以获取识别结果。

接收单元220接收多个NLP引擎的识别结果之后,由确定单元230对NLP引擎的每一个识别结果进行打分,并确定一个或多个识别结果以及输出次序。

输出单元240根据输出次序向用户输出一个或多个识别结果。

图3

图3所示为终端300的示意性框图,存储器310存储一组程序代码,处理器340调用存储器310存储的程序代码,执行以下操作:

将语音通过发送器330发送至多个NLP引擎进行识别,以获取识别结果;

接收器320接收来自于多个NLP引擎的识别结果;

处理器340对每一个识别结果进行打分,确定一个或多个识别结果以及输出次序;

输出装置360根据输出次序向用户输出识别结果。

图4

图4是语音处理系统400的示意性框图。终端410即为上文介绍的终端200和终端300。图中的多个引擎430接收终端发送的语音后,对语音进行识别,以获取识别结果,并将获取的识别结果发送至终端。代理服务器430用于接收终端发送的语音,并将所述语音转发至多个NLP引擎。

在该发明中,通过将语音发送至多个NLP引擎,使多个NLP引擎分别对语音进行识别,以获取识别结果;接收来自多个NLP引擎的识别结果;根据来自多个引擎的识别结果,向用户输出可供用户选择的识别结果,可以使多个NLP引擎为用户的一段语音进行处理。该发明可以利用到多个厂商的技术,从而得到各种侧重不同的结果。

在上述系统中,系统可以为多个NLP引擎的每一个识别结果进行打分,最后确定一个或多个识别结果以及输出次序,并按次序向用户输出一个或多个识别结果,可以实现对引擎的筛选,做到优中选优。(校对/ Jurnan )

专利号:CN103077718B

责编: 刘燚
来源:爱集微 #专利解密#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...