上期比较详细的揭晓了苹果AI助理Siri可以实现的功能,这期依旧根据专利号为CN102792320的专利来揭晓实现苹果AI助理Siri的功能原件及其应用。

图1
图1所示,专利中揭晓了一种用于操作自动化助理的方法,其包括:从自用户接收的语音输入1004获得文本字符串;解译所述所接收的文本字符串以得到用户意图的表示,所述解译至少部分地基于永久的长期个人存储器1052和短期个人存储器1054,其中所述永久的长期个人存储器1052包括与所述用户相关联的多个字,以及其中所述短期个人存储器1054包括与所述自动化助理的当前用户会话相关的数据;至少部分地基于用户意图的所述表示而识别任务以及用于所述任务的至少一个参数;执行所述所识别的任务;以及将输出提供给所述用户1008,其中所述输出10008与所述任务的所述执行有关。
具体地,图1所示,智能自动化助理1002可包含多种不同类型的组件、设备、模块、 过程、系统等,等(或其组合)中的一者或一者以上:一个或一个以上主动本体1050 、主动输入引出组件1094(可包含客户端部分1094a和服务器部分1094、短期个人存储器组件1052(可包含主版本1052b和高速缓冲存储器1052a)、长期个人存储器组件1054(可包含主版本1052b和高速缓冲存储器1052a)、域模型组件1056 、词汇组件1058(可包含整个词汇1058b和子集1058a)、语言模式辨识器组件1060 (可包含完整库1060b和子集1560a)、语言解译器组件1070 、域实体数据库1072 、对话流处理器组件1080 、服务编排组件1082 、服务组件1084 、任务流模型组件1086 、对话流模型组件1087 、服务模型组件1088 、输出处理器组件1090。
主动本体1050:主动本体1050 可以充当统一架构、执行环境;当它充当统一架构时其整合来自智能自动化助理1002的其它部分的模型、组件或数据,在计算机和信息科学领域中,本体提供用于数据和知识表示 的结构,例如类/类型、关系、属性/特性,以及其在例子中的例示。本体例如用以建立数据 和知识的模型。在智能自动化系统中本体是在其中构造例如域模型等模型的建模框架的部分。
当充当执行环境时,主动本体1050可为可操作的,用来执行和/或实施各种类型的功能、操作、动作和/或其它特征。例如充当建模和开发环境其整合来自各种模型和数据组件的模型和数据,包含域模型 1056、词汇 1058、域实体数据库1072、任务流模型1086、对话流模型1087 、服务能力模型1088。充当数据建模环境,基于本体的编辑工具可在其上操作以开发新的模型、数据结构、数据库基模以及表示。充当实况执行环境,其例示域1056、任务1086和/或对话模型1087、语言模式辨 识器和/或词汇1058的元素的值,例如在短期个人存储器1052、长期个人存储器1054 和/或服务编排1182的结果中找到的用户特定信息。举例来说,主动本体的一些节点可对应于域概念(例如餐馆)以及其特性(餐馆名称)。在实况执行期间,这些主动本体节点可用特定餐馆实体的身份及其名称以及其名称如何对应于自然语言输入表达中的字来例示。 因此,主动本体正用作指定餐馆为具有身份(其具有名称)的实体的概念的 建模环境,且用于存储那些建模节点与来自实体数据库的数据以及自然语言的解析的动态绑定。
主动输入引出组件1094 :主动输入引出组件1094(如上文所述,其可实施于独立配 置中或包含服务器和客户端组件两者的配置中)可为可操作的,以执行且/或实施各种类 型的功能、操作、动作和/或其它特征,例如引出、促进和/或处理来自用户或用户的环境的输入或关于用户的需要或请求的信息。举例来说,如果用户正希望找到餐馆,那么输入引出模块可获得关于用户对位置、事件、菜系、价格等的约束或偏好的信息。
词汇1058:词汇1058,举例来说,可建议与当前输入匹配的字或短语,词汇可与主动本体、域模型、任务模型、对话模型和/或服务模型中的任一节点或一个或一个以上节点相关联。
域模型1056:域模型1056,其可约束可例示或以其它方式与域模型一致的输入。举例来说,域模型1056可用以建议将与当前输入一致的概念、关系、特性和/或例子。
语言模式辨识器1060:语言模式辨识器1060,其可用以辨识当前输入中的惯用语、短语、语法构造或其它模式,且用以建议填充所述模式的完成。
域实体数据库1072:域实体数据库1072,其可用以建议与输入匹配的域中的可能实体(例如,商店名称、电影名称、事件名称等)。
短期存储器1052:其可用以匹配任何先前输入或先前输入的部分,和/或关于与用户交互的历史的任何其它特性或详情。举例来说,可将部分输入与用户在会话中已遇到的城市匹配,不管是假想地(例如,在查询中提到)且/或实际的(例如,如从位置传感器确定)。
长期个人存储器1054:长期个人存储器1054,其可用以建议匹配来自长期存储器的项目。此些匹配项目可包含(例如)以下各者中的一者或一者以上或任一组合:被保存的域实体(例如,“喜 爱的”餐馆、电影、剧院、比赛地点等)、待办事项项目、列表项目、日历条目、联系人/地址簿 中的人名、联系人/地址簿中所提到的街道或城市名,等等。
任务流模型1086:任务流模型1086,其可用以基于任务流中的接下来的可能步骤而建议输入。
对话流模型1087:对话流模型1087,其可用以基于对话流中的接下来可能步骤而建议输入。
服务能力模型1088:服务能力模型1088,其可用以通过模型中的名称、类别、能力或任何其它特性来建议要使用的可能服务。举例来说,用户可键入优选的评论点的名称的部分,且助理1002 可建议用于查询所述评论点以进行评论的完整命令。
对话流处理器组件1080:用于对于给定问题或任务,在给定用户意图的表示的情况下,识别任务或问题的参数。举例来说,用户可能正在寻找在用户的家附近的供应意大利食物的被推荐的餐馆。对被推荐的、供应意大利食物的且在家附近的餐馆的约束是寻找餐馆的任务的参数。也可以在给定任务解译和与用户的当前对话的情况下,例如其可在个人短期存储器1052中表示,选择适当的对话流模型,并确定流模型中对应于当前状态的步骤。
服务编排组件1082:智能自动化助理1002的服务编排组件1082执行服务编排程序。动态且自动地确定哪些服务可满足用户的请求和/或指定的域和任务;以同时和循序排序的任一组合动态且自动地调用多个服务;动态且自动地变换任务参数和约束,以满足服务API的输入要求;动态且自动地监视并搜集来自多个服务的结果;动态且自动地将来自各种服务的服务结果数据合并到统一结果模型中;编排多个服务以满足请求的约束;编排多个服务以对具有辅助信息的现有结果集合作注解;以统一的独立于服务的表示输出调用多个服务的结果,所述表示统一来自各种服务的结果(例如,作为调用返回餐馆列表的若干餐馆服务的结果,合并来自若干服务的 关于至少一个餐馆的数据、去除冗余)。
输出处理器组件1090:将统一内部数据结构中表示的输出数据格式化为在不同形态上适当地再现其的 形式和布局。输出数据可包含(例如)智能自动化助理与用户之间的呈自然语言的通信; 关于域实体的数据,例如餐馆、电影、产品等的特性;来自信息服务的域特定数据结果,例如 天气报告、航班状态检查、价格等;和/或使用户能够通过直接与输出呈现交互而作出响应 的交互式链接和按钮。针对可包含(例如)以下各者的任何组合的形态再现输出数据:图形用户接口;文本消息;电子邮件消息;声音;动画;和/或语音输出。
未完待续
本期内容未完待续,请继续关注《苹果AI助理Siri(2)》 ,我是小夏,下期见!