【专利解密】厉害了苹果AI助理Siri(1)

来源:爱集微 #专利解密#
8904

21世纪可谓是伟大的时代,是人工智能指数是增长的时代,从我们用的手机、电脑到家用冰箱、吸尘器甚至汽车等等都在往AI 的方向发展。

对于最受欢迎的苹果手机当然更不例外了,小编发现苹果公司自2011年(涉及到的部分专利的公开号如下:AU2011205426 CA2792442 CN102792320 EP3454227 JP5956511 KR101775708 RU2541219 US20120245944)起针对手机“智能助理”这一个方向前后在15个国家申请了367件专利,包括:澳大利亚77件、美国63件、韩国44件、日本35件、中国29件、加拿大26件、俄罗斯23件、墨西哥15件、英国11件、巴西3件、德国1件,除此之外还有其他的欧盟成员国18件、世界知识产权组织成员国12件。而国际专利文献中心公报的相关专利数量为873件,排名前5的包括:美国187件、中国147件、澳大利亚105、韩国82件、日本66件;可见手机的确比我们想象中的还要智能,甚至会更智能了,那么今天我们来一一揭晓涉及到的相关AI技术。

专利号为CN102792320的专利揭晓了苹果智能化助理Siri 涉及的智能化技术,如图所示:

图1

具体地,苹果公司此专利中揭晓了智能自动化助理系统可经配置、设计和可操作以提供各种不同类型的操作、功能性和特征,例如以下各者中的一者或其组合,类似于上图所示:

1.使经由英特网可用的数据和服务的应用自动化,以发现、寻找、挑选、购买、预订、订购产品和服务。除了使使用这些数据和服务的过程自动化之外,智能自动化助理还可同时实现数据和服务的若干来源的组合使用。

2.使经由英特网可用的数据和服务的使用自动化,以发现、调查、选择、预订和以其它方式得知代办事项,要去的地方,见面的时间和地点,以及可在英特网上找到的娱乐或社会交互的任何其它来源。

3.经由原本具有图形用户接口的专用应用程序提供的自然语言对话实现应用程序和服务的操作,所述图形用户接口包含搜索、导航、数据库查找、获得天气情况和预报等。

4.助理可用以起始、操作和控制装置上可用的许多功能和应用程序,提供对活动、产品、服务、娱乐来源、时间管理的个人推荐,或任何其它种类的推荐服务,其受益于自然语言的交互式对话以及对数据和服务的自动化存取。

5.语音-文本和自然语言理解技术的整合,其由域、任务、服务和对话的一组显式模型约束。不同于尝试实施通用人工智能系统的助理技术,本文所述的实施例可应用多个约束源来减少对较易驾驭大小的解决方案的数目。

6.通过使用API经由因特网代表其而调用服务来解决用户问题的能力。不同于仅返回链接和内容的搜索引擎,本文所述的自动化助理1002的实施例可使研究和问题解决 活动自动化。针对给定请求而调用多个服务的能力还向用户提供比通过访问单个站点,以产生产品或服务或寻找要做的事情而实现的功能性更广的功能性。

7.在用户请求的解译和执行中应用个人信息和个人交互历史。不同于常规搜索引擎或问题回答服务,本文所描述的实施例使用来自个人交互历史的信息、个人物理环境,以及在交互的上下文中搜集的个人信息。使用这些信息源实现,对用户输入的更佳解译。

8.更个人化的结果,为用户改善效率。将对话历史用于解译用户输入的自然语言。

9.主动输入引出,其中助理基于用以解译其输入的相同模型和信息,主动引导和约束来自用户的输入。

10.服务的显式建模和动态管理,其具有动态或稳健的服务编排。所述实施例的架构 使助理能够与许多外部服务介接,动态地确定哪些服务可为特定用户请求提供信息, 将用户请求的参数映射到不同服务API,一次呼叫多个服务,整合来自多个服务的结果,平稳地对失败的服务进行故障处理,随着其API和能力演化而高效地维持服务的实施。 

11.将主动本体作用于构造助理的方法和设备,其简化自动化助理系统的软件工程设计和数据维护。主动本体是用于助理的对数据建模与执行环境的整合。它提供将各种模型和数据源系在一起的框架。

12.可操作在执行特定任务和操作时,利用或产生各种不同类型的数据或其它类型的信息。这可包含输入数据、信息或输出数据、信息。

13.来自移动设备的话音输入,所述移动装置例如为移动电话和平板电脑、具有麦克风的电脑、蓝牙手机、汽车话音控制系统,经由电话系统、回答服务上的纪录、整合的 消息接发服务上的音频话音邮件、具有例如时钟无线电等话音输入的消费型应用、电话台、家用娱乐控制系统,以及游戏控制台。

14.来自计算机或移动设备上的键盘、遥控器或其它消费型电子设备上的小键盘的文本输入;发送到助理的电子邮件消息;发送到助理的即时消息或类似的短消息;从多用 户游戏环境中的玩家接收到的文本,以及在消息馈送中流式传输的文本。

15.来自传感器或基于位置的系统的位置信息。实例包含移动电话上的全球定位系统(GPS)和辅助式GPS(A-GPS)。

16.来自客户端设备上的时钟的时间信息。这可包含来自电话或其它客户端设备的指示本地时间和时区的时间。另外,时间可用于用户请求的上下文中以解译例如“在一小时内”和“今晚”等短语。

17.罗盘、加速计、陀螺仪和/或行进速度数据,以及来自移动设备或例如汽车控制系统等嵌入式系统的其它传感器数据。这还可包含来自电器的遥控器和游戏控制台的设备定位数据。

18.来自具有图形用户接口(GUI)的任何设备上的GUI的点击和菜单选择和其它事件。进一步实例包含对触摸屏的触摸。

19.来自传感器和其它数据驱动触发器(例如,闹钟、日历警告等)的事件。

20.对本文所述的实施例的输入还包含用户交互历史的上下文。

21.直接发送到输出设备或发送到设备的用户接口的文本输出经由电子邮件发送给用户的文本和图形或经由消息接发服务发送给用户的文本和图形。

22.语音输出,可包含以下各者中的一者或其组合:经合成的语音、经取样的语音 、经纪录的消息、具有照片、丰富文本、视频、声音和超链接的信息的图形布局。

23.调用设备上的其它应用程序,例如呼叫映射应用程序,话音拨打电话、播放媒体;在日历、任务管理器和便笺应用程序以及其它应用程序中制作条目。

24.用以控制对由设备附着或控制的设备的物理动作的致动器输出,所述物理动作例如为操作远程相机、控制轮椅、在远程扬声器上播放音乐等等。

25.展示从多个服务搜集并组合的信息,包含以下各者中的任一者或全部:如:商店的地址和地理位置、距用户的当前位置的距离、来自多个来源的评论;

26.信息屏幕包含:拨打电话以呼叫商店(“呼叫”)、记住此餐馆以供将来参考(“保存”)、将具有关于此餐馆的方向和信息的电子邮件发送给某人(“共享”)、在地图上展示此餐馆的位置和到此餐馆的方向(“在地图上显示它”)、保存关于此餐馆的个人便笺(“我的便笺”)。

27.超过简单数据库应用程序的智能,例如,处理自然语言101B中的意图陈述,不仅仅是关键字、从所述语言输入推断语义意图,例如将“吃意大利餐的地方”解译为“意大利餐馆”,将语义意图操作化为使用在线服务的策略,并代表用户执行所述策略。

未完待续

本期内容未完待续,请继续关注《苹果AI助理Siri(2)》 ,我是小夏,下期见!(校对/诗诗)

责编: 刘燚
来源:爱集微 #专利解密#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...