您的位置: 集微网:积微成著 >> 资讯 >> 原创文章 >> 详细内容 在线投稿

人工智能时代,远未满足的声音市场还有这些要做

更多猛料?欢迎关注老杳个人微信号:laoyaoshow
来源: 集微网   发布者:集微网
热度103票   时间:2017年9月22日 16:43
包括助听器、辅听器、耳机&Earbuds在内的Hearable整体市场将成为成长最迅速的穿戴式市场,在2020年引爆一个超过160亿美元的市场。蓝牙助/辅听器市场至2018年突破200万台,以后每年以倍数成长。目前传统助听器在2012年全球销售约1000万副,而每一年数量均成长约3-6%,一副平均售价为$1,500美金,全球相当于$150亿美元产业在中国有将近7000万人口有听损,但只有1%的人口配戴助听器。高端助听器单耳价格为$3,000-$6,000美金,虽然可处理高频位移,但声音在处理过程中造成了声音失真,同时由于助听器价格过高所以衍生出其他新产品:例如辅听器(PSAP)售价$200-$500美金。可以说,这是一个远远未被满足的市场,老龄化社会及各种听力损伤更加大、加速了市场需求。

在9月15日集微半导体峰会的人工智能论坛上,台湾元鼎音讯股份公司董事长杨国屏分析了人工智能时代对声音技术的需求,并介绍了该公司在这一领域的布局。以下为他的演讲:


人工智能的定义有很多,比如苹果当初,乔布斯认为Siri与人对话就是具有了智能。过去30年是PC的时代,后来是触摸屏的时代,现在亚马逊引领了第三波潮流,是声音的时代。

现在全球都在制定人工智能的发展战略,中国政府今年发表了全力发展人工智能的策略,相关的智能终端产业包括智能手表、智能耳机等引进智能产品,人工软件,这是中国对人工智能的期许。美国政府在2016年也有制定相关的人工智能战略目标。

虽然都在加紧布局人工智能,但是各国的研究趋势和实力都有所区别。从专利数量来看,美国遥遥领先,中国和日本紧跟其后。从专利方向来看,美国和中国第一名都是机器人,第二名以后就有差别了。美国主要集中在语音相关方面,占了24%,中国主要8%。从统计数据中可以发现,高通、苹果、Facebook、亚马逊、谷歌、IBM、微软等巨头公司都在语音方面做了大量的布局。因此在音频领域的人工智能,前景非常广阔。

中国的智能音箱产业也开始启动,值得注意的是,亚马逊智能音箱一家花了7年时间,所要求的目标是两秒钟以内回应。然而在耳机领域,还有很多挑战没有解决,因为牵扯到很多外在环境降噪、语音交互等技术问题。过去的耳机是被动式的,就用来听音乐、听电话,将来的趋势是互动的,当然面临的挑战也很多。

人类可听范围收音频率为为20Hz〜20000Hz的左右,年龄与用耳习惯会影响可听范围,年纪愈小愈听得到高频声音,老年人听力细胞退化,不仅听觉范围缩小,高频子音也听不清楚,讲话的人必须大声讲,听话的人还可能听错。

根据世界卫生组织(WHO)估计,全球3.6亿人有听力缺损状况,最近几年攀升至5亿人。在全球听损人口中,65岁以上老年人约占一半,严重影响生活品质,甚至有数据显示,10个老年人中3个人因为听觉退化无法正常与人交谈。

一般助听器仅频率音量,并未改变频率本身,但高频听损在所有听损状况中占了70%,这正是为何电视音量听不清时将音量调大,只能解决30%的问题。

元鼎国际(UnlimiterHear)是台湾科技辅具专业开发商,成立于成立于1997年,拥有100多项语音、听力等专利,专门协助身心障碍者。2008年开始研究听损及如何改善听力,开发MFA子音侦测压移频率技术,可通过不同的服务平台,打造 MFA生态环境提升听辨能力。2015年成立元鼎音讯,蓄势待发瞄准消费电子产品音频市场,其商业模式为IP技术授权供货商,提供听力算法方案。
 
元鼎音讯技术核心为毫秒移频算法(Millisecond Frequency Adjustment;MFA),主要在1.5毫秒内将听障者无法听到的微弱高频子音,以频率压缩和移频算法技术,移到尚有残余听力的中低频范围,还原声音的本色。元鼎的听力算法主要用于两大产业,一是蓝牙助/辅听器产业,二是蓝牙耳机产业。目前元鼎在全球各地工申请音频专利128余项(含中、美、欧等国家,已取得49项专利、美国8项),在算法专利授权方面,已有数家IC厂与元鼎洽谈IP授权中。

元鼎音讯过去做的都是声学算法的基础工作,首先要在国外建立标准,我们已经配合IEEE在电子学和医学方面建立标准。美国政府已经发现,准备把听力检测建立在手机中。现在人们已经很轻松就能知道温度、视力等信息,现在要做的是快速的建立标准,让每个人都能检测自己的听力。元鼎目前是这个委员会的委员,另外一个是三星。在这方面,元鼎的专利布局已经十年以上了,目前有100多项专利,5项核心技术实力。这些专利围绕着5个方向,最中心的就是模拟系统,可以模拟外部环境的声音,演变上万种不同的状况来做模型、参考,对设计者将来做各式各样的与声音有关的设备做参考。目前元鼎的核心技术主要有以下几项:

EarClarity音频调频技术。人类可听范围收音频范围为200Hz到8KHz左右,但会随着年纪与用耳习惯逐渐丧失高频声音听力,听损者有70%听不清楚高频声音,30%是因为音量原因。元鼎音频技术的解决方案核心为毫秒移频算法(Millisecond Frequency Adjustment;MFA),主要在1.5毫秒内将听障者无法听到的微弱高频子音,以频率压缩和移频算法技术,移到尚有残余听力的中低频范围,还原声音的本色。

EarEQ音乐EQ技术。随着年纪与用耳习惯,听力逐渐丧失对音乐低频、中频或高频声音的敏感度。根据耳朵做校正、完美化音频,通过EarEQ App检测听力频率敏感度,根据敏感度调整出适合的频率,并放进蓝牙耳机,优化EQ曲线,聆听定制化的个人音乐。

EarSafe听力保护。WHO世卫组织强调指出,11亿人面临听力损失风险,在12岁至35岁青少年和青年中,近50%的人在使用个人音频装置时音量大到不安全程度。另外噪音伤害引起的听力细胞受损,例如耳膜在持续在高分贝环,即会伤害听力 (连续八小时接触85分贝以上声级)。EarSafe技术依照医学文献数据,与美国NIOSH组织听力安全标准,将人类耳膜不同分贝数可容忍时间,汇整成算法,让用户在耳膜受损前,自动动态平缓调整耳机输出音量,同时,调整过程中保留音乐聆听顺畅性。

EarCommand语音声控。亚马逊Alexa引领了语音控制风潮,元鼎提供解决方案将Alexa语音服务内建于耳机内,通过耳机一键按钮,即可唤起语音助理,让用户进一步由蓝牙耳机即可连结各种亚马逊控制装置。目前已经有蓝牙耳机业者采用元鼎解决方案,未来元鼎将更进一步推出直接语音指令唤醒助理解决方案。

因此在耳机方面可以做的功课有很多,可以做助听器、辅听器,可以做检测降噪,因此人工智能领域与声音相关的专利数遥遥领先。目前声音学所用的助听器,90%都掌握在欧洲企业手里,已经有50年的历史了。元鼎在这一领域也已经耕耘了十多年,建立了自己的声学演算模拟系统,模拟各式各样的声音判断,将来智能语音时代到来,可以用这种方法来增加识别率和正确率。元鼎的6大核心技术,在AI领域的语音识别将为客户创造独特的商品特性。目前有一些助听器和蓝牙耳机公司在跟元鼎合作,只要客户的机器需要放声音需要辨别声音就可以来找元鼎。元鼎也提供算法专利技术授权,已有数家IC厂商与元鼎洽谈IP授权事宜。
声音与每个人都息息相关。首先是医疗领域的助听器,现在中国老人有一半以上需要助听器,助听器可以改变他们的生活。其次是保健,年轻小朋友戴耳机,也有35%的人听力太早损伤。第三可以做智慧云,第四可以让用户按照个性化的需求定制,听音乐更完美。挑战在于声音是摸不到的,所以要辛苦一点。当拥有了这些核心专利和技术,逐步的建立一些小的标准,这样大家互相努力,就会形成一个生态环境,这时候生态环境的力量就很大了。当然,自古英雄缺现金,好的技术业也需要创投以及IC产业的支持。


    扫描下方二维码关注老杳或集微网官方微信:




  • 【手机中国联盟官博系列赠机活动进行中,欢迎参与】

  • 老杳吧本周热点帖子

    老杳吧今日热点帖子


    顶:7 踩:4
    对本文中的事件或人物打分:
    当前平均分: (32次打分)
    对本篇资讯内容的质量打分:
    当前平均分: (27次打分)
    【已经有人表态】
    7票
    感动
    4票
    路过
    1票
    高兴
    4票
    难过
    5票
    搞笑
    6票
    愤怒
    1票
    无聊
    5票
    同情
    上一篇 下一篇