科大讯飞,如何在大模型进阶之路上遥遥领先

来源:爱集微 #科大讯飞#
2.5w

集微网消息,大模型正在开启一个全球增长全新时代。今年4月,高盛预计未来十年生成式AI将带动全球GDP成长 7%,这意味着约7万亿美元的全新增长。在科大讯飞董事长刘庆峰看来,在当前全球政治、经济、军事面临巨大挑战和不确定的前提下,通用人工智能是这个时代最确定的增长动力来源。

今年以来,我国本土企业发布的大模型数量已超过100个,推出大模型似乎成为了每一家人工智能或互联网公司彰显实力的手段,但真正能成为生产力工具的为数不多,用心打磨推动大模型进化的更是少之又少。反观作为领头羊的OpenAI,在2022年11月发布ChatGPT-3.5后仅四个月时间便推出ChatGPT-4,加速拉开与追赶者的距离。

聚焦国内,作为大模型第一梯队“国家队”选手,科大讯飞是追赶ChatGPT脚步最积极的企业之一,其星火认知大模型则可能是进化最快的国产大模型。今年5月刚刚发布讯飞星火认知大模型之初,该公司董事长刘庆峰便立下今年10月整体赶超ChatGPT的远大目标。就在10月24日开发者节上,刘庆峰宣布,经七大能力持续提升,讯飞星火认知大模型V3.0已整体超越ChatGPT(-3.5),并在医疗领域超越GPT-4。

以如此之快的进化速度实现这一成就,除了科大讯飞自身的执着追赶与跨越,也离不开遥遥领先的伙伴助力。

联合华为打造算力底座,明年上半年对标 GPT-4

今年7月6日,科大讯飞公布讯飞星火将与昇腾AI强强联合,打造基于中国自主创新的通用智能新底座。科大讯飞随即与华为强强联合发布了星火一体机,让企业可以在国产自主创新的平台上,更方便、更自主、更安全可控地私有化部署大模型。

在人工智能浪潮之下,携手华为的自主高性能算力底座,显然能科大讯飞能够走出一条更宽、更直、更安全的大模型进阶之路。

刘庆峰曾表示:“认知大模型深度赋能时代已经到来,健康发展急需构建安全可控保障。”他认为,认知大模型在行业深度应用有三方面的关键要素:第一是安全可控,第二是场景驱动,第三是专项训练。

在安全可控方面,科大讯飞和华为已在联合攻关算力卡脖子的问题。科大讯飞拥有自研大模型训练平台,具备训练和数据闭环全流程设计、大模型训练和推理一体化设计、大规模异构算力兼容、支持混合云架构易拓展等优势,华为基于昇腾AI基础软硬件的高算力AI芯片、高性能算子库、多卡高速互联、分布式存储等优势,与科大讯飞一同打造面向超大规模大模型的训练国产算力的集群,形成集群化的优势。

在10月24日的发布会上,科大讯飞又发布了基于昇腾生态的“飞星一号”平台。

华为科技有限公司副董事长、轮值董事长徐直军在活动致辞中表示,基于昇腾生态的“飞星一号”平台,能让星火的训练效果翻番。科大讯飞敢于对标 ChatGPT 并超越,让人们对中国大模型时代快速发展的未来充满信心。

“风雨同舟者兴,众志成城者赢,”徐直军称,“科大讯飞是人工智能的开拓者,把智能语音识别技术做到了全球领先。目前,华为公司在全球所有使用的智能终端的语音技术,都是来自于科大讯飞,而且不仅仅是中文。”

刘庆峰强调,正式点火的“飞星一号”,不仅仅是中国企业的相互抱团,更是给世界提供了第二种可能、第二种选择。

“这一次我们双方的联合团队付出了很多心血,在整个过程中,我们特别尊敬的大企业家、长者任正非先生,也给予了非常多的鼓励和支持。在这里,我们也对任总表示衷心的感谢,”刘庆峰如是说。

讯飞和华为“联合特战队”半年内实现星火大模型训练和推理效率均翻番,这充分证明了AI大模型合作共赢的重要性。据刘庆峰介绍,从飞星一号正式点火的今天开始,科大讯飞就将正式启动对标GPT-4的更大参数规模的星火大模型训练。

毫无疑问,在华为等合作伙伴的共同助力下,讯飞星火大模型正加速进化,为国产大模型书写新的篇章。

星火进阶,7大能力提升3大功能升级

根据最新发布会上的介绍,讯飞星火V3.0的升级涵盖了文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及英文能力7大核心能力提升,具体还包括了以下三大功能的向上进阶。

首先是升级了启发式对话,加入AI人设功能,打造更个性化的AI助手。星火V3.0新增的虚拟人格功能可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设。而由科大讯飞推出的虚拟人格应用“星火友伴”已上线各大平台,用户只需定义好友伴的“人格”就能体验和不同人物性格的角色对话,通过聊天释放灵感。

其次,讯飞星火进一步升级了智能编程助手iFlyCode2.0。众所周知,产业数字化和数字产业化都离不开代码能力的支持。数据显示,中国有约800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重8.93%,2028年预测将达到20万亿元。

刘庆峰表示,自讯飞星火发布以来,代码能力持续升级,星火3.0已基本全面超越ChatGPT。搭载讯飞星火V3.0的iFlvCode2.0在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%,大幅提升软件从业人员效率。

据介绍,自iFlyCode发布以来,已在京东云、软通动力等107家机构实现深度对接应用。今年11月份,几乎全国所有软件名城都会和科大讯飞开展相关合作。

刘庆峰认为,当真正站在了大模型赋能的代码平台之上,不仅软件产业会上个大台阶,而且在全球的竞争力也会进一步提升。包括在数字产业化,尤其是产业数字化中,各个环节中的创新、所有的一线工人的想法都可以变成产业过程中的实践,用代码来帮他们实现,这些意义是非常重大的。

最后,讯飞星火与中科院文献情报中心联合打造科技文献大模型,可以实现成果调研、论文研读、学术写作三大功能。经现场实测,用科技文献大模型将十几份量子计算论文一键生成综述报告,为科研人员快速了解最新论文大幅提效。学者成果调研的效率被提高超10倍,论文研读有效率和学术写作采纳率均超90%。

不仅在多个功能和能力方面已经对ChatGPT实现超越,今年8月,讯飞星火还被《麻省理工科技评论》中国评为“最聪明的国产大模型”,毫无疑问,讯飞星火大模型已然稳居国产大模型第一梯队。但刘庆峰也直言,国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。他表示,唯有实事求是的科学精神,才能真正实现超越。

除了技术层面的超越,生态的追赶与完善也是大模型进阶的必修课。

千行百业落地渗透,星火解放生产力

目前,强化大模型已经进入第二阶段,数量众多的国产大模型更多将会体现在应用落地的比拼。而这不仅需要差异化的定位和落地逻辑,也需要强大的生态建设能力。

今年5月刚刚发布星火大模型时,刘庆峰就强调:“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”

截至目前,当前讯飞星火已有1200万用户,为千万用户持续创造刚需场景价值。自讯飞智作2.0 、讯飞写作产品发布以来,已新增超10万名专业用户,提供新闻播报、教育培训、自媒体推广到企业宣传等服务,让每个内容创作者都拥有自己专属的AI创作助手。

随着大模型持续突破,讯飞AI开发者生态持续领先。自5月6日星火发布以来,讯飞开放平台新增143.4万开发者团队,同比增幅331%,汇聚553万AI生态开发者团队。其中新增大模型开发者17.8万,讯飞正与10万+企业客户用星火创新应用新体验。大模型也显著降低了开发者门槛,在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用。

在日益完善和强大的生态之下,讯飞星火认知大模型在医疗、教育、工业、代码、科研等领域持续渗透,加速千行百业的生产力解放。

以医疗领域为例,通过深度学习和自然语言处理技术,星火3.0可以帮助医生进行疾病诊断和治疗方案的制定。例如,在肺癌诊断方面,星火3.0可以通过分析患者的病历和影像资料,提供准确的诊断结果和治疗建议。这不仅可以提高医生的工作效率,还可以提高患者的治疗效果和生存率。

10月24日还正式发布了讯飞星火医疗大模型,其推出的“讯飞晓医”APP让AI医疗的普惠之光照进每个家庭。早在2017年,讯飞智医助理就已经通过国家执业医师资格考试,排名超过96.3%的人类考生,在这个基础上,“讯飞晓医”如今开始面向家庭,打造每个人的AI健康助手。

测试数据显示,讯飞星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。

再比如教育领域,通过自然语言处理和知识图谱技术,讯飞星火3.0可以为学生提供个性化的学习辅导和答疑服务。例如,在学习数学方面,星火3.0可以根据学生的水平和需求,提供针对性的习题和解答方法。这不仅可以提高学生的学习效果,还可以减轻教师的工作负担。

此外,讯飞还将星火3.0应用于工业、代码和科研等领域。这些应用不仅可以提高各行各业的工作效率,还可以推动科技创新和社会进步。

讯飞星火V3.0的升级和应用落地展示了中国企业在人工智能领域的技术实力和创新能力。与华为合作共建大模型算力底座,讯飞为大模型的发展提供了第二种选择,并为星火大模型明年全面对标GPT-4打下坚实算力底座。

正如刘庆峰所言,大模型时代的大幕才刚刚揭开,业界需要一起共创、共享、共进化。(校对/Lau)

责编: Lau
来源:爱集微 #科大讯飞#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...