(文/陈兴华)继Sora让“现实世界”为之一震,Devin再让整个软件行业“瑟瑟发抖”。
近日,世界上第一位AI程序员Devin官宣诞生,其可掌握全栈技能、自学新技术、构建和部署应用程序、自主查找并修复Bug等技能,在SWE基准测试结果中已远超GPT-4等“顶流选手”。在这背后,开发Devin的团队仅为10人,而且由华人领衔,但均是天才型开发者。
面对Devin的更强大编程能力,众多程序员均愈发感受到被替代的危机。在行业人士看来,生成式AI从人类的助手发展到完全接管人类程序员的工作只是时间问题,甚至未来不会存在“程序员”这种职业。但也有观点称,目前的程序员热五到十年内不会减弱,AI时代更需要计算机专家和程序员。
综合实力远超“顶流”
尽管Devin尚未开放使用,但根据官方公布的Demo和极为有限的内测显示,Devin的功能已经远超出GPT-4等“顶流选手”,创造了AI编程任务的新里程碑。
据了解,Devin最大突破在于大大提升计算机推理和规划能力,而且掌握全栈技能、自学新技术、构建和部署应用程序、自主查找并修复Bug、训练和微调自己的AI模型等多项能力。其中最惊艳之处在于用户只需要发出一个命令,Devin就可以实现生成视频、网页,设计小游戏等任务,端到端处理整个开发项目,而且还能随时根据用户新的指令修改程序。
例如开发者展示了一个让Devin解决sympy Python代数系统中关于对数计算错误的例子。在演示中,Devin搭建代码环境重现了错误,并独立编码和测试了修复方案。
开发Devin的初创公司Cognition AI对于其的定义是:世界上第一位完全自主的AI软件工程师。其在长程推理和规划上面下足了功夫,可以规划和执行需要数千个决策才能完成的复杂软件工程任务,同时保证整体逻辑性,并且能随时上下文回调及校正错误。
据SWE基准测试对Devin程序的评测,其得分结果堪称“遥遥领先”。
SWE基准测试是一项国际公认的权威测试,考验AI编程能否“端到端解决真实世界里的程序问题”,并在Github里搜集真实的编程需求。结果显示,Devin的“端到端解决成功率”达到13.86%,相比之下GPT-4的这一指标只有1.74%,更早的GPT-3.5大模型成功率甚至仅为0.52%。此外,Claude 2的成绩是4.80%,SWE-Llama-13b则为3.97%。
目前,参与测试的科技媒体和行业人士均给出了极为正面的评价。
其中,斯坦福大学的博士生Silas Alberti在两周前通过Devin构建了一个小型SMS网站摘要器,表示其与Devin的沟通过程就像在管理一位人类初级工程师;来自斯坦福大学的Varun Shenoy选择用Devin做数据抓取,并称其实际效果“令人难以置信”;计算机科学家Silas Alberti则发现,Devin擅长项目原型设计、修复错误以及以图形形式显示复杂数等等。
根据当前对Devin的研发进展和测试结果,Cognition AI的开发人员自信表示,Devin就像是一个“不知疲倦、业务水平精湛”的程序员,可以独当一面完成很多任务。美国一位知名AI开发者Brian Roemmele则称,自主编码智能体Devin已现AGI(人工通用智能)雏形,因为它能在几分钟内自主编写整个应用程序,“这将是真正无代码未来的开始”。
梦幻华人团队领衔
在Devin的更强大功能震撼业界同时,其背后的Cognition AI团队也同样令人“惊讶”。
据了解,Cognition AI团队成立仅两个月,只有10人的规模,而且没有固定的经营场地,成员分散在洛杉矶、旧金山、纽约等地。然而,在如此“极简”配置和松散组织模式下,他们能打出“王炸”的关键因素在于,Cognition AI的人才架构堪称天才型创业团队。
具体来看,Cognition AI的三名核心创始团队分别为:CEO Scott Wu,CTO Steven Hao,CPO Walden Yan。从这些名字及肖像不难看出,他们均是华人。
其中,Scott Wu今年27岁,曾就读于哈佛大学。从上中学开始,他就展露出在数学方面的天赋,开始参加数学竞赛并屡获殊荣,例如在2014年举办的IOI(国际奥林匹克信息学竞赛)上以满分的成绩获得第一名。同时,他在连续创业中也展现出了过人的技术能力和商业头脑,包括四年前成为LunchClub(以AI和机器学习为主的社交平台)的联合创始人及CTO。2020年,Lunchclub筹集了2400万美元A轮融资,估值超1亿美元。
Cognition AI的CTO由Steven Hao担任。他于2018年毕业于MIT计算机和数学专业,此前担任Scale A 的顶级工程师,专注AI系统研发,并且曾在Jane Street、DE Shaw和Quora公司任职。Steven Hao也是IOI金牌获得者,并且还曾获Codeforces和ACM-ICPC等编程竞赛的最高荣誉,开发过的项目包括协作填字游戏网站和集合网络实现。
Walden Yan则是Cognition AI的首席产品官。加入Cognition AI之前,他是哈佛大学本科大四在读生,就读计算机和经济专业。据悉,Walden Yan为了全身心投入创业甚至不惜从哈佛退学,为了暂时不让父母感到失望,他还要求校方对其退学状态进行保密。
值得一提的是,工程师Neal Wu同样有哈佛大学教育经历,曾在tryramp、GoogleBrain工作过。他与Scott Wu是亲兄弟,也从青少年时期就是国际编程比赛的“常胜”选手。
除了几位核心创始成员之外,Cognition AI团队其他成员曾在Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro等多家知名公司任职。而这个仅由10人组成的团队共获得过10枚IOI金牌,可谓平均人手一块。
Scott Wu认为,奥林匹克竞赛的经历就是他们团队的优势。他说,“教人工智能成为一名程序员是一个非常深入的算法问题,需要系统做出复杂的决策,预测未来的最佳路径。”这类似他们多年来一直在脑海中玩的游戏,现在有机会将其编码到人工智能系统中。
目前,Cognition AI已获得硅谷投资大佬彼得·蒂尔的Founders Fund基金领投的2100万美元A轮融资。据悉,彼得蒂尔以挖掘极具突破性的创新项目著称,而且哈佛背景的创业者更是和他渊源紧密。他早期投资中类似背景最知名的是扎克伯格和Facebook。
各程序员“瑟瑟发抖”?
面对Devin的更强大编程能力,众多程序员纷纷不再淡定,甚至有互动留言称:Devin先生,请你不要学习编程了,我还有一大家人要靠我养活。那么,程序员真的会被替代吗?
对此,Cognition AI在官方资料中“谦逊”地表示,Devin的任务是帮助人类进行编程,让程序员解决更难更有趣的问题,而不是要取代程序员的饭碗。尽管如此,部分媒体舆论还是发出了灵魂拷问,“为什么一群编程天才会设计出取代自己工作的东西?”
Constellation Research CEO霍尔格·穆勒表示,生成式AI从人类的助手发展到完全接管人类程序员的工作只是时间问题。斯坦福大学计算机教授万斯则称,在AI应用普及化之后,软件工程界的格局将迎来巨大变化,程序员必须适应自己新的角色。他还指出,全部程序员并非都将面临下岗的前景,但一些低端和辅助性的程序员岗位无疑不再有使用真人的必要。
在行业分析看来,通常每个行业都是金字塔架构,程序员行业亦是如此:顶尖的工作者做操作系统、数据库、中间件,腰部的工作者去写一写业务和产品,而底部的工作者则写增删改查,写项目。但随着低代码平台、云计算、AI等技术的出现和发展,这个金字塔有可能会越变越窄,底部工作者的生存空间会越来越小,这似乎是一个趋势。
此前,已有多位行业人士均指出,AI技术未来将在软件编程中发挥重要甚至替代作用。而全球首个人工智能软件工程师Devin一经发布,或将加速软件编程行业的变革进程。
就在不久前,英伟达CEO黄仁勋表示,自己相信就在不久的将来,人类再也不需要学习如何编码了,孩子们应该停止编程课。对此,他也从技术演进角度做了进一步解释:在未来的10年里,英伟达将会把深度学习的计算能力再提高100万倍,从而让AI计算机不断训练、推理、学习、应用,并持续改进,未来不断将超级AI转变为现实。
百度董事长兼CEO李彦宏日前在一次电视节目中也大胆预测,以后不会存在“程序员”这种职业,因为只要会说话,所有人都能具备程序员的能力。据悉,去年11月的一次公开场合,他曾透露目前百度有20%的代码是由AI来完成,并且这个比例正在不断上升。
不过,业界也不乏反驳观点。其中,360董事长周鸿祎强调称,程序员热五到十年内不会减弱。“尽管未来人人都会用电脑,所谓人人都是程序员,但不同的人用电脑创造的产品完全不一样,AI时代更需要计算机专家和程序员,他们可能是各行各业最有发言权的。”
(校对/张轶群)