“和人类比较,我希望这些机器能完成更多更具智慧性的任务,”美国国防部先进研究管理局(Defense Advanced Research Projects Agency, DARPA )的Mind's Eye电脑视觉专案经理James Donlon说。
Mind's Eye专案旨在开发能够自动辨识和描述人类活动的突破性演算法。Donlon说明了这项为期三年的计划,在经过18个月努力之后所获得的初步进展。
事实上,过去十几年来针对电脑视觉进行的努力,恐怕获得的成果甚少,例如,今天的机器能否辨识出一只正在移动中的狗?而当两台车相撞时,今天的演算法甚至会认为其中有一辆车离开了。特别是当前的演算法也很难检测到前臂的运动状态,而这正是要辨识一个人拿取或送出物品的关键所在。
“当要检测的物体在与其他任何事物进行互动时,要如何对其进行分类,是一项相当可怕的任务,”Donlon说。
Mind's Eye 专案已经开发出了一个整合7,676个真实生活影片的资料集,这将对解决电脑视觉演算法开发挑战有所助益。Donlon希望Mind's Eye的资料集能帮助视觉技术开发者应对下一阶段的挑战。
“今天的电脑视觉开发社群正在合作推动固定资料集的进展,而非仅将发展重点放在混乱的资料集上,”他表示,Mind's Eye能让人们开始逐步去定义资料集。
“我的角色就是去创造这些条件,让你们能开发出更多突破性进展,”他说。他也在他的影片中加入了混杂因素,如可变的照明条件等。
“你不能低估演算法的重要性,因为在长远的未来,它都将扮演极重要的角色,”Xilinx平台行销部副总裁Bruce Kleinman说。
目前该专案重点在开发突破性的演算法,它将为系统整合者提供可应用在FPGA, GPU和SoC上的全新程式码。“硬体加速对研究的帮助非常大,”他说。
“美国陆军的目标非常目确,就是开发出一种搭载相机的机器人,它能够经由导航到达指定地点,获取并回传视讯,完全取代现有的人类侦察员工作,”Donlon说。“毫无疑问,现在最迫切的任务,就是开发出更具智慧特性的感测器。”
“我们必须确认还有哪些任务是当前技术无法达到的,还必须去确定未来这些机器人出勤时的动作和实际会经历的场景,”Donlon表示。截至目前,Donlon已经定义出了48种可供辨识的动作。“接下来,我们还必须描述场景,同时也必须解决所有目前技术上的死角,例如,或许有人会想试着愚弄相机。”