2018年1月5日星期五

下沉、重聚、归位背后,是一位学者转身业界带领阿里iDST建立技术「影响力」的四年

撰文 | 李九喻 王艺

编辑 | 刘燕


两个月前,在杭州阿里巴巴西溪园区的一间会议室里,机器之能见到了阿里巴巴 iDST 院长金榕。


金榕风风火火地进来,在会议桌靠近门口的一侧坐下。他说话很快,由于长期在美国求学工作的原因,句子中夹杂着英文。事实上,iDST 院长这个位置是金榕在产业界的首次亮相。此前,从卡内基梅隆大学博士毕业的他在密歇根州立大学教书多年,并已是该校终身教授。


自 2014 年加入数据科学与技术研究院(Institute of Data Science and Technologies,简称 iDST )以来,金榕教授所做的一系列工作,就是让类似「人工智能驱动企业增长」的技术方案落地。


过去几年,BAT 试图通过在研发上的大手笔投资以及收购,企图在短时间内找出自身产品与服务和人工智能技术的结合点。然而急于部署人工智能,这并不是明智的选择,因为往往公司内部的技术人员不能够准确评估人工智能的商业价值。在另一方面,纸上谈兵的人工智能创业公司层出不穷,这使其领域内公司的商业价值水分增加。


行业的窘境与金榕过去几年的经历不谋而合。从西雅图到杭州、从带博士生到带团队、从提升论文 benchmark 到完成部门目标,这位严谨的学者在过去几年经历了一次次对技术商业应用认知上的冲击。


经历教授到院长身份转变的金榕,向我们阐述了一个前沿技术团队在阿里巴巴寻求突破的过程,以及对如何发挥团队自身价值的实践领悟。


连接人工智能的业务和技术线


与 2017 年营收 1582.73 亿人民币、近 5 万全球员工和 56% 营业额增长相呼应, iDST 需要接触庞大的业务生态圈。其中包括阿里旗下的 8 家线上购物平台—— LAZADA、阿里巴巴、alibaba.com、AliExpress、淘宝、天猫、聚划算和飞猪;以及关联业务——蚂蚁金服、阿里妈妈、高德地图、UC 浏览器、优酷土豆以及菜鸟物流。单蚂蚁金服一项,其支付宝业务就渗透全球了 30 多个国家,覆盖 5.2 亿用户,用户人数接近北美人口的总和。


仅凭上述数据,我们就不难理解为什么阿里巴巴能够吸引诸如前亚马逊最高级别华人科学家任小枫等顶尖技术人才的加入。


面对企业内部务实的作风,iDST 团队梳理了几个着重点:检索、语音、语义、图像、视频和模型优化。同时也提出了目前侧重的四个人工智能技术应用方向(如下图):




在计算机视觉领域,一个典型应用产品「拍立淘」,是金榕团队用深度学习开发出来的拍照购物神器。通过精准识别实拍图,用户可以使用拍立淘通过图片搜索几乎所有淘宝商品,从网红坚果、新款电子产品、夏季连衣裙、进口手办到欧款木制家具。


从技术层面上来讲,拍立淘的深度模型将用户的查询图片、点击图片、和未点击图片构建成一组特征学习框架,利用深度卷积网络提高搜索精确度。金榕的团队还利用迁移学习将该模型应用在其他领域中。在过往线性迁移的基础上,团队算法引入随机傅里叶函数,利用非线性学习方法提高系统的鲁棒性。目前该迁移模型在谷歌 Open Images 数据库的 Top

10 准确度达到了 57.91%,高于直接使用 Open Images 数据训练的 GoogleNet V3 的 53%。



拍立淘用户界面展示


根据金榕介绍,拍立淘数据库中包含超过 10 亿个商品,以及 1400 万日活跃用户。这组数据规模到底有多大?学界熟知的 ImageNet 数据库大概保存了 1500 万张照片,而拍立淘每一天上传的图片就比这个要多。「我们研发了快速高精度的检索索引技术使得海量的数据分析成为可能。」


另一个值得一提的是组合优化技术,金榕向我们讲述了 3D 装箱优化技术的应用。目前阿里巴巴旗下的菜鸟物流一直在运筹优化上寻找突破点。其中一个问题是如何使用表面体积最小的箱子,依照最优的次序放置、打包物品,从而降低运营成本。阿里的模型将待打包的物品尺寸输入 Deep-Q 模型,计算出所需的最小容器,再用强化学习找到最佳的打包方式。目前利用这个方法可以节省 5% 的包装消耗。



5% 看上去不是一个很大的比例,但仅在 2016 年的双11购物节,阿里巴巴就产生了 6.57 亿笔物流订单。这也就意味着每年能节省近 3285 万件订单的打包成本。与此同时,阿里巴巴在仓储以及配送的技术优化也非常出色。统计数据显示,在 2013 年双 11 的快递平均送达时间是 9 天,到了 2016 年则缩减至 3 天半。


在 2017 年的双 11,他们将这样的技术从仓库迁移到数据中心,研发的数据中心资源分配技术,能够将分配率拉升到 90% 以上,在部分业务中节省一半服务器,并以 2 秒的速度锁定异常机器,命中率达到 94%。


除此之外,免唤醒地铁语音购票机、国家人工智能开放平台城市大脑、聊天机器人阿里小蜜等,这些项目的很多核心技术都是来自于 iDST。


这是金榕口中的技术「影响力」。「在公司里,你用技术可以影响到上亿用户的生活。」金榕说,「而在学界很难做到类似的影响。在学校你也许工作很久,最后的结果仅仅是将某个 benchmark 提升 5%、10%。」


对科学家来说,企业的海量数据就像是一个开放式的游乐场,提供了学者在学校工作难以实现的可能性。


前沿技术团队寻找价值与突破的过程


这显然不是一路坦途。


尽管 4 年前,阿里巴巴成立 iDST 时对技术研究目标野心满满。那时候,iDST 很快就组起了一个 30 人左右的团队,聚集了众多曾在研究方面颇有建树的专家,包括现任院长金榕、现蚂蚁金服首席数据科学家漆远等。


成立初期,iDST 承接了包括建立超大规模 GPU 机器学习集群、机器学习平台 PAI、以及帮助聚划算进行商品排序提高运营效率等任务。然而,iDST 的出现并没有受到业务线的欢迎,技术没有顺利落地成为最大「冲突」。


当时,在业务线同事们的眼中,这些科学家是「不懂市场、不懂商业化的人」。


金榕讲到一个例子。在帮助聚划算进行商品排序的过程中,科学家们很自然地想要将性价比更高、更划算的商品放在前面,也确实有效地增加了营收。但由于较为便宜的商品占据了相对明显的位置,整个聚划算的用户群开始向三四线城市倾斜,用金榕的话说,「聚划算产品的价值都变了。」


 「这不是科技可以解决的问题,你把 GMV(一定时间段内的成交总额)提高了,但却改变产品本身的定位。」对于到底怎样做才是有价值的,金榕很困惑,他说,「可能没有人有确切的答案。」


他慢慢地意识到,从整个集团的角度而言,科技并不只是计算数字的工具,而是要真正和场景结合起来,把业务做好。他认为,如果团队对场景没有清晰的认识,和业务脱节,那么在阿里,iDST 的技术将永远没有办法产生价值。


2015 年 7 月开始,他们决定走到到业务中去。金榕带领一队人马进入搜索事业部、漆远到蚂蚁金服、一些从事语音方向的研究人员到阿里云。


他们从手边事做起,也开始扮演关键先生的角色,「我们无条件地来帮忙做产品。」金榕回忆道。搜索事业部的产品新版本由于一个 Bug 没有解决而迟迟不能上线,金榕团队帮忙排查原因发现,是技术人员将公式 A/(B+C)写成了 A/B+C。「你不要小看这件事情。」金榕说,排查像这样的细微问题,最考验一个人对程序的感知能力。新版本上线那么多行代码,肯定不能从头开始一行一行地看、一行一行地查,对「哪些数据不太对劲儿」的敏锐嗅觉是查出这个 Bug 的关键所在。


但在深入业务的过程中,团队的一些成员因为不适应而离开,「当你自己都还在寻找价值的时候,你是很难说服别人进来跟你一起并肩作战的。」金榕说。


他坦言,那时候团队的动荡,让他有些自责。在金榕心里,这些人是他一手招进来的,他应该让他们付出的智慧得到应有的回报。


走出过渡期,「要做人工智能技术最底层的创新」


「现在来看,每个人都是自己人生的主人,每个人都要对自己负责任。」金榕说。而他和他领导的iDST也走出过渡期。


马云提出「大中台、小前台」战略,让各个业务线在一个强大的、动态的「中台」支撑下,仅用几个人手就能搭建起稳定的前台服务。


这有些类似项目制与产品制的区别。项目制随着业务的爆发,所需人力也随之爆发,且项目间的经验很难复用、累积。产品制更轻、更巧、更专,只需对不同的项目需求做少量定制化,在成本方面更加可控,在技术方面也能有所积累。


由此,2017年 3 月,在集团组织部大会上,阿里巴巴 CTO 张建锋明确要让分到各个业务线上的 iDST 成员重聚,并强调了 iDST 的定位——成为阿里巴巴集团面向未来的 AI 研发核心力量。


 现在,阿里巴巴的 AI 研发「大中台」放在 iDST,通过调用接口的方式供业务线使用,通过阿里云向外部输出。目前,iDST 在西雅图、杭州、北京、硅谷都有分部。海外部门侧重于基础研究,杭州团队侧重应用研究,他们克服约 1 万公里的地理距离、15 个小时的时差,互相协调数百人的团队工作。


金榕开始设计 iDST 的核心技术目标,要做人工智能技术最底层的创新。


「一个公司要在市场上获得地位,没有黑科技怎么可能。你用的都是跟大家一样的东西,那市场为什么选你?」金榕认为,团队有实力创造出一种学习模型,能够在实操业务层面比当前从实验室中走出来的模型表现更优。


金榕有点像是一个深度学习的挑战者。在他看来,由于深度学习技术发展到现在,各种模型、框架已经被封装得很好,工程师们更多的是「拿来用」,很少有人会真正对技术背后的原理进行思索。


另一方面,金榕说,现在的深度学习技术,最可怕的地方在于,你不知道它不能做什么,不知道它的边界在哪里。没有人知道某个模型在某个具体任务上为什么好用,为什么不好用。如果不好用的话,那就换一个模型继续尝试。而现在的学术评价体系促使大家更多记录成功,「很少有论文的主题是写一件事情是如何失败的,」金榕说,「这很糟糕,很多聪明人在试同样的错。」


金榕希望改变这样的局面,真正地从底层技术驱动创新。


2017 年云栖大会上,阿里巴巴宣布成立达摩院,瞄准未来突破性技术的研究。也许,阿里巴巴这样一家电商公司强化技术的决心,会给金榕更多时间和信心。「如果所有的商业公司不能容忍技术自身的发展规律,那么我认为,今天的一切都不可能发生。」


对海外优秀技术人才的吸引力,也在提升。阿里巴巴在卡内基梅隆大学举办校招,座无虚席,即便不打算加入的学生,也想多了解一些。与几年前相比,国内互联网公司的人才竞争力正逐年递增。与 BT(百度、腾讯)和 FLAG(Facebook、LinkedIn、Amazon、Google)相比,阿里巴巴这家公司的情况究竟是怎样的?


我们向校招现场的学生做了个小调查:




数据显示,27% 的学生对阿里的平台影响力有信心,58% 的学生在 BAT 里更青睐阿里巴巴,而这其中选择 1-3 年内回国的人高达 42%。


正在 CMU 攻读博士后的杜同学和金榕有过短暂交谈,他告诉我们,除去留在美国还是回国的选择,是否选择阿里巴巴取决于项目本身,以及领导团队的默契。当我们询问金榕在寻找什么样的人才时,他说,「拥有良好的踏实感与商业好奇心是技术人才在业界成功的必备品质。」


这更像是金榕转换轨道经历 iDST 变化之后的总结式感悟,「(做技术的人)也要对业务有理解,能够沉下心来理解商业运作模式,否则一切努力只是个人一厢情愿。」


然而,平衡业务需求和技术研发之间的衔接关系,是商业化公司的长期挑战,焕发新生后 iDST 的征程仍然漫长。


]]> 原文: http://ift.tt/2m5P45K
RSS Feed

机器知心

IFTTT

百度即将正式发布自动驾驶平台 Apollo 2.0

百度将于当地时间 1 月 8 日 CES 的发布会正式发布自动驾驶平台 Apollo 2.0,在此之前,百度美国研发中心举行了自动驾驶试乘体验。


在下有小雨的情况下,搭载 Apollo2.0 的自动驾驶汽车在美研旁边的 E Caribbean Dr 稳定的完成了一段环形路线的自动行使。汽车搭载了一台 64 线激光雷达、两个摄像头,以及一个前置毫米波雷达。行使中汽车可以提前变换到转向车道,感知红绿灯提前减慢车速并自动停车等待,通过路口时根据来车进行减速避让。

 

Apollo 2.0 具备了强大的仿真能力,车上一块显示屏将各种感知设备收集来的信息与高精地图集中现实出来,包括道路信息、障碍物、车辆和行人等。基于 2D 摄像头的红绿灯识别也安装在了车上,以精确的遵守城市路口的交通规则。


Apollo 还把云端的感知算法训练出的模型与车端结合安装到车上。基于 3D 激光雷达的障碍物检测,可以精确到底是车辆、行人还是自行车,这样规划模块可以精确计算出运作轨迹是怎样的,从而完成精确的避障。

 

Apollo 是百度推出的开放、完整、安全的自动驾驶平台,以更好的与硬件、车企等上下游公司进行合作,打造良好的自动驾驶生态。2017 年 4 月,陆奇在上海车展上宣布 Apollo 计划,将开放自动驾驶平台。此后,百度又陆续发布了 1.0 和 1.5;11 月的百度世界大会上,Apollo 开放平台又发布了 Apollo 小度车载系统和 Apollo Pilot 两款产品,标志着 Apollo 平台从技术创新走向产品创新,向产品化、量产化、解决方案化迈进; 12 月底,百度与河北雄安新区管委会签署战略合作协议,Apollo 将助力雄安新区,打造全球领先的智能出行城市。

]]> 原文: http://ift.tt/2CXF71s
RSS Feed

机器知心

IFTTT

你看捻起一颗小红莓的那只手,不,它是「机器肌肉」

编译 | 陈韵竹

作者 | Matt Simon 

来源 | WIRED




唉,可怜的类人机器人,发展了几十年,不但没成为勇猛的「终结者」,反倒像个打了镇静剂的老年人。虽然这些机器人看上去和我们长得很像,但它们的构造和我们截然不同——在机器人关节里电动机驱动着它们笨拙的运动,但人类的肌肉能更精确地控制我们的身体。除非打了镇静剂,我们才不会像机器人一样走得摇摇晃晃。


然而,一个名为柔性机器人技术(soft robotics)的新兴领域似乎能给机器带来更多「自然」的工作。


最近,发表在 Science 和 Science Robotics 中的两篇论文详细介绍了一种灵巧的机器人「肌肉」,实质上是一些靠电力激活的装满油的袋子。这种致动器(即控制机器人移动的部分)就像人类肌肉一样强壮而高效,而且能在每秒钟进行更多次收缩。这种技术可以让义肢运动更加自然;或者在长期造出柔软而强壮的机器人,能在没有一不小心把你干掉的风险下帮你看家护院。


这种新型机器人肌肉被称为「液压驱动的可自修复静电致动器」,又名「hasel」。这类致动器有若干种设计方案,我们在下文中马上会提到。但总而言之,这类致动器都有一个装满油的袋子,袋子一侧由电极包围。给电极加上电压,电极间就会产生一个电场。


Science Robotics 论文的第一作者,科罗拉多大学博尔德分校的机械工程师 Nicholas Kellaris 说:「我们只是利用静电力来移动流体,通过向电极施力把液体泵入油袋的不同部位。」也就是说,hasel 致动器本身向内挤压。「这就是制造压力和运动,将结构变形从而致动的原理。」


如今,还有另外一些利用压缩气体或液体产生运动的软体致动器,但是这些致动器依靠额外的笨重的储存器来存储气体或液体。而 hasel 致动器利用的是致动器自身的柔性袋中的油。其流体不必从贮存器穿过长管作用于致动器,因此能让致动器的反应更快。


举例来说,研究者利用上述原理创造了环形 hasel 致动器。在被电极激活之后,它会变成甜甜圈的形状。Science 论文的第一作者、同样来自科罗拉多大学博尔德分校的机械工程师 Eric Acome 解释道:


「在这种情况下,我们在致动器的一部分施加电场,将液体推到所谓的未激活区。」通过从中间将油推到边缘从而制造一个类似甜甜圈的圆环,致动器就会变厚。把这些致动器堆成两组,每组代表一个「手指」,你就能精妙地抓住一颗树莓却不把它挤爆。(如文章开篇的图片所示)


再比如,你想让机器肌肉举起一些东西。为此,你需要一个由三条平行的油袋组成的矩形致动器。每个油袋上半部分都与电极连接。如果对电极施加电压,致动器会聚拢,并将油挤入袋子的另一半,从而看起来更像一个圆柱体。


这个过程缩短了整个矩形致动器的长度,从而提起了致动器底部的配重。(其实,你在家就可以试试。拿一个密封塑料袋,充进去一点空气,把塑料袋放平,按下其中的一侧,就能把另一端拉向你。)研究者可以将这些致动器堆叠起来,从而获得更大的力量。




所以, hasel 可以凭借骄人的力量和精度,实现举或握的动作。然而,用于驱动的电力是个挑战。电力并不是一种温和的力量——当你用它来控制软体机器人时,这一点尤为显著。这是因为软体机器人中用到的材料相对比较脆弱。


另一种软体致动器的操作原理和 hasel 类似。它利用相对的电极来挤压一块橡胶——但是这有可能会导致短路,那些通过摩擦而在橡胶表面累计起来的电荷会造成灾难性的故障。这就是油作为 hasel 致动器的屏障所能避免的问题。同样来自科罗拉多博尔德的 Tim Morrissey 表示:「电只是经过液体,然后液体瞬间重新分布,再次变得绝缘。因此,设备可以继续运行。」


实际上,与传统的由高度复杂的电机与齿轮箱组成的致动器相比,hasel 的美正在于它相对简洁。「这项工作将激励其他人探索有趣的方法结合不同的软材料创造新的致动器系统。」哈佛大学生物工程师 Cornor Walsh 这样说道。


不过,由于软体机器人比传统机器人脆弱得多,其设计者不得不担心它们一旦被刺穿随即失效(以及将油溅到地板上)的问题。因此,在其正式投入使用之前,软体机器人需要具有自修复能力的皮肤。事实上,某些软体机器人已经能做到了这一点。hasel 致动器的团队正在努力让 hasel 获得相同的能力。


一旦获得鲁棒性,各类软体机器人将会纷纷渗透到我们的生活中。传统僵硬的义肢可能变成更柔软、敏感的义肢。让机器人变得更柔软,能让我们更加安全地与它们并肩工作。这意味着它们不会取代人类的工作——却能补充人类的劳动。软体机器人毋庸置疑会成为我们的同伴,只不过是智能同伴还是智障同伴,仍然需要观望。


]]> 原文: http://ift.tt/2qz7lNH
RSS Feed

机器知心

IFTTT

效率低、易欺骗…什么阻碍了深度学习实现通用人工智能

撰文 | 邱陆陆


人工智能度过了轰轰烈烈的 2017,有人山人海的学术会议,也有雨后春笋般的新兴独角兽。而迈入 2018,我们除了观望创业者们如何在现实世界中搭建他们精心描绘的人工智能蓝图(起码搭个地基),也对注入了大量新鲜血液的研究领域抱有了更高的期待。


然而知名研究者,纽约大学心理学和神经科学教授 Gary Marcus 在新年第 2 天,就泼出了第一盆冷水:他在 arXiv 上发布了一篇长达 27 页的文章,历数今日的深度学习十大无法逾越的鸿沟,得出「深度学习不是人工智能的通用解决方案」的结论。



Gary Marcus 在 2017 机器之心 GMIS 大会上


机器之心第一时间编译了全文。然而尽管 Marcus 在文章开头强调本文「写给该领域的研究人员,也写给缺乏技术背景又可能想要理解该领域的 AI 消费者」,并且在抛出论点前给出了一小段背景介绍,但论述中仍然充满了容易让人分散注意力的大量专业术语。那么如果拨开这些藤蔓,Gary Marcus 在批判深度学习时,究竟在批判什么呢?


深度学习需要大量数据,但这为什么是一个弱点?


批评深度学习依赖大数据,其实是在批评它效率太低。


大数据究竟有多大?这里有一组具体的数字:


以 2012 年的 Krizhevsky,Sutskever 和 Hinton 的一篇知名论文为例:文章中的用于对 1000 类图像进行分类的模型有 65 万个节点,6000 万个参数,使用了 100 万个样本进行训练。



最简单的模型


这是什么概念?与世界上最简单的模型 y = mx + b 做对比,这里有 1 个自变量 x,有 2 个需要优化的参数 m 和 b,需要几个或者几十个样本来优化 m 和 b 的值。而一个 6 年前的深度学习模型里,就相当于有 65 万个 x,6000 万个 m,使用了 100 万个样本来优化参数的值。


6 年前的神经网络


然而这个模型训练好了之后,仅能分辨它见过的这 1000 类物体。作为对比,人类日常生活中常见的物体至少以万为单位,地球上的物体则以百万为单位。


不仅如此,他还提到了深度学习领域教父级人物 Geoffery Hinton 2017 年的一个观点:卷积神经网络(常用于处理图像的深度学习模型)可能会遭遇「指数低效」并由此走向失败。Hinton 的观点是,识别物体需要模型有捕捉各种转换的能力,虽然处理不变性转换(比如同一物体不同角度的转换)的能力已经在模型中存在了,但如果想要捕捉其他也普遍存在于自然界的转换,则需要在大量扩大模型规模(6000 万参数)和大量增加训练样本数量(100 万张图片)两种方法中至少二选其一——选择的结果是,模型需要的计算量指数上涨。


因此,Marcus 的第一个观点是,以这么铺张浪费的方法进行下去,别说通用人工智能了,就算是专用人工智能也会早早遇到计算的瓶颈而走不下去。


深度学习太「肤浅」:学到的都是表象而不是本质


换句话说就是谴责深度学习「背答案」。


Marcus 的谴责对象有大名鼎鼎的 DeepMind 家会打各种 Atari 游戏的强化学习模型。



DeepMind 的打砖块达人


Vicarious 的研究者发现,只要稍微改动一点设定,模型立刻就从高手变成连基本规则都不清楚的小白。



a:原版打砖块设定;b:加了一块打了没用的「墙」;c:把一半的砖块变成越打越多的「负砖块」;d:稍微挪动接球拍的高度;e:在砖块两端添加空隙;f:多个球

此外还有一些非常有自嘲精神的学者尝试以子之矛攻子之盾,自己调整数据「攻击」自己的模型。


研究者 Robin Jia 和 Percy Liang 建了 16 个阅读理解问答系统。原本在被问到「谁赢得了超级碗 XXXIII?」时,有 75% 的系统可以在阅读一小段文字后正确回答:John Elway。然而如果在这一段文字里插入「谷歌大神 Jeff Dean 曾经赢得 XX 碗比赛。」这句废话,能正确回答的系统比例锐减到了 36%。


他用这个例子来质疑,所谓「能学习抽象概念」的机器学习模型,是不是在「不懂装懂」呢?


深度学习太「单纯」:挖坑就跳,一骗一个准


最早提出深度学习系统的「可欺骗性(spoofability)」的论文可能是 Szegedy et al(2013)。然而四年过去了,尽管研究活动很活跃,但目前仍未找到稳健的解决方法。


Marcus 举出了更多人类用简单手段给深度学习模型挖坑的例子——甚至都不算是挖坑了,这基本相当于平地摔。


比如有深度学习的图像描述系统将黄黑相间的条纹图案误认为校车:


把 3D 打印的乌龟模型误认为是步枪:




更致命的可能是交通标志错误识别:




一个最新的例子,只要在日常场景里加如一小张带花纹的贴纸,香蕉就会被误认为是烤面包机:


因此,恐怕自动驾驶汽车在上路之前,是不是要先尝试找出上述问题的解决方案,或者,制定完备的应对措施呢?


错的不是深度学习,而是你


在罗列了深度学习模型与通用人工智能之间的种种不可逾越的鸿沟之后,Marcus 话锋一转:其实深度学习的本质就是以概率论为代表的数学,它很有用,但它的底层数学基础限定了它的有用范围:它是数据足够多的封闭式的分类问题的一个几乎完美的答案,但也仅仅是这类问题的答案。


通用人工智能根本就不是这类问题,因此错的不是深度学习,而是对深度学习抱有错误期望的你:你指望一个特别好用的电动螺丝刀帮你锯木头、测电压、量尺寸?


因此 Marcus 这篇长文的真正目的是,谴责媒体和投资人对于 AI 概念的过度炒作并预警:这样的炒作只会带来大量的期望泡沫,而随着时间推移、泡沫破灭,70 年代的人工智能低谷会卷土重来,失望的资金会如同潮水一样离开这个领域。而且这一切已经初现苗头,《连线》杂志最新的文章《自动驾驶步入幻想破灭阶段》,就是一个很好的例子。


他用了一个机器学习中的数学术语描述这一现象,「局部极小值陷阱」。




机器学习模型选择最合适的参数的过程,就像在这条弯弯曲曲的函数线上通过小步摸索的办法寻找最小值,路线上有太多看起来像最小值的小坑洼,而真正的最小值只有一个。


我们探索最聪明的 AI 的路径也一样,在起伏的山路上寻找最低点,可山路上充满着看起来像最低点的小坑洼。我们有没有过分沉迷于这样远非最佳的小坑洼呢?有没有过于专注地探索可用但局限的模型、热衷于摘取易于获取的果实,而忽略那些风险很大,但是最终或许可以带来更稳健发展的「小路」呢?


深度学习虽好,但没有那么好。调整过高的预期,转移过分集中的关注点,放平心态不要急于求成,或许才是热潮中的我们应该做的事情。


]]> 原文: http://ift.tt/2CKXJnW
RSS Feed

机器知心

IFTTT

2018年1月4日星期四

又快又贱又失控?机器人教父Rodney Brooks预测AI未来32年历史进程

唐旭 编译整理量子位 出品 | 公众号 QbitAI

Rodney Brooks的头衔太多了:澳洲科学院fellow、美国国家工程院院士、国际人工智能协会(AAAI)创始会员、作家、机器人企业家、MIT机器人教授、MIT计算机科学和人工智能实验室前主任、iRobot创始人及前CTO、RethinkRobotics前CTO及联合创始人……

作为机器人领域祖师爷级别的学者,Brooks也是机器人行为主义学派的旗帜性人物。而这位大神不仅在学术领域建树卓著,在1997年上映的电影《又快又贱又失控》(Fast, Cheap&Out of Control)中,Brooks还作为主角之一本色出演了一把自己。

最近,这位机器人世界的传奇在自己的博客上发表了一篇题为《My Dated Predictions》的文章。文中,Brooks先是作为一名长者将当下媒体对于AI的大肆热炒进行了一番委婉的批判;进而以32年为一个节点,对于AI在未来,也就是2050年之前的发展状况做了一波"科技现实主义"的预测。

Brooks还说,他会对自己所说的东西负责。而至于为什么选择32年这个时间段,Brooks表示那时候我都95了,甭管这些对不对,反正我没力跟你们吵了。

这篇预测得到了不少美国人工智能和机器人研究界人士的推荐,特别难得的,深度学习教父级人物Yann LeCun和坚持为深度学习泼冷水的Gary Marcus不约而同地分享转发表示赞同。

原文地址在这里:

http://ift.tt/2CcmMMR

量子位将Brooks所作预测部分整理如下,一起来看看在Brooks的预测下,无人车、AI、机器人、太空旅行等等领域,何时才能出现一个够快够贱够失控的未来:

关于无人车的预测

无人车的预测表格里,前三行都是关于飞行汽车的。

我非常确定那些会在将来投入使用的飞行汽车要极大地依赖于自动驾驶,因此,它们也可以被归入这一类。我的意思是,这类飞行汽车也应该能去到任何普通汽车能去的地方,不然那就不是一辆"车";同时,一个不需要驾照,但可能需要完成几个小时特殊训练的普通人,应该能够穿着他(她)日常办公的衣服驶过100英里,而大部分的路程会在空中度过。

这趟行程应该不需要任何事先安排与计划,也不需要任何除使用地图app之外的行动。换句话说,除了所需的那一点额外训练,它完全应该达到今天一个普通人乘坐一辆传统汽车行驶100英里的效果。

现在我们来谈无人车。2017年早些时候我写过两篇关于无人车的博文,一篇谈的是无人车可能造成的意外后果,比如行人和其他司机会以不同的方式来对待他们,以及这些无人车可能会如何对外界人类造成反社会行为。那篇文章还指出,有些人会以一些从未在传统汽车身上尝试过的方式来使用无人车,而那本身可能就是反社会行为。

第二篇博文则是关于都市环境的一些边界情况:哪里有司机必须注意的临时标志、哪里时不时就变得不让人开车、哪里要弄明白乘客在这有多大控制权、哪里警察和拖车司机必须要和这些无人车进行交互、哪里正常的人类司机间的交互基本就不存在了。

于我而言,很明显,这些无人车不会成为与正常汽车一样的那类汽车。它们不需要人类司机。它们基本会是用不同模式、不同方式来改变世界的一些野兽。

当年汽车替代马车,并不是简单地一对一地发生的:它们需要一套全新的道路设施、一个全新的所有权模式、一种全新的利用模式、全然不同的燃料和保养程序,造成了不同的乘客死亡率、不同级别的舒适度——最终,它们促成了一种全然不同的城市结构。

我想当前一种流行的论调是无人车会简单、一对一地替代掉人类司机。我完全不认为这会发生。与之不同的是,我们的城市将会换上为无人车准备的特殊道路,对它们能跑和普通汽车能跑的区域进行限定,更改允许接送区域灵活度的标准,更改停车规定,总之,在我们的城市中会有各种小的增量调整。

但首先我们来讨论一下无人车的接纳率。

1987年, ErnstDickmanns和他在慕尼黑联邦国防军大学的团队就在一条开放高速公路上让他们的无人车以每小时90公里的速度行驶了20公里。当然,车里有人,只不过没把着方向盘。在过去30年里,研究者一直在试图提高汽车在公共道路上行驶的能力,但这些工作大部分是关于驾驶的,很少是关于交互、接送乘客或是其他服务和限制的接口。所有这些都非常重要。

从某一个角度上说,虽然过去30年里的工作只关注了很小一部分的问题,我们依然收获了缓慢的进展。一年前,我看到了一条我很喜欢的推特,大意就是"乘客们知道自己打到了一辆自动驾驶的Uber,因为前面坐了两个人而不是一个。"直到几周之前,我们才在凤凰城看到了行驶在公共道路上的真·无人车。一条推特将它们称作第一批"无人驾驶的无人车"。

但无人车离真正被接纳还差很远。传感器的价格依然太高,所有与乘客操作相关的东西都还没被弄明白,更别提实际中的监管以及这些车对于环境的责任了。在这些约束之下,问题最终会被解决,不过会比期望中慢得多。

对于无人车可靠性的真正考验,不会停留在测试或展示上,而是无人出租车拥有者、出行服务提供商和无人车停车场开始在这上面赚钱的时候——这件事会逐步地发生,并且从有限的地理环境和市场上开始。我的预测可不是关于展示的,而是真正可持续的生意。搞不定这些无人车永远别想上路。

我认为,要讨论无人车会如何被采纳的话,我们需要判定地理"围墙",也就是确定那些地点被允许发生特定的无人车行为,且邻近没有人类驾驶的汽车。进而,无人车应用会被最初限定于特定城市的特定区域,甚至特定天气下的特定时段。这样的话,体验无人车出行服务可能还要等好一段时间。

关于机器人、AI和机器学习的预测

读过我以前博文的朋友知道,其实我对于新事物在真实世界中传播铺展速度的预估比那些拉拉队员和杞人忧天者更甚。而我如下的预测都基于这种对"高速度"的乐观。

一部分是关于公众对AI看法的,一部分是关于技术观点的,还有一部分是关于部署计划的。

这些预测看上去可能有点随意杂乱——它们也确实是这样——但这就是机器人、AI和机器学习未来进步的方式。突然出现一个能完成所有人类(或大猩猩)行为的通用人工智能是不可能的,未来很长一段时间,单点解决方案都会是主流。

打造人类水平的智慧或人类水平的物理行动能力是非常、非常困难的。过去五年,这方面的进步有一次小的爆发,不少人就以为这事已经成了。事实上,这条路我们连1%都没走完,与此同时我们甚至不知道该怎么走到5%。是,这俩数是我编出来的,我也证明不了。

我其实可能已经把这俩数夸大了10倍不止。我道歉。

关于太空旅行

从小,我父亲每周从阿德莱德飞到南部的伍默拉去给欧洲卫星发射计划的第一级引擎做研发工作时,我就是个星际旅行的粉丝。每隔几个月的一个周五晚,他都会带我去一个爱好者组织的俱乐部,那会有来自NASA的最新视频片段播放,并组织讨论。

那时我就决定,我的人生目标就是最终住到另一个星球上。到现在,我只是做到了没在离开地球前死掉。现实一点看,我可能完成不了这个目标了。

所以这就是我对于太空旅行的预测。并不那么乐观,但保证现实。

OMT

Yann LeCun和Brooks还在这篇博文底下进行了一点小小的讨论。

LeCun留言说:

你写在这的所有东西我几乎全部同意,除了,我会把"深度学习"的每个例子都换成"监督学习"。对深度学习(集合参数化的功能块并基于梯度方法对其进行优化)的总体看法应该不会消散。20世纪早些时候就有人会觉得蒸汽机会退出历史舞台,而它们并没有简单地消失,即使是蒸汽机消失了,关于热机的整体思想还在。深度学习就像热机,而不是蒸汽机。

Rodney Brooks的回复:

谢谢大兄弟。我的意思并不是说深度学习的总体思想会消失,我是想说,围绕着深度学习的那些泡沫会散掉。过去五年的所有技术都在这,它们也会继续发挥作用。但是,未来几年会出现一个新的"AI力量"的代表,同时围绕它也会出现新的泡沫。那些投向顶尖学校的研究生学位申请会以更高的频率提及这个全新的代表,而不是"深度学习"——现在这个词可是在那些AI/CS研究生项目的申请里用烂了。

更多内容和精彩评论请看原文:

My Dated Predictions

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2CJ2Q8d
RSS Feed

RSS5

IFTTT

又快又贱又失控?机器人教父Rodney Brooks预测AI未来32年历史进程

唐旭 编译整理量子位 出品 | 公众号 QbitAI

Rodney Brooks的头衔太多了:澳洲科学院fellow、美国国家工程院院士、国际人工智能协会(AAAI)创始会员、作家、机器人企业家、MIT机器人教授、MIT计算机科学和人工智能实验室前主任、iRobot创始人及前CTO、RethinkRobotics前CTO及联合创始人……

作为机器人领域祖师爷级别的学者,Brooks也是机器人行为主义学派的旗帜性人物。而这位大神不仅在学术领域建树卓著,在1997年上映的电影《又快又贱又失控》(Fast, Cheap&Out of Control)中,Brooks还作为主角之一本色出演了一把自己。

最近,这位机器人世界的传奇在自己的博客上发表了一篇题为《My Dated Predictions》的文章。文中,Brooks先是作为一名长者将当下媒体对于AI的大肆热炒进行了一番委婉的批判;进而以32年为一个节点,对于AI在未来,也就是2050年之前的发展状况做了一波"科技现实主义"的预测。

Brooks还说,他会对自己所说的东西负责。而至于为什么选择32年这个时间段,Brooks表示那时候我都95了,甭管这些对不对,反正我没力跟你们吵了。

这篇预测得到了不少美国人工智能和机器人研究界人士的推荐,特别难得的,深度学习教父级人物Yann LeCun和坚持为深度学习泼冷水的Gary Marcus不约而同地分享转发表示赞同。

原文地址在这里:

http://ift.tt/2CcmMMR

量子位将Brooks所作预测部分整理如下,一起来看看在Brooks的预测下,无人车、AI、机器人、太空旅行等等领域,何时才能出现一个够快够贱够失控的未来:

关于无人车的预测

无人车的预测表格里,前三行都是关于飞行汽车的。

我非常确定那些会在将来投入使用的飞行汽车要极大地依赖于自动驾驶,因此,它们也可以被归入这一类。我的意思是,这类飞行汽车也应该能去到任何普通汽车能去的地方,不然那就不是一辆"车";同时,一个不需要驾照,但可能需要完成几个小时特殊训练的普通人,应该能够穿着他(她)日常办公的衣服驶过100英里,而大部分的路程会在空中度过。

这趟行程应该不需要任何事先安排与计划,也不需要任何除使用地图app之外的行动。换句话说,除了所需的那一点额外训练,它完全应该达到今天一个普通人乘坐一辆传统汽车行驶100英里的效果。

现在我们来谈无人车。2017年早些时候我写过两篇关于无人车的博文,一篇谈的是无人车可能造成的意外后果,比如行人和其他司机会以不同的方式来对待他们,以及这些无人车可能会如何对外界人类造成反社会行为。那篇文章还指出,有些人会以一些从未在传统汽车身上尝试过的方式来使用无人车,而那本身可能就是反社会行为。

第二篇博文则是关于都市环境的一些边界情况:哪里有司机必须注意的临时标志、哪里时不时就变得不让人开车、哪里要弄明白乘客在这有多大控制权、哪里警察和拖车司机必须要和这些无人车进行交互、哪里正常的人类司机间的交互基本就不存在了。

于我而言,很明显,这些无人车不会成为与正常汽车一样的那类汽车。它们不需要人类司机。它们基本会是用不同模式、不同方式来改变世界的一些野兽。

当年汽车替代马车,并不是简单地一对一地发生的:它们需要一套全新的道路设施、一个全新的所有权模式、一种全新的利用模式、全然不同的燃料和保养程序,造成了不同的乘客死亡率、不同级别的舒适度——最终,它们促成了一种全然不同的城市结构。

我想当前一种流行的论调是无人车会简单、一对一地替代掉人类司机。我完全不认为这会发生。与之不同的是,我们的城市将会换上为无人车准备的特殊道路,对它们能跑和普通汽车能跑的区域进行限定,更改允许接送区域灵活度的标准,更改停车规定,总之,在我们的城市中会有各种小的增量调整。

但首先我们来讨论一下无人车的接纳率。

1987年, ErnstDickmanns和他在慕尼黑联邦国防军大学的团队就在一条开放高速公路上让他们的无人车以每小时90公里的速度行驶了20公里。当然,车里有人,只不过没把着方向盘。在过去30年里,研究者一直在试图提高汽车在公共道路上行驶的能力,但这些工作大部分是关于驾驶的,很少是关于交互、接送乘客或是其他服务和限制的接口。所有这些都非常重要。

从某一个角度上说,虽然过去30年里的工作只关注了很小一部分的问题,我们依然收获了缓慢的进展。一年前,我看到了一条我很喜欢的推特,大意就是"乘客们知道自己打到了一辆自动驾驶的Uber,因为前面坐了两个人而不是一个。"直到几周之前,我们才在凤凰城看到了行驶在公共道路上的真·无人车。一条推特将它们称作第一批"无人驾驶的无人车"。

但无人车离真正被接纳还差很远。传感器的价格依然太高,所有与乘客操作相关的东西都还没被弄明白,更别提实际中的监管以及这些车对于环境的责任了。在这些约束之下,问题最终会被解决,不过会比期望中慢得多。

对于无人车可靠性的真正考验,不会停留在测试或展示上,而是无人出租车拥有者、出行服务提供商和无人车停车场开始在这上面赚钱的时候——这件事会逐步地发生,并且从有限的地理环境和市场上开始。我的预测可不是关于展示的,而是真正可持续的生意。搞不定这些无人车永远别想上路。

我认为,要讨论无人车会如何被采纳的话,我们需要判定地理"围墙",也就是确定那些地点被允许发生特定的无人车行为,且邻近没有人类驾驶的汽车。进而,无人车应用会被最初限定于特定城市的特定区域,甚至特定天气下的特定时段。这样的话,体验无人车出行服务可能还要等好一段时间。

关于机器人、AI和机器学习的预测

读过我以前博文的朋友知道,其实我对于新事物在真实世界中传播铺展速度的预估比那些拉拉队员和杞人忧天者更甚。而我如下的预测都基于这种对"高速度"的乐观。

一部分是关于公众对AI看法的,一部分是关于技术观点的,还有一部分是关于部署计划的。

这些预测看上去可能有点随意杂乱——它们也确实是这样——但这就是机器人、AI和机器学习未来进步的方式。突然出现一个能完成所有人类(或大猩猩)行为的通用人工智能是不可能的,未来很长一段时间,单点解决方案都会是主流。

打造人类水平的智慧或人类水平的物理行动能力是非常、非常困难的。过去五年,这方面的进步有一次小的爆发,不少人就以为这事已经成了。事实上,这条路我们连1%都没走完,与此同时我们甚至不知道该怎么走到5%。是,这俩数是我编出来的,我也证明不了。

我其实可能已经把这俩数夸大了10倍不止。我道歉。

关于太空旅行

从小,我父亲每周从阿德莱德飞到南部的伍默拉去给欧洲卫星发射计划的第一级引擎做研发工作时,我就是个星际旅行的粉丝。每隔几个月的一个周五晚,他都会带我去一个爱好者组织的俱乐部,那会有来自NASA的最新视频片段播放,并组织讨论。

那时我就决定,我的人生目标就是最终住到另一个星球上。到现在,我只是做到了没在离开地球前死掉。现实一点看,我可能完成不了这个目标了。

所以这就是我对于太空旅行的预测。并不那么乐观,但保证现实。

OMT

Yann LeCun和Brooks还在这篇博文底下进行了一点小小的讨论。

LeCun留言说:

你写在这的所有东西我几乎全部同意,除了,我会把"深度学习"的每个例子都换成"监督学习"。对深度学习(集合参数化的功能块并基于梯度方法对其进行优化)的总体看法应该不会消散。20世纪早些时候就有人会觉得蒸汽机会退出历史舞台,而它们并没有简单地消失,即使是蒸汽机消失了,关于热机的整体思想还在。深度学习就像热机,而不是蒸汽机。

Rodney Brooks的回复:

谢谢大兄弟。我的意思并不是说深度学习的总体思想会消失,我是想说,围绕着深度学习的那些泡沫会散掉。过去五年的所有技术都在这,它们也会继续发挥作用。但是,未来几年会出现一个新的"AI力量"的代表,同时围绕它也会出现新的泡沫。那些投向顶尖学校的研究生学位申请会以更高的频率提及这个全新的代表,而不是"深度学习"——现在这个词可是在那些AI/CS研究生项目的申请里用烂了。

更多内容和精彩评论请看原文:

My Dated Predictions

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2CJ2Q8d
RSS Feed

RSS5

IFTTT

LangChain 彻底重写:从开源副业到独角兽,一次“核心迁移”干到 12.5 亿估值 -InfoQ 每周精要No.899期

「每周精要」 NO. 899 2025/10/25 头条 HEADLINE LangChain 彻底重写:从开源副业到独角兽,一次"核心迁移"干到 12.5 亿估值 精选 SELECTED 1000 行代码手搓 OpenAI gpt-oss 推理引...