AI 人工智能新闻资讯

2018年9月1日星期六

11个React Native组件库；如何设计个分布式文件系统；Julia极简入门教程 - 每周精要552期

中文站「每周精要」

感谢您订阅每周精要第 552 期，本期内容截止于2018-09-02。

技术新闻 TECH NEWS

谷歌推出最新AngularJS升级工具，可快速迁移至Angular

由于Angular不兼容AngularJS，这让很多用AngularJS的开发者感觉被谷歌抛弃了，纷纷转向其他的框架，而坚持使用Angular的开发者也开始了迁移之路。

IntelliJ IDEA 2018.2支持Java 11、MacBook Touch Bar等新特性

近期，JetBrains发布了其旗舰产品IntelliJ IDEA的2018.2版本。新版本支持即将推出的Java 11、断点意图、MacBook的Touch Bar等特性，并改进了Spring Boot、Scala和Docker插件。

吊打OpenAI！谷歌重磅开源强化学习框架Dopamine

谷歌推出了一款全新的开源强化学习框架Dopamine，该框架基于TensorFlow，主打灵活性、稳定性、复现性，能够提供快速的基准测试。

你应该知道的11个React Native组件库

在查看了大量有用的React和Vue组件库之后，根据大众的需求，我们列出了一个有用的React-Native UI库列表，可以帮助你更好地入门React Native。

Amazon Aurora Serverless MySQL已正式可用

Amazon Aurora是AWS定制的MySQL和PostgreSQL兼容数据库，最近提供了新的功能——Aurora Serverless MySQL。

架构设计 ARCHITECTURE DESIGN

如何实现靠谱的分布式锁？

当前使用较多的分布式锁方案主要基于 Redis、ZooKeeper 提供的功能特性加以封装来实现的，本文会简要分析下这两种锁方案的处理流程以及它们各自的问题。

REST将会过时，而GraphQL则会长存

在本文中，作者介绍了GraphQL的基本原理和设计思想，以及如何借助其灵活性来解决RESTful API面临的问题，并且探讨了灵活性所带来的成本。

如果要设计个分布式文件系统，该从哪些方面考虑？

本文试图分析和思考，在分布式文件系统领域，我们要解决哪些问题、有些什么样的方案、以及各自的选择依据。

运维 & DevOps OPERATIONS & DEVOPS

AWS与VMware两强再合作，将亚马逊关系型数据库服务带到VMware

当VMware和AWS合作，他们能给其他IT和云计算市场单打独斗的竞争者带来巨大的冲击。

MySQL太慢？试试这些诊断思路和工具

如果遇到MySQL慢的话，你的第一印象是什么，如果MySQL数据库性能不行，你是如何处理的？

细思恐极：难以消除的个人信息安全隐患

你是否也发现自己的微博、微信、抖音等社交账号会莫名其妙自动增粉或关注他人，并且经常收到垃圾广告短信？

大前端 THE FRONT END

从Sun离职后，我"抛弃"了Java，拥抱JavaScript和Node

文章作者如何从Java死忠变成Node.js和JavaScript死忠的。

Babel 7.0正式发布，支持TypeScript，JSX Fragment

本次是三年前发布v6.0之后的最大更新。

你的JavaScript依赖库可能并不安全

人们通常忽视了存在软件包中的风险。虽然这些第三方模块在某些方面特别有用，但也会往你的应用程序中引入一些安全风险。

人工智能 ARTIFICIAL INTELLIGENCE

整合AI和数据科学新利器：基于Apache Spark的Hydrogen项目

本文涵盖了从Hydrogen项目如何帮助开发者在Spark实现机器学习和人工智能框架，到该项目与其他开源项目的区别。

新语言不焦虑！这里有一份Julia极简入门教程

Julia极简入门教程，希望可以帮到你！

AI一周热闻：滴滴顺风车全国下线；王斌加盟小米；特斯拉放弃私有化

新鲜事，简单报，一周热闻盘点准时到！

区块链 BLOCKCHAIN

项目方说性能达到百万TPS，如何测试它的可信度？

百万TPS，如何测试它的可信度？

交易少了，Coinbase工程师终于有机会做总结了

Coinbase工程师的总结

币圈自媒体被封，我们更应该去理解到底什么是区块链！

本文介绍区块链到底是什么，作为一种软件技术，它应该跟人工智能、大数据等其它技术一样，需要被大家重视起来。

技术大会 CONFERENCE

QCon：异地多活单元化架构下怎么做微服务体系？

蚂蚁金服（当时还是支付宝）从 2013 年起就运行在单元化架构上，除了具备异地容灾能力外，还能做到异地多活，可随时在多城市、多数据中心调配流量。其中的技术思路了解一下？

CNUTCon：2018年怎么升级运维人的核心竞争力？

CNUTCon全球运维技术大会邀请了来自Twitter、百度、阿里、腾讯、华为、京东、美团、网易、eBay等公司的技术专家，分享智能时代下运维的新趋势、新思路、新技术和实战经验，向你系统阐述在落地AIOps等相关技术的实践中，遇到的问题和对应的解决方案。

ArchSummit：阿里巴巴User Growth的实践经验

以擅长运营著称的阿里在国际业务上全面开花，利用中台战略，正确使用工具和算法，以此获得精准用户，阿里专家将分享宝贵经验。

AICon：从数据到智慧，知识图谱如何推动金融更加智能？

随着人工智能的技术发展和应用，知识图谱逐渐成为关键技术之一。本期带大家来看一看知识图谱落地金融，让AI更懂业务……

极客时间App GEEK TIME APP

Warning，容器正在吃掉软件世界，你需要跟上脚步！

在过去的几年时间里，以Docker、Kubernetes为代表的容器技术悄然发展成为一项通用技术。来跟Kubernetes项目维护者张磊，深入拆解Kubernetes，你会发现容器王者Kubernetes原来也可以如此简单，点击免费试读。

码农向高级程序员进阶的最后一公里是什么？

许多程序员的技术能力总会到一定时间遇到职业瓶颈，如果没有技术大牛在前引航和持续性的学习，将会面临很多门槛和弯路。试试极客时间企业帐号，团队一起学习，打通最后一公里向高级程序员进阶。

身为技术人，应该具备哪些管理知识？

不管你愿不愿相信，对于互联网技术人来说，"带团队"不再是一个可选项，而是迟早都要面对的事儿。推荐极客时间《技术管理实战36讲》专栏，前百度最佳经理人刘建国为你解惑团队 leader 的36个场景，传授打造高效团队的13种方法，分享十年管理的"战地笔记"。

活动推荐 POPULAR EVENTS

我要偷走你的芯！他们用什么玩转AI

市场上AI专用芯片那么多，谁才是真命天子？UCloud盯上了数据中心内大量部署的、每台服务器都会配备的X86通用处理器。基于英特尔至强服务器，推出UCloud AI在线服务（UAI-Inference），用AI普惠中小企业和创业公司。

大数据与微服务，怎使移动和Web应用构建"So Easy"？

初秋杭州，AWS 资深架构师布道西湖畔！9月15日，一起来探讨无服务器架构、标准查询语言GraphQL和高性能数据库设计的新思考与实践吧！

AI小白也能开发对话机器人？这个教程请拿走

9月6日14:00，InfoQ邀请到百度NLP产品架构师田凯，如何更好的进行对话上下文建模、BOT智能程度的评价；如何创建一个BOT并集成到自己的业务系统与产品中。

原汁原味云原生，CNCF官方论坛登陆中国

Linux基金会旗下CNCF携重磅论坛来中国啦，200余位技术专家和超過200+技术专家带来的议题，覆盖Kubernetes、Prometheus等热门技术，全面来袭！

InfoQ中文站每周日针对会员发送每周内容精要邮件，

别人转发给你的邮件？现在注册获取您自己的 InfoQ每周精要邮件吧。

InfoQ微博：@InfoQ

InfoQ微信：infoqchina

InfoQ手机客户端：极客时间

苹果无人车撞了！交出一血

李根发自凹非寺量子位报道 | 公众号 QbitAI

哪里讲理去？

苹果也是不走运，最不想谈论的无人车项目，最近发生了第一起车祸事故。

但果粉放心，不是苹果的锅。

事情要从美国太平洋时间8月24日说起，当时中国这边已到中元节，下午14:58，苹果无人车正在自家总部附近转悠，万万没想到，就这样被人追尾了。

当是时，苹果为无人驾驶路测而改装的雷克萨斯RX 450h，处于自动驾驶状态（车内有安全员），正伺机从匝道进入高速，时速1.6公里左右——非常小心翼翼了。

但此时，从后面来的2016款日产Leaf，以25迈的时速，从后撞上了苹果无人车。

结果是苹果的雷克萨斯车尾受损，日产Leaf前部遭创，但双方都没有人受伤。

事故处理完成后，苹果也按规定向加州交管局主动提交了报告。

报告中详细说明了事故时间、地点、撞车部位，以及当时的各种外部环境等。

不过对于事故责任问题，苹果没有提及，后续也没有对外发表评论。

根据整个过程来看，谁是谁非，应该并不难断。

也不知道那位追尾的日产车主，知道自己撞上苹果无人车后，是一种怎样的心情？

苹果又被diss了一番

但苹果这一边肯定不会心情愉快。

由于这"第一起事故"，苹果无人车又被各大外媒批判了一番。

针对的也不是苹果无人车事故本身，而是又双叒叕提到了苹果自动驾驶进展缓慢的问题。

眼看还有2周就要迎来新iPhone发布，你说这不是破坏祥和美好的气氛吗？

路透在报道说中，苹果上下都很少谈论自动驾驶计划，而且起步还很晚，Google等搞了好几年，苹果才开始打算测试，要努力啊。

The Verge则直接提到了Titan项目的困境，说这个传闻中的无人车野望计划，正在离初心愿景越来越远，当初说好要软硬件一起整，现在都没啥正面消息出来。

甚至连一向对苹果理解万岁的9to5mac，谈到苹果无人车时也用了"令人困惑"这样的说法，认为苹果自动驾驶在过去一年里的进展，可能真到了实锤太少而无话可说的地步。

总之，不管买不买，也不管苹果以后如何来割肾，现在大家对苹果无人车的进展，都不太满意。

毕竟你可是苹果，你可是always重新定义一切的公司，你还是首家冲破万亿美元市值的科技巨头。

无人车竞速时代，你怎么能掉队呢？

苹果新进展

苹果也并非全无进展。

就是2周前，加州车管局还确认过，目前苹果无人驾驶路测车队，规模已是55车、83驾驶员。

这样规格的车队，不止加州，就是放眼全世界，恐怕也就Waymo和Uber能够相提并论了。

而且今年7月，由于把涉嫌盗取商业机密的华人员工告上法庭，苹果还被动披露了更多新进展。

比如以访问权限来算，能访问无人车核心机密的有2700人，能登入Titan——苹果无人车项目代号——则多达5000人。

虽然这个数目在13.5万的苹果全职员工中，不算多，但作为一个看起来颇为初创的项目，投入确实不菲了。

类比来说，就算是以中国无人车"国家队"自居的百度，Apollo道路之前，也才300人左右的研发规模。

另外，苹果无人车"盘子"也很大。

还是在诉告华人工程师的案子中，苹果提到了自动驾驶实验室，并且谈到了电路板、专用芯片等方面的事项。

一直以来，对于苹果如何开展自动驾驶业务，外界猜测并不少。

软件系统自不必言，这是苹果的强项所在，但涉及芯片、电路板等硬件，却也着实是头一回曝光。

如此看来，苹果未来很可能倾向于打造自研软硬件套装，然后卖给车厂。

以爆料苹果知名的分析师Ming-Chi Kuo，近期也评论过Apple Car。

他认为汽车行业当前出现的变革，明显是软件定义硬件、新技术重新定义旧行业，跟10年前智能手机面临的机遇大同小异。

而对于苹果而言，用AI、AR重新定义汽车，有基础优势。并且苹果手握重金，通过车还能进入汽车金融等领域，对未来业务增长非常有利。

最后，苹果还能把当前的消费电子领域的成功，延续到汽车行业，还能进行主导性整合，软件+硬件+服务，这条路苹果太熟门熟路了。

但上述分析归分析，具体苹果汽车真正推出，Ming-Chi Kuo预测还需要5-7年的时间，即2023年至2025年。

这算久吗？

苹果无人车前世今生

对果粉而言，肯定不算。

毕竟4年都过来了，又何惧再等5-7年？

苹果无人车项目，最早可追溯至2014年，内部代号Project Titan。

当时该项目一建立，就吸引了多名苹果资深员工加入，还招募了一些造车方面的工程师，"造车"这个方向几乎不言自明。

起初，Project Titan的工程师们聚焦在各种造车的细节上：怎么搞一个静音车门，没有方向盘和油门的情况内饰怎么设计，怎么把AR/VR设备放到车里，甚至他们还准备重新设计一款更美观的激光雷达、怎么应用球形轮胎……

2015年，苹果还买下了三个与之相关的顶级域名，包括：apple.car，apple.cars和apple.auto。

不过迄今为止都没有启用。

高峰时期，苹果在Project Titan项目上投入的员工，据说有上千人的规模。大名鼎鼎的"强纳肾"Jonathan Ive也参与了苹果车的设计开发。

不过这个项目在2016年遭遇了严重的危机，不少项目的核心人物纷纷退出，团队规模也大幅缩减。外界用泰坦（Titan）陨落来形容这一变故。

直到去年，苹果无人车项目才缓过一口气来。

去年4月，苹果获得了加州的无人车路测许可。当时获批的三辆测试无人车全部都是2015款雷克萨斯RX450h。此前，苹果购入了不少雷克萨斯进行改装测试。

随后，苹果无人车使用的系统Apple Automated System也被曝光。（今年苹果无人车的一些专利也对外公开，包括手势控制变道等）

紧接着2017年6月，苹果CEO库克首次详细谈及无人车战略，他透露苹果正在专注于自动驾驶技术的研发。

库克说："我们认为这是所有AI项目之母"。更早之前的4月，苹果无人车获得了加州路测许可。

这让人看到新希望，同时苹果也被曝光改弦更张，希望更快推出无人车产品——让一部分人先看到未来。

所以就在今年5年，苹果无人车有了实锤进展，与大众汽车达成合作协议，共同研发自动驾驶的无人车。

而且发布时间，可能会在2019年。

但别高兴太早，因为这更像是一个"面子工程"或"展示项目"，因为从目前信息来看，改装称无人驾驶的面包车，会主要用于园区内通勤，接送员工什么的，跟真正对外还距离很远。

总之，有胜于无吧，还要啥自行车呢？

首次车祸事故简史

最后，既然这是苹果无人车的第一次事故，不妨也一起回顾下其他无人车公司的第一次。

先说目前全球"遥遥领先"的Waymo。

2016年还以Google无人车之名行事，在当年2月14日，也是Google总部附近，也是一辆雷克萨斯RX450h，也是在低速行进中被人类司机追尾，跟今日苹果第一次，颇为相似。

唯一不同的是，当时追尾Google无人车的车辆，是一辆更结实庞大的公交车。

当然，Google无人车搞得早，也遭遇过更严重的事故。

最严重的一次是2016年8月，当时正处于自动驾驶状态的无人车，在进入十字路口时被一辆闯红灯的商务货车撞了，当时安全气囊都已全部弹出，右侧车门严重下凹，但所幸无人员伤亡。

不过那一次事件里，Google也趁机向全世界强调了无人车的安全性，说无人车就不会有闯红灯的问题，Google无人车正是为减少人类司机不当操作而生，自动驾驶会让交通更安全。

然而行业初期，独善其身可不够，猪队友一个接一个。

一个猪队友是特斯拉。

在2016年5月，处于"自动驾驶"状态的特斯拉Model S，在十字路口撞上一辆白色卡车，由于没有刹车操作，连挡风玻璃都撞进了卡车底部，特斯拉车主当场死亡。

后来报告显示，核心原因是特斯拉Model S在强烈日光下，没能"看清"白色车身的卡车。

虽然这起致死车祸，没直接影响特斯拉销售，但由于一直把高级辅助驾驶当"自动驾驶"宣传，特斯拉的车祸让自动驾驶又被热议了一把。

直到后来特斯拉"自动驾驶"车祸曝光多了，吃瓜群众才开始厘清，特斯拉的自动驾驶比较特殊。

然而另一大猪队友Uber，就真给行业拖后腿了。

Uber无人车第一次车祸，发生在2017年3月，当时在Uber测试的亚利桑那州，下午18点，被违规行驶的人类驾驶车辆撞得侧翻。

其时Uber无人车处于自动驾驶状态，驾驶座也有安全员，但来不及躲闪，所幸无人员伤亡，后来警方也判定：Uber无责。

但迄今最严重的一次，完全就是Uber无人车的责任了。

今年3月18日，依然还是亚利桑那州，Uber无人车没有感知到横穿马路的行人，没有减速，安全员也没任何反应——后来调查是正在玩手机，最后导致被撞人死亡。

这是全球第一起无人车撞人致死事故，让整个行业都陷入尴尬。

而后来调查显示，这是一起完全可以避免的事故，但Uber在安全性方面的失职、技术上的差劲，最后让整个行业一起埋单。

当然，目前为止，还没有一起中国无人车玩家的"车祸事故"。

一方面是在加州路测的玩家普遍谨慎、安全意识很高，而且车辆也不算多，即便被撞，概率也没有waymo和苹果这样高。

另一方面是国内刚刚出台相关路测法规和机制，之前发生的事故可能更倾向于隐秘不闻。

但可以肯定的是，中国无人车玩家并非没有车祸事故。

在西二旗往北的路段，都发生过不少无人车事故，而且据传还有一些"职业"碰瓷的人类司机。

他们乐于追尾无人车，然后给出"给钱私了"或"去交通队"的选项。

一度无奈黑跑的无人车玩家，哪敢去交通队？

所以就有AI带路党吐槽：你们人类才是无人车发展的最大阻碍呀。

嗯，也不是没有道理~

— 完 —

欢迎大家关注我们的专栏：量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复"招聘"两个字。

量子位 QbitAI· 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

via 量子位 - 知乎专栏 https://ift.tt/2otzphm

RSS5

Unsubscribe from these notifications or sign in to manage your Email Applets.

苹果无人车撞了！交出一血

李根发自凹非寺量子位报道 | 公众号 QbitAI

哪里讲理去？

苹果也是不走运，最不想谈论的无人车项目，最近发生了第一起车祸事故。

但果粉放心，不是苹果的锅。

事情要从美国太平洋时间8月24日说起，当时中国这边已到中元节，下午14:58，苹果无人车正在自家总部附近转悠，万万没想到，就这样被人追尾了。

但此时，从后面来的2016款日产Leaf，以25迈的时速，从后撞上了苹果无人车。

结果是苹果的雷克萨斯车尾受损，日产Leaf前部遭创，但双方都没有人受伤。

事故处理完成后，苹果也按规定向加州交管局主动提交了报告。

报告中详细说明了事故时间、地点、撞车部位，以及当时的各种外部环境等。

不过对于事故责任问题，苹果没有提及，后续也没有对外发表评论。

根据整个过程来看，谁是谁非，应该并不难断。

也不知道那位追尾的日产车主，知道自己撞上苹果无人车后，是一种怎样的心情？

苹果又被diss了一番

但苹果这一边肯定不会心情愉快。

由于这"第一起事故"，苹果无人车又被各大外媒批判了一番。

针对的也不是苹果无人车事故本身，而是又双叒叕提到了苹果自动驾驶进展缓慢的问题。

眼看还有2周就要迎来新iPhone发布，你说这不是破坏祥和美好的气氛吗？

路透在报道说中，苹果上下都很少谈论自动驾驶计划，而且起步还很晚，Google等搞了好几年，苹果才开始打算测试，要努力啊。

总之，不管买不买，也不管苹果以后如何来割肾，现在大家对苹果无人车的进展，都不太满意。

毕竟你可是苹果，你可是always重新定义一切的公司，你还是首家冲破万亿美元市值的科技巨头。

无人车竞速时代，你怎么能掉队呢？

苹果新进展

苹果也并非全无进展。

就是2周前，加州车管局还确认过，目前苹果无人驾驶路测车队，规模已是55车、83驾驶员。

这样规格的车队，不止加州，就是放眼全世界，恐怕也就Waymo和Uber能够相提并论了。

而且今年7月，由于把涉嫌盗取商业机密的华人员工告上法庭，苹果还被动披露了更多新进展。

比如以访问权限来算，能访问无人车核心机密的有2700人，能登入Titan——苹果无人车项目代号——则多达5000人。

虽然这个数目在13.5万的苹果全职员工中，不算多，但作为一个看起来颇为初创的项目，投入确实不菲了。

类比来说，就算是以中国无人车"国家队"自居的百度，Apollo道路之前，也才300人左右的研发规模。

另外，苹果无人车"盘子"也很大。

还是在诉告华人工程师的案子中，苹果提到了自动驾驶实验室，并且谈到了电路板、专用芯片等方面的事项。

一直以来，对于苹果如何开展自动驾驶业务，外界猜测并不少。

软件系统自不必言，这是苹果的强项所在，但涉及芯片、电路板等硬件，却也着实是头一回曝光。

如此看来，苹果未来很可能倾向于打造自研软硬件套装，然后卖给车厂。

以爆料苹果知名的分析师Ming-Chi Kuo，近期也评论过Apple Car。

他认为汽车行业当前出现的变革，明显是软件定义硬件、新技术重新定义旧行业，跟10年前智能手机面临的机遇大同小异。

而对于苹果而言，用AI、AR重新定义汽车，有基础优势。并且苹果手握重金，通过车还能进入汽车金融等领域，对未来业务增长非常有利。

最后，苹果还能把当前的消费电子领域的成功，延续到汽车行业，还能进行主导性整合，软件+硬件+服务，这条路苹果太熟门熟路了。

但上述分析归分析，具体苹果汽车真正推出，Ming-Chi Kuo预测还需要5-7年的时间，即2023年至2025年。

这算久吗？

苹果无人车前世今生

对果粉而言，肯定不算。

毕竟4年都过来了，又何惧再等5-7年？

苹果无人车项目，最早可追溯至2014年，内部代号Project Titan。

当时该项目一建立，就吸引了多名苹果资深员工加入，还招募了一些造车方面的工程师，"造车"这个方向几乎不言自明。

2015年，苹果还买下了三个与之相关的顶级域名，包括：apple.car，apple.cars和apple.auto。

不过迄今为止都没有启用。

高峰时期，苹果在Project Titan项目上投入的员工，据说有上千人的规模。大名鼎鼎的"强纳肾"Jonathan Ive也参与了苹果车的设计开发。

不过这个项目在2016年遭遇了严重的危机，不少项目的核心人物纷纷退出，团队规模也大幅缩减。外界用泰坦（Titan）陨落来形容这一变故。

直到去年，苹果无人车项目才缓过一口气来。

去年4月，苹果获得了加州的无人车路测许可。当时获批的三辆测试无人车全部都是2015款雷克萨斯RX450h。此前，苹果购入了不少雷克萨斯进行改装测试。

随后，苹果无人车使用的系统Apple Automated System也被曝光。（今年苹果无人车的一些专利也对外公开，包括手势控制变道等）

紧接着2017年6月，苹果CEO库克首次详细谈及无人车战略，他透露苹果正在专注于自动驾驶技术的研发。

库克说："我们认为这是所有AI项目之母"。更早之前的4月，苹果无人车获得了加州路测许可。

这让人看到新希望，同时苹果也被曝光改弦更张，希望更快推出无人车产品——让一部分人先看到未来。

所以就在今年5年，苹果无人车有了实锤进展，与大众汽车达成合作协议，共同研发自动驾驶的无人车。

而且发布时间，可能会在2019年。

总之，有胜于无吧，还要啥自行车呢？

首次车祸事故简史

最后，既然这是苹果无人车的第一次事故，不妨也一起回顾下其他无人车公司的第一次。

先说目前全球"遥遥领先"的Waymo。

唯一不同的是，当时追尾Google无人车的车辆，是一辆更结实庞大的公交车。

当然，Google无人车搞得早，也遭遇过更严重的事故。

然而行业初期，独善其身可不够，猪队友一个接一个。

一个猪队友是特斯拉。

后来报告显示，核心原因是特斯拉Model S在强烈日光下，没能"看清"白色车身的卡车。

虽然这起致死车祸，没直接影响特斯拉销售，但由于一直把高级辅助驾驶当"自动驾驶"宣传，特斯拉的车祸让自动驾驶又被热议了一把。

直到后来特斯拉"自动驾驶"车祸曝光多了，吃瓜群众才开始厘清，特斯拉的自动驾驶比较特殊。

然而另一大猪队友Uber，就真给行业拖后腿了。

Uber无人车第一次车祸，发生在2017年3月，当时在Uber测试的亚利桑那州，下午18点，被违规行驶的人类驾驶车辆撞得侧翻。

其时Uber无人车处于自动驾驶状态，驾驶座也有安全员，但来不及躲闪，所幸无人员伤亡，后来警方也判定：Uber无责。

但迄今最严重的一次，完全就是Uber无人车的责任了。

这是全球第一起无人车撞人致死事故，让整个行业都陷入尴尬。

而后来调查显示，这是一起完全可以避免的事故，但Uber在安全性方面的失职、技术上的差劲，最后让整个行业一起埋单。

当然，目前为止，还没有一起中国无人车玩家的"车祸事故"。

一方面是在加州路测的玩家普遍谨慎、安全意识很高，而且车辆也不算多，即便被撞，概率也没有waymo和苹果这样高。

另一方面是国内刚刚出台相关路测法规和机制，之前发生的事故可能更倾向于隐秘不闻。

但可以肯定的是，中国无人车玩家并非没有车祸事故。

在西二旗往北的路段，都发生过不少无人车事故，而且据传还有一些"职业"碰瓷的人类司机。

他们乐于追尾无人车，然后给出"给钱私了"或"去交通队"的选项。

一度无奈黑跑的无人车玩家，哪敢去交通队？

所以就有AI带路党吐槽：你们人类才是无人车发展的最大阻碍呀。

嗯，也不是没有道理~

— 完 —

欢迎大家关注我们的专栏：量子位 - 知乎专栏

诚挚招聘

量子位 QbitAI· 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

via 量子位 - 知乎专栏 https://ift.tt/2otzphm

RSS5

Unsubscribe from these notifications or sign in to manage your Email Applets.

2018年8月31日星期五

解决Sparse Reward RL任务的简单回顾

这篇总结文章来自于我在PRICAI2018 Reinforcement Learning Workshop上的部分演讲内容。

相信大家对于强化学习已经有了一定的概念，其中Model-Free的强化学习方法更是获得很大的成功，并在一些任务上达到了与人类专家媲美的效果。利用当前某一时刻的信息预测未来的结果与趋势。这种方法主要由两个流程组成：

收集数据：使用当前的策略模型与环境进行交互，并获得一定量的交互结果：<状态s，行动a，奖励r>等数据，通常来说，这些数据包含着一定的信息：要么这些状态行动序列最终会带来好的结果，要么带来不好的结果。
训练模型：利用收集到的数据训练模型，使模型能够"记忆"这些数据，增加能带来好的结果的概率，同时减少带来坏的结果的概率。同时我们希望在训练中模型能够拥有一定的泛化性，即当面对类似的状态时可以得出类似的结果。

从上面的流程可以看出，Model-Free的方法其实和监督学习方法有一些相近之处，第一步通过某种方法挑选出一些有价值的数据，第二步利用这些数据进行训练，使其达到某种特定的目标。利用DQN算法，我们希望模型能够拟合得到当前状态行动下的长期打折回报。这种方法假设Agent并不知晓环境的运转方法，所以他更加专注于"拟合"这件事。但是，Model-Free的方法还是存在一定的问题：

在训练Model-Free时，我们需要收集大量的训练数据，这个数量和问题规模相关，越是规模大的问题，它需要的数量越大。为了减小数据对模型带来的不稳定性，数据量不能够太小；
由于模型只是机械地记忆一些结果，因此我们无法保证模型在学习过程中是否真的学到了一些有用的内容，又或者真的只是完成了记忆的工作，模型在应对类似的问题时就会出现问题。比方说对于一个迷宫问题，我们用一个模型学习了某个特定结构的迷宫后，当一个结构不同的迷宫出现时，它是否同样能够给出较好的表现，这个时存在一些挑战的。
对于一些奖励稀疏的问题来说，如果奖励是稀疏的，那么收集到的数据很可能并不能表现出自己的结果是好是坏，那么这些数据无法帮助模型带来很大的提升，那么模型的学习就会变得比较复杂。

对于上面的这些问题，研究人员已经提出了很多办法，这些办法可以缓解其中的部分问题。解下来我们就来看看其中的第三个问题：奖励稀疏问题，以及近期一些关于解决这个问题的研究成果。

稀疏奖励问题

相信大家都已经对这个游戏有了一定的了解：Montezuma's Revenge。这个游戏就是奖励稀疏的一个经典例子，在这个游戏中，Agent只可以通过获取钥匙和打开房间门或者奖励，而触碰了骷髅头之后会扣除一条生命，除此之外，其他的操作对于Agent来说将不会获得任何的奖励与惩罚，这样绝大多数的操作将无法对Agent产生影响，Agent在获得第一个奖励之前将无法获得任何正向的反馈，因此模型很可能会停止学习而无法提升。

为了解决这个问题，一个最简单的方法就是修改奖励函数。原来的奖励函数不是一个稀疏的函数么？那把它替换成一个不稀疏的奖励函数是不是就可以了？这个想法是没有问题的，同时通过修改奖励函数也会得到不错的结果，但是这种方法也存在一些问题：这样精心设计的函数需要专家来完成，这些同样是解决问题需要的成本。同时这也与构建一个通用人工智能模型的愿景存在一定分歧，我们更希望模型能够自主学习，而不是有专家参与才能完成这样的任务。当然在短时间内实现这样的功能有点不切实际，至少我们希望专家的工作能够劲可能地减少。

总体来说，目前解决这个问题可以采用如下的一些方法：

结合专家操作序列
课程学习
自我博弈
层次化强化学习
基于计数的探索方法

下面我们就来看看这些方法。

结合专家操作序列

相较而言，让专家设计一个奖励函数的难度相对较大，而让专家示范如何在任务中取得更好的成绩就显得更简单一些。比方说对于自动驾驶来说，回答"怎样驾驶是对的"这样的问题是有一定难度的，但是亲自示范正确的驾驶行为则显得容易了不少。那么我们能不能利用专家给出的一些示范来帮助模型快速掌握一些行动方法，从而减轻稀疏奖励函数带来的影响。

具体来说，对于一个Off-Policy的方法，我们可以使用Replay Buffer保存一些待训练的数据，其中一部分来源于Agent与环境的交互，一部分来源于专家的示范，模型将结合两部分数据进行训练。

课程学习

课程学习是一个让Agent"循序渐进"完成学习的方法。有时一个如同一张白纸的Agent面对的问题，是一个十分复杂且困难的问题，就好比让一个婴儿学习微积分一样，这样直接学习很难取得很好的效果。于是我们需要简化问题的难度，先给Agent出一些相对简单的问题，等它逐渐适应了这样的难度后，再提出一些更难的问题，通过这样的方法，模型就能够更快地适应并取得更好的效果。

首先要介绍的方法被称为反向课程学习。反向课程学习与课程学习的思想类似，但是方向正好相反。同样时前面介绍的让婴儿学习微积分的问题，对于课程学习来说，我们的第一步是让婴儿学习认数，然后开始学习加减法，再不断地学习新的内容，让婴儿的能力不断地靠近微积分的水平；而对于反向课程学习来说，它的第一步则是反了过来，我们直接给出求解积分的倒数第二步，然后告诉婴儿在这种情况下怎样一步得出最终的结果，等婴儿理解了这一步，再将问题改到倒数第三步，然后让婴儿向前推导两步，从而得到最终的结果。这样的方法听上去有些不可思议，但实际上这也是一种很有效的方法。它可以让婴儿一直关注结果，同时也可以获得较好的学习效果。

这样我们的问题就变成了——如何选择更合适的"起点"，使得像婴儿一样的模型能够快速成长。我们可以用当前Agent模型在这个点上的长期回报来衡量这个点的合适程度。我们希望Agent模型不会获得太低的得分——这样说明这个起点对Agent有点困难了，同时也希望Agent不会获得太高的得分——这样说明这个起点有点简单。

除了上面提到的设定中间起点方法，我们还可以采用其他的方法，前面提到了专家示范，我们同样可以使用专家示范来帮助我们找到反向课程学习的起点。对于有些问题来说，直接使用终点状态附近的状态不一定会有好的结果，这在前面已经分析过了，而且策略模型本身处在一个变化的状态中，有时判断也会难免有误，同时判断的过程也要耗费一定的时间。如果又了专家示范的操作，我们可以直接从专家示范操作的序列中选择合适的起点作为反向课程学习的起点。

自我博弈

说起自我博弈，大家一定会想到AlphaZero，这个只通过自我博弈就可以掌握围棋的博弈系统。由此可见，自我博弈确实是一种让Agent获得成长的办法。自我博弈的精髓在于两个旗鼓相当的对手可以通过对弈获得提升自身能力的宝贵经验，如果没有这样的对弈环境，让一个人凭空掌握围棋的精妙，恐怕就成了一件几乎不可能的事情。

于是有人基于这个思想，开始了一些尝试。他们利用现有单一Agent环境构建一个对弈环境。比方说本来我们希望训练一个机器人学会站立，学会简单的行走，现在就可以把环境改为两个Agent对抗的环境，在这个新的环境中，两个Agent可以相互推挤，让对方站不稳，这样Agent就可以训练在一定外力下仍然保持平衡的能力。

自我博弈虽然是一个不错的学习方法，但是它也存在着一些风险：如果Agent掌握了对手的情况，就更容易采用一些固定的套路针对对手，来让自己取得成功，这样的胜利显然不是我们想要的，因为这种胜利方式很可能只对特定的对手有效，而对于更多的对手来说，这个方法可能不会起作用。这个现象和GAN里面的"Mode Collapse"也非常相似，生成模型找到了欺骗判别模型的方法之后，就容易"不思进取"。为了解决这个问题，我们需要准备一个"对手池"，每次从对手池中随机选择一个"能力差距不大"的对手进行对弈，这样可以更好地确保模型不会过拟合。

层次强化学习

层次强化学习一般将问题分成了两个层次，一个层次表示了当前任务的状态和行动，另一个层次表示了更高层次的状态和行动。在一些问题中这个更高层次的状态和原本层次的状态类似，比方说它们可以表示一些"中间目标"。这样完整的Agent系统将主要分成两部分：

Meta Controller：一个更宏观的策略模型，它会基于当前的状态生成"小目标"，然后将小目标传到下级
Controller：一个更具体的策略模型，它会基于Meta Controller生成的"小目标"和当前的状态，得到真正实际的行动。

这就好比如果我们从某个起点状态到达终点状态，Meta Controller则是将整个过程分成了几个部分，而Controller则分别完成每一个小部分的工作。

基于计数的探索

基于计数的探索方法起初被应用在有限状态的问题上，因为状态数量是有限的，所以我们可以记录每一个状态出现的次数，于是我们就可以使用一个新的回报函数来表示：

r=r(s)+\frac{\beta}{\sqrt{N(s)}}

这个公式的第二项中的是一个常量，表示为状态s被访问过的次数，显然一个状态被访问的次数次数，继续探索它来带的新鲜感就会越低，因此这部分的得分也会更低。反之则越高。

在状态有限的问题中，这样的公式是轻松实现，但是对于一些更为复杂的问题，状态数量多到没法表示时，直接使用这个公式就会显得有限不适合。于是我们需要一个映射函数将状态映射到一个有限的状态空间中，这样才能方便计算。那么该怎么实现这个方法呢？我们希望相近的状态可以映射到相同的数值中，这样计算的结果会更加合理。

私货时间

《强化学习精要：核心算法与TensorFlow实现》(冯超)

深入浅出介绍强化学习框架概念与实践，欢迎了解！

via 无痛的机器学习 - 知乎专栏 https://ift.tt/2ww7qSA

RSS4

Unsubscribe from these notifications or sign in to manage your Email Applets.

用强化学习做神经机器翻译：中山大学&MSRA填补多项空白

人工深度学习和神经网络已经为机器翻译带来了突破性的进展，强化学习也已经在游戏等领域取得了里程碑突破。中山大学数据科学与计算机学院和微软研究院的一项研究探索了强化学习在神经机器翻译领域的应用，相关论文已被 EMNLP 2018 接收，相关代码和数据集也已开源。

论文地址：https://ift.tt/2PceaMs
开源项目：https://ift.tt/2C2O2Su

神经机器翻译（NMT）[Bahdanau et al., 2015; Hassan et al., 2018; Wu et al., 2016; He et al., 2017; Xia et al., 2016, 2017; Wu et al., 2018b,a] 近来变得越来越受欢迎了，因为这种方法表现更优，而且无需繁重的人工工程工作。其训练过程通常是：通过取源句子和之前已有的（基本真值）目标 token 作为输入，以最大化目标句子中每个 token 的似然。这样的训练方法被称为最大似然估计（MLE）[Scholz, 1985]。尽管易于实现，但在训练阶段的 token 层面的目标函数与 BLEU [Papineni et al., 2002] 等序列层面的评估指标却并不一致。

为了解决不一致的问题，强化学习（RL）方法已经在序列层面的目标优化上得到了应用。比如，研究者已将 REINFORCE [Ranzato et al., 2016; Wu et al., 2017b] 和 actor-critic [Bahdanau et al., 2017] 等策略优化方法用在了包括 NMT 在内的序列生成任务上。在机器翻译领域，也有相似的方法被提出——被称为「最小风险训练」[Shen et al., 2016]。所有这些研究都表明强化学习技术可以有效地用于 NMT 模型 [Wu et al., 2016].

但是，之前还没有将强化学习有效应用于现实世界 NMT 系统的研究成果。首先，大多数研究（甚至可能全部研究）都是基于浅的循环神经网络（RNN）模型验证他们的方法。但是，为了得到当前最佳的表现，利用近期发展起来的深度模型 [Gehring et al., 2017; Vaswani et al., 2017] 将至关重要，这些模型的能力要强大得多。

其次，强化学习方法存在相当一些众所周知的局限性 [Henderson et al., 2018]，比如梯度估计方差高 [Weaver and Tao, 2001] 以及目标不稳定 [Mnih et al., 2013]，因此要让强化学习实现有效的实际应用，其实并不容易。因此，之前的研究提出了一些技巧。但是，如何将这些技巧应用于机器翻译？这一点仍还不够明朗，研究者也没有达成共识。举个例子，[Ranzato et al., 2016; Nguyen et al., 2017; Wu et al., 2016] 等研究建议使用的基准奖励方法 [Weaver and Tao, 2001] 并没有得到 [He and Deng, 2012; Shen et al., 2016] 等研究的采纳。

第三，研究已经表明，使用 MLE 训练时，大规模数据（尤其是单语言数据集）能为翻译质量带来显著提升 [Sennrich et al., 2015a; Xia et al., 2016]。但如何在 NMT 中将强化学习与单语言数据结合起来？这方面几乎仍是研究真空。

我们希望能通过这篇论文填补这些空白；我们还研究了可以如何应用强化学习来得到强大的 NMT 系统，使其能取得有竞争力的表现，甚至达到当前最佳。我们对强化学习训练的不同方面执行了几项综合研究，以便了解如何：1）设置有效的奖励；2）以不同的权重结合 MLE 和强化学习，从而实现训练过程的稳定；3）降低梯度估计的方差。

此外，因为利用单语言数据在提升翻译质量上是有效的，所以我们进一步提出了一种将强化学习训练的能力和源/目标单语言数据结合起来的新方法。就我们所知，这是在使用强化学习方法训练 NMT 模型方面探索单语言数据的效果的首个研究尝试。

我们在 WMT17 汉英翻译（Zh-En）、WMT17 英汉翻译（En-Zh）和 WMT14 英德翻译（En-De）任务上执行了实验，并得到了一些有用的发现。比如，多项式采样在奖励计算方面优于波束搜索，强化学习和单语言数据的结合能显著提升 NMT 模型的表现。我们的主要贡献总结如下。

我们立足于相当有竞争力的 NMT 模型，提供了首个对强化学习训练不同方面的全面研究，比如如何设置奖励和基准奖励。
我们提出了一种能有效利用大规模单语言数据的新方法，可在使用强化学习训练 NMT 模型时使用，并且这些单语言数据来自源语言和目标语言都可以。
将我们的这些研究发现和新方法结合到一起，我们在 WMT17 汉英翻译人上取得了当前最佳的表现，超越了强基准（Transformer 大模型+反向翻译）近 1.5 BLEU。此外，我们在 WMT14 英德翻译和 WMT17 英汉翻译任务上也得到了足以媲美最佳的结果。

我们希望我们的研究和发现将有助于社区更好地理解和利用强化学习来开发强大的 NMT 模型，尤其是在面临着深度模型和大量训练的现实世界场景中（包括有双语对应的数据和单语言数据）。

为此，我们开源了所有的代码和数据集以帮助其他人再现这一研究成果：https://github.com/apeterswu/RL4NMT。

表 1：不同的奖励计算策略的结果。beam 表示波束搜索，multinomial 表示多项式采样。在通过波束搜索生成 yˆ 时，我们所用的宽度为 4。shaping 是指使用了奖励塑造（reward shaping），而 terminal 表示没有使用。

表 7：表现差不多的不同端到端 NMT 系统的结果比较。SougouKnowing 的结果来自 https://ift.tt/2NCiGU5.

最后，作为对我们的实验结果的总结，我们将几种有代表性的端到端 NMT 系统与我们的研究成果进行了比较，如表 7 所示，其中包含 Transformer [Vaswani et al., 2017] 模型，使用以及没使用反向翻译的方法 [Sennrich et al., 2015a]，以及在 WMT17 汉英翻译挑战赛上表现最好的 NMT 系统（SougouKnowing-ensemble）。结果清楚地表明，在将源侧和目标侧的单语言数据与强化学习训练结合到一起之后，我们能得到当前最佳的 BLEU 分数 26.73，甚至超过了在 WMT17 汉英翻译挑战赛上最佳的集成模型。

论文：一项将强化学习用于神经机器翻译的研究

论文链接：https://ift.tt/2PceaMs

摘要：近期的研究已经表明，强化学习（RL）方法可以有效提升神经机器翻译（NMT）系统的表现。但是，由于不稳定，成功完成强化学习训练是很困难的，尤其是在使用了深度模型和大型数据集的现实世界系统中。在这篇论文中，我们使用了几个大规模翻译任务作为测试平台，系统性地研究了使用强化学习训练更好的 NMT 模型的方法。我们对强化学习训练领域的几个重要因素（比如基准奖励、奖励塑造）进行了全面的比较。此外，之前我们也不清楚强化学习能否助益仅使用单语言数据的情况。为了填补这一空白，我们提出了一种利用强化学习通过使用源/目标单语言数据来进一步提升 NMT 系统的表现的新方法。通过整合我们所有的发现，我们在 WMT14 英德翻译、WMT17 英汉翻译和 WMT17 汉英翻译任务上取了媲美最佳的结果，尤其是在 WMT17 汉英翻译上确实实现了当前最佳。

]]> 原文： https://ift.tt/2NCiRid

机器知心

Unsubscribe from these notifications or sign in to manage your Email Applets.

AI 人工智能新闻资讯

2018年9月1日星期六

11个React Native组件库；如何设计个分布式文件系统；Julia极简入门教程 - 每周精要552期

苹果无人车撞了！交出一血

苹果又被diss了一番

苹果新进展

苹果无人车前世今生

首次车祸事故简史

RSS5

苹果无人车撞了！交出一血

苹果又被diss了一番

苹果新进展

苹果无人车前世今生

首次车祸事故简史

RSS5

2018年8月31日星期五

解决Sparse Reward RL任务的简单回顾

稀疏奖励问题

结合专家操作序列

课程学习

自我博弈

层次强化学习

基于计数的探索

私货时间

RSS4

用强化学习做神经机器翻译：中山大学&MSRA填补多项空白

机器知心

龙虾之父一条推文，Loop时代终结? - InfoQ每周精要No.932

标签

标签