2018年5月9日星期三

自动驾驶群雄图谱,大家了解一下

在无人驾驶的长跑里,每个人都在追赶 Alphabet 的 Waymo。

这家谷歌的兄弟公司至少提前一年把无人驾驶汽车带到了公众视野,横扫包括通用汽车等在内的诸多对手。其在一月份购买了大量配备有百码级传感器的 Chrysler Pacifica 小型汽车,这让 Waymo 更是出类拔萃。没有其他公司能够提供无人车的出租服务,更不用说在城市里载客了。

通用汽车则计划开始使用 Chevrolet Bolt 来提供专车服务,这款车没有方向盘或踏板,这可是美国政府草案里最快也要明年年底才能实现的自动驾驶技术目标。而其他厂商则显得谨慎的多,他们还在解决上一批自动驾驶技术的遗留问题,他们的计划是2020年或者更晚实现这个目标。

自动驾驶长路漫漫,道阻且艰:最近,Uber 和特斯拉公司两次引人注目的试驾都发生了撞车事故,并且导致一位行人(这也是首例已知的自动驾驶汽车致死事故)和一位使用了被称为前体辅助驾驶系统的司机死亡。上周,Waymo 的一辆自动驾驶货车也卷进了一次事故。但是交通运输业的趋势就是零人力成本,不冒险才是最大的风险,所以很多厂商争都争先恐后的去掌握这项技术并将其付诸实施。

没有司机,汽车制造商的经营利润率可能是现在的两倍以上

在接下来的三年里,几乎所有的厂商都会炫耀下它们能够根据固定路线以任意速度在城市街道上行驶的汽车。现在大多数厂商制造的自动驾驶汽车已经可以在低速情况下进行基本的驾驶。这种情景给人整齐划一的印象。尽管还处于起步阶段,自动驾驶行业也已经开始出现领导者。

「 Waymo 已经开发出了一个了不起的系统,独占鳌头,」波士顿咨询集团美国汽车业务部的负责人 Brian Collie 说,他挑出了前两名。「 但这和制造自动驾驶汽车大不一样,你得看看通用汽车。而在欧洲,戴姆勒汽车才是领导者。」

自动驾驶的终点线并不是达到五级自动驾驶中的第四级。那其实是一个门槛,是一个汽车可以在预先规划好的的路线上行驶,并在没有司机干预的情况下搞定一切的门槛。只有 Waymo 用四级自动驾驶汽车试载了非员工乘客,这些人都是自愿成为测试对象的。还没有厂商展示过五级,那一级别的车子可以自主驾驶,甚至没有方向盘。

参与者们也需要围绕技术开拓业务。在游戏的终局,物流和出租车服务都能够产生巨大的利润。

高盛预测,机器人出租车将会帮助专车和拼车行业总收入从现在的50亿美元增长到2030年的2850亿美元,前景光明。如果没有司机,汽车制造商的经营利润率可能在20%左右,是现在的两倍以上。如果这些增长和利润都实现了,并且达到很高的水平,那将是通用汽车一年三倍的产值,这还没有算上物流业务带来的收入。

谁来独领风骚很重要吗?想要把无人驾驶业务运转起来,你需要一个庞大的车队来在主要市场站稳脚跟,还要一个响当当的品牌,就像 Uber 是打车的代名词那样。但是一旦护城河建立,其他厂商的发展空间就会缩小。

眼下,投资者正押注潜在的赢家

「 不会有太多的公司做这个,」 Collie 说。「选择不多,因为领导者们获得了大部分消费者信任,品牌价值在那。」

眼下,投资者正押注潜在的赢家。2016年的时候特斯拉的估值猛涨,就是因为摩根斯坦利(也是其主承销商)的一位分析师预测,该公司的电动汽车将会催生出一个自动驾驶车队。而自2017年6月通用汽车宣布建造无人驾驶汽车工厂并开始运营以来,其股价也上涨了20%。Zoox 公司也已经筹集了3亿6000万美元,这对于一个没有收入的创业公司来说,可谓巨资。

当然,大部分人都摈弃驾驶执照,完全依靠自动驾驶出租车的时代仍然遥不可及。这项技术的成本比造车高,很少有厂家有能力制造出大众测试车型,大规模的实际采用更是多年以后的事情。甚至连 Waymo 也还处于试验阶段。

就算是最激进的预测,大部分人想拥有自己的自动驾驶汽车至少也要在十年以后。Aurora Innovation 公司的创始人 Chris Urmson,是行业先驱之一,他算得上是个乐观主义者。他说,「 我可以在5到10年的时间里在公路上看到这些车子。」这意味着即使是今天的落后者也有时间迎头赶上排头兵。

在采访了诸多高管和技术专家,并回顾了已经公开的大量造车计划后,彭博社对自动驾驶汽车的造车比赛进行了简要地概括。下述预测的时间点是以第四级汽车为基础的,这是自动驾驶汽车能够开展相关业务的前提。

当之无愧的领导者

Waymo 的自动驾驶车队已经在25个城市跑了超过500万英里,并且在计算机模拟中完成了数十亿英里的路程,Waymo 每周都会使用这个计算机模拟来更新它的自动驾驶软件。这家谷歌拆分出来的公司拥有一支 Chrysler Pacifica 小型汽车车队,它们能在 San Francisco 的市区街道上进行导航,还能在高速公路上全速前进。

一支无人驾驶试点车队将于今年年底开始它们的商业服务,从 Phoenix 开始接待乘客,并逐渐扩张到其他城市。Waymo 首席执行官 John Krafcik 最近完成了一项交易,将两万辆捷豹 I-Pace SUV 添加到了车队中,并表示与本田汽车公司的合作可以让公司聚焦到配送和物流服务。

该公司也有迄今为止最低的离职率。报告还指出,公司去年在加利福尼亚测试时,几乎没有事故发生:Waymo 在超过35万英里的路程里发生了3起事故,而通用汽车在超过13.2万英里的路程里发生了22起事故。

通用汽车的 Chevy Bolt 可以在 San Francisco 繁忙的街道上以每小时25英里的速度行驶。这家底特律的汽车制造商信心十足,计划在明年使用没有方向盘或者踏板的汽车始专车服务实验,这正是 Waymo 之前在道路测试中所做的。

在 Waymo 之后,还有几个主力厂商展示了相似的驾驶能力。很难说他们都有自己的优势,而通用汽车的一个优势是:底特律北部有一家工厂可以大量生产自动驾驶汽车。这将有助于通用汽车在不依赖合作伙伴的情况下拥有良好的产能和更低的成本。现在,一辆汽车的自动驾驶车型造价大约为20万美元,相比之下,一辆人类司机驾驶的电动 Bolt 售价为3万5千美元。

通用汽车落后于 Waymo 的就是速度。通用汽车的测试速度不超过25英里/每小时,这是它保证安全的最高速度。通用汽车公司的自动驾驶部门创始人兼首席执行官 Kyle Vogt 说,这个项目将很快将使用 Strobe 公司开发的新的激光雷达,Strobe 是去年收购的。激光雷达发射激光束来绘制前方的道路图谱并引导汽车,Strobe 的雷达版本更小,更便宜,而且可以比通用汽车现有设备看得更远。这将带来更加快速的驾驶。

这款新的激光雷达也会降低成本,Vogt 十一月份说,在目前的一代自动驾驶汽车 Bolt 上,激光雷达花费约3万美元/辆。当通用汽车开始使用 Strobe 后,Vogt 说,成本将降到「数百美元」。

通用汽车计划每年都斥资10亿美元80亿美元来开发自动驾驶汽车和移动业务。这笔钱会允许通用汽车开展自己的专车业务。通用汽车还没有决定是否运营自己的拼车试点,时间是定于2019年年底,要么独立运营要么合伙。值得注意的是,这家汽车制造商已经持有了 Lyft 公司的股份。

然而通用汽车公司必须警惕:当说到交通事故时,它在所有在加利福尼亚测试的公司当中首当其冲。去年,车队包揽了全国27起无人驾驶汽车事故中的22起,而今年则是包揽了7起事故中的5起。这些都是小事故,而且并不都是通用汽车的错。在一次采访中,通用汽车公司总裁 Dan Ammann 将高事故率归咎于 San Francisco 漫长而又繁忙的街道。

第二集团

90年代末,梅赛德斯-奔驰在其旗舰车型S级轿车上推出了自适应巡航控制系统。该系统可以监测出汽车正在快速接近前车的后保险杠。今天,梅赛德斯诸多车型的智能驾驶正在越来越接近真正的自动驾驶,因为该系统可以帮助避开行人,避免其他事故。这就是研究汽车技术的 Navigant Research 把戴姆勒排到 Waymo 和 GM 之后的原因。

上述那些系统帮助了今天的司机们。而对于未来的汽车,戴姆勒与 Robert Bosch Gmbh 紧密合作,将会使用来自硅谷智能计算公司 Nvidia 的系统。测试车可以实现第四级自动驾驶甚至是第五级,这意味着汽车不需要方向盘或踏板来操控。

该公司一直在斯图加特附近的 Boeblingen 大道上测试V级货车,那里有一个梅赛德斯-奔驰研究中心。这些自动货车有目的性的排练有挑战性的情景,如早晨的交通路况。戴姆勒公司的发展部门主管 Ola Kaellenius 在一次采访中说,这项技术已经达到第五级,尽管彭博新能源金融公司最近的一份报告将该公司的目标日期定到了2020年之后。

在这些系统上路之前,Kaellenius 说梅赛德斯将在2021年出售的汽车中提供第三级自动驾驶技术 ,以供顾客选择。这意味着,这辆汽车可以处理大多数驾驶任务,但是也仍然需要司机应对某些计算机无法处理的情况。

他说,完全自动驾驶的汽车也将同时上路,但将用于拼车服务,因为它们对一般消费者说太贵了。Kaellenius 说,「 这个服务是移动服务的逻辑,类似一个机器人出租车。」「 你通过对司机费用的节省来分担成本。」

十年前,没有人会想到,破产的通用汽车零部件部门 Delphi 的遗址上会长出一个自动驾驶革命的参与者。但专门负责自动驾驶战略的咨询公司 Brult& & Co. 的创始人 Grayson Brulte 说,Aptiv Plc 是从前 Delphi 汽车公司动力部门剥离出来的,是一个还有待观察的厂家。

Aptiv 已经在自驾车技术方面投入巨资,收购了软件制造商 Ottomatika,还投资了激光雷达制造商 Innoviz,Leddertech,和 Quanrgy。它最大的交易是收购了 NuTonomy,这家公司已经在波士顿和新加坡以城市级速度进行无人驾驶汽车的测试了。在 CES 期间,该公司还在拉斯维加斯演示了其机器人出租车的样车。

据 Navigant 报道,该公司自2016年以来一直在新加坡测试专车服务,并将在2021年开始运营。Aptiv 一直在与奥迪AG以及 Bayerische Motoren Werke AG 汽车合作开发其技术。

十一月下旬的一天,通用汽车在 San Francisco 展示了它的自动驾驶汽车 Bolt,而在同一天,Zoox 自己的一辆自动驾驶汽车穿过了城市蜿蜒的街道和繁忙的交通线。Zoox 公司约有250名工程师致力于开发该车型。它的自动驾驶汽车 Toyota Highlander SUVs 在通用汽车用来测试 Bolt 的相同街道上奔驰。Zoox 的汽车也能以高速行驶,企业和监管事务负责人Bert Kaufman说。

Kaufman 说,公司计划在2020年为乘客推出汽车,而且说干就干。

Zoox 面临的挑战是如何筹集更多资金来建造汽车。Kaufman说,该公司已经筹集了超过2亿8000万美元的资金,但仍然需要额外的资金来完成汽车。汽车公司完成一个新车型需要花费10亿美元,现有的汽车制造商拥有自己的汽车,Waymo 则与制造商有合作关系。

雷诺日产联盟的主席 Carlos Ghosn 吹嘘说,公司销售的自适应安全汽车比任何厂商都多。如果前面的车辆快速停下,日产的 ProPiloT 系统会让汽车停止,并保持住汽车在其车道。Ghosn 在今年早些时候的一次采访中说,这个系统是朝着完整的自动驾驶系统开发的。现在,日产正在加利福尼亚的 Palo Alto 测试一辆完全自动驾驶汽车。Renault 最近展示了一款长而光滑的铜色概念车,名为 Symbioz,它可以在全自动驾驶模式下以每小时80英里的速度行驶。

这辆车仍然需要司机手动打开自动驾驶模式,这时方向盘会缩回。它有6英尺宽,16英尺长,前后各有一个发动机,Symbioz 并不是那种打算上市的汽车。

今年3月,日产在横滨测试了一辆电动车的专车服务,雷诺今年晚些时候也会在巴黎郊区和 Rouen 用电动雷诺车做同样的测试。

虽然联盟的技术令人印象深刻,但 Ghosn 听起来很谨慎。法国-日本企业集团计划在2020年左右实验一位自动驾动汽车驾司机。那辆车在公路上只需要司机偶尔的干预。根据联盟的2022计划,到2022年,雷诺日产车队将拥有在道路上完全自动驾驶的汽车。

Ghosn 说,「到2022年我们都会进入这个市场。」「你会看到所有的汽车制造商都会有一定程度的自动化。」

奥迪,大众集团旗下的高端品牌,其A8系列里已经有了最先进的自动驾驶汽车销售。这辆车的交通拥堵导航系统使用激光雷达观察路况,让司机完全解放双手,还能以每小时37英里的速度行驶。

该公司未来的工作将更为先进。与 Nvidia 合作的奥迪,正瞄准2020年的全自动驾驶汽车。

大众也与 Aurora 成立了协议,该公司的创始人在自动驾驶汽车软件领域有着良好的声誉。它的技术领导者们是谷歌的自动驾驶项目的创始人 Urmson,特斯拉的自动驾驶程序主管 Sterling Anderson,而 Drew Bagnell,以前是Uber 自动驾驶团队的领导者。但该公司一直对它将如何进入市场保持沉默。

紧随其后

宝马车队拥有约40辆汽车,可以完成第四级自动驾驶。汽车在慕尼黑和加利福尼亚行驶。

该公司正在测试他们与英特尔合作开发的完全自动驾驶的汽车,英特尔收购了传感器制造商 Mobileye,宝马还与德国零部件制造商大陆航空公司进行了合作。Fiat Chrysler Automobiles NV 最近也加入了他们的合作伙伴关系,计划到2021年在生产的汽车中使用自动驾驶技术。

宝马汽车首席财务官 Nicolas Peter 在底特律的一个新闻发布会上说,BMW的自动驾驶汽车还没有准备好上高速公路。彼得说,「从我们的角度来看,我们需要更多时间来实现真正拥有全自动驾驶汽车」,目前约有1000人在该公司的研发团队工作。

没人能把丰田汽车公司排除在外。该公司于1999年开始开发自动泊车技术,并于2003版的在日本 Prius 里安装,使该车无需司机停也能停放。

直到一月份的 CES,丰田一直对其能力保持沉默,当时该公司展示了一款被称为 e-Palette 的航天飞机。丰田汽车研究所的 Gill Pratt 说,日本汽车制造商可以制造三种大小的自驾式航天飞机,2020年将在东京奥运会上公开亮相。

福特汽车公司一直被认为是落后的公司,尤其是去年前首席执行官 Mark Fields 被解雇后,部分原因是公司内部对自动化和未来的移动化缺乏共识。但要是说福特手足无措是不合理的。公司从匹兹堡的人工智能公司 Argo AI 获得了技术——福特去年花了10亿美元获得了相当多的股份。

福特正在用 Argo 的技术测试其第三代融合轿车。然而,即使拥有了 Argo,也改变不了福特起步较晚的事实。福特于2017年2月买下了这家公司,当时该公司员工寥寥无几,Salesky 花了一年的时间才把人招满。

福特汽车自动驾驶兼电气化副总裁 Sherif Markaby 说,我们计划在2021年拥有第四级的自动驾驶汽车。这辆车将专门用于无需方向盘或踏板的自动驾驶。虽然福特落后了通用汽车公司和 Waymo 公司好几年,但该公司正利用 Domino's Pizza 的馅饼配送和邮递员货物配送来进行实验。福特也在准备在密歇根工厂制造自动驾驶汽车。

沃尔沃汽车公司的目标是在2020年以前消除其车内所有乘客受到的伤害。这看起来不太可能,但该公司有500人开发自己的自动驾驶技术。现在,它的驾驶员辅助系统可以给驾驶员双手15秒钟的时间离开方向盘,而且还能同时使汽车保持在车道上,还能管理与前方车辆的距离。

该公司正在瑞典哥德堡的几个家庭里测试其技术。测试将从驾驶员辅助技术开始,并随着时间推移向更先进的系统发展。

这家由中国浙江吉利控股集团所有的汽车制造商,正在研发其自动驾驶技术,并且在2021年以前不会把技术推向市场。根据 Navigant 的报告。沃尔沃也与 Uber 合作开发了 XC90 SUV 的自动驾驶系统。

韩国现代汽车公司将于本月发布一个先进的道路安全系统,其允许司机将双手从方向盘上移开15秒。

韩国现代智能安全技术中心副总裁 Jinwoo Lee 说,该公司还没有准备好测试真正的自动驾驶汽车。为了达到这一目标,现代决定与技术公司 Aurora (VW)以及人工智能计算系统制造商 Nvidia 合作。

现代计划在2021年的一个小城市测试它的自动驾驶系统。目前其还没有在公共道路上测试自动驾驶技术的计划,该公司表示,它不会在2025年之前将技术推向市场。

超凡者与黑马

一旦 Waymo 和 Uber 开始研发自动驾驶汽车,大多数传统汽车制造商都会争先恐后地跟上。

汽车制造商担心低价的自动驾驶出租车服务将取代汽车所有权,所以他们只会提供硬件,就像富士康为苹果公司制造手机一样,而苹果则在销售内容和服务方面赚大钱。

菲亚特克莱斯勒就是这样。这家汽车制造商会给 Waymo 提供小型汽车来整合其技术,但是不会自主研发。公司也开始和英特尔以及 IBM 合作,但是并不能单兵作战。

专车服务巨头 Uber 在自动驾驶汽车上投入了两个巨大的赌注,第一个是在2015年从卡耐基机器人公司雇佣顶尖员工,然后是在2016年收购了自动驾驶卡车制造商 Otto。但在引人瞩目的诉讼和冲突后,它们陷入了争议之中。

在整个2015年,Uber 从卡耐基梅隆大学招募了顶尖的机器人人才,并在宾夕法尼亚的匹兹堡建立了 Advanced Technologies Group。这个小组现在由前卡耐基机器人联合创始人 Eric Meyhofer 领导,他领导了 Uber 的自动驾驶汽车项目。为了将 Uber 推到自动驾驶汽车军备竞赛的前列,Uber 于2016年8月收购了 Otto Trucking,买下了一个由 Alphabet 自动驾驶汽车部门前雇员组成的车队。

不到一年后,Alphabet 报复回来,对 Uber 提起违反商业机密诉讼。这起诉讼显示,Anthony Levandowski 在谷歌的自动驾驶汽车基础上联合创立了 Otto,随后又领导了 Uber 的无人驾驶汽车开发工作,他被指控在谷歌工作时下载了工作邮件和敏感文件的副本。Levandowski,连同 Otto 的其他三个联合创始人,都已经离开 Uber。

在三月份,坏消息变成了悲剧,一辆自动驾驶的 Uber 在亚利桑那州 Tempe 撞死了一个行人。Uber 在等待调查结果的同时迅速停店了所有自动驾驶车辆的测试。


如果特斯拉的首席执行官 Elon Musk 能通过他的 SpaceX 公司造出世界上最强大的火箭,那他也可以造出强力的自动驾驶汽车。特斯拉的S型和X型都有自动驾驶仪,它可以在不操控方向盘的情况下超过其他汽车,并改变车道。虽然它不是一个完全自动的系统,但它给特斯拉提供了很多驾驶数据。

Musk 避开了大多数汽车制造商和科技公司正在使用的激光雷达系统。他说,他想开发更先进的成像系统使他的汽车拥有一双更明亮的眼睛。

Musk 希望使用相机并为其开发图像识别能力,这样汽车就可以看清标志,而且真正看到前方的道路。他说特斯拉其实走的是更艰难的道路,但如果他能想出一个更好的系统,即使没有庞大和昂贵的硬件,他也将掌握真正的自动驾驶

「我的竞争对手们有一套昂贵的设备,其中大部分都使汽车变得昂贵、丑陋和不必要,」Musk在二月告诉分析师们。「我认为他们会发现自己处于竞争劣势。」BNEF 项目的分析家称,特斯拉将能够在2020年左右生产第四级自动驾驶汽车,尽管这一时间表可能会发生变化,因为该公司已经开始与联邦安全局调查人员一起对涉及自动驾驶仪致命车祸的事件进行公开调查。

中国最大的搜索引擎已经开发了五年的自动驾驶软件。它为自动驾驶汽车开发了开源的 Apollo 软件系统,公司还邀请所有的人一起合作来测试汽车和收集数据。百度于2017年底开始在公共交通道路上测试软件的第一个版本,并于一月在拉斯维加斯CES 上展示了第二个版本。

三月份,中国政府允许百度在北京郊区的33条公共道路上测试汽车,开启了它在中国道路上的处女秀。该公司的目标是在今年晚些时候在中国制造商——金龙制造的客车上测试该系统,并且到2020年时,拥有第三级的自动驾驶车辆,这意味着汽车在高速行驶时会控制自己,并让司机在复杂的情况下接管汽车。百度最初的自动驾驶汽车将与中国的奇瑞汽车合作开发。

百度还有一个和中国汽车制造商北汽集团合作的,在2021年生产第四级自动驾驶汽车的目标。

]]> 原文: https://ift.tt/2rwRCwJ
RSS Feed

机器知心

IFTTT

机器之心「AI00」四月榜单:云端智能机器人达闼科技

「AI00 ,这是一个开源项目」

这不仅是一份榜单,更是一个开源项目,主要基于以下几点:

人工智能是一个复杂庞大的体系,涉及众多学科,也关乎技术、产品、行业和资本等众多要素,报告的写作团队只代表他们的专业观点,有自己的局限性,需要更多行业专家参与进来加以修正和完善。
人工智能技术和行业的发展瞬息万变,而报告的制作周期较长,其中的内容和数据势必会落后于行业的最新进展,无法同时满足时效性和高质量的要求。而领域内参与者的及时更新可以解决这个问题。
我们深刻地理解在没有专业用户反馈的情况下所做出报告的质量局限性,所以希望用工程界「Agile Development」的理念来对待我们的报告,不断收集专业反馈来持续提升报告质量。
人工智能是一个永恒命题,我们不仅会把「100 家公司」这个主题持续做下去,还会陆续开展其他主题。这个过程需要人工智能领域不同的参与者加入进来。
向 OpenAI 、「斯坦福人工智能百年研究」和「Open Source」致敬。

为此,我们邀请人工智能领域的科学家、技术专家、产业专家、专业投资人和读者加入进来,共同完成这项人工智能的长期研究。

如果你对「AI00」感兴趣,可在公众号对话框回复「AI00」(注:字母 AI 加数字 00)查看本开源项目的具体参与方式。

「AI00」第一期的榜单得到了来自投资界、人工智能产业界和学界的众多反馈,我们也依此对榜单的信息作出了一些订正和调整。且自榜单发布以来,其中的多家创业公司被科技巨头高价收购或发展为独角兽。

在最新一期的 AI00 榜单中,我们加入了云端智能机器人运营商达闼科技。

达闼科技

达闼科技成立于 2015 年初,由国家「千人计划」首批特聘专家、前美国 UT 斯达康公司 CTO、中国移动研究院院长黄晓庆先生发起创立,软银国际孙正义是创始股东之一。

据介绍,达闼科技是全球首家云端智能机器人运营商,专注于实现云端智能机器人运营级别的安全云计算网络、大型混合人工智能机器学习平台、以及安全智能终端和机器人控制器技术研究。

融资方面,2016 年 5 月达闼科技获得过软银、富士康和华登资本等机构的 3000 万美元种子轮投资;2017 年 3 月,达闼科技又顺利完成 1 亿美元的 A 轮融资。

以下为 AI00 四月榜单:

1. 语音和自然语言处理

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
搜狗 中国 人工智能综合研究 搜索引擎、知识图谱、输入法、语音交互产品等 估值约50亿美元
X.AI 美国 自然语言处理 个性化智能助理 三轮融资共获得 3.4 亿美元
科大讯飞 中国 语音技术和自然语言处理 智能家居、车载、电信等行业解决方案 市值约 393 亿人民币
思必驰 中国 智能语音交互和自然对话 车载、智能家居和智能机器人等智能硬件的语音交互服务 B 轮:2 亿人民币
大象声科 中 / 美 声源分离、声音增强、声纹识别、麦克风阵列 会议转录,通讯,机器人,智能家居,虚拟现实,增强现实,混合现实 未透露

竹间智能 中国 情感对话机器人、语音情感技术、多模态情感识别 竹间个人助理机器人小影、金融机器人、客服机器人 2500万美元融资
TalkIQ 美国 语音识别技术、自然语言处理技术(NLP) 电话语言反馈、预测销售结果、自动信息检索 1400万美元的A轮融资
Solvvy  美国 智能客服 理解和分类用户请求 1200万美元的A轮融资


2. 计算机视觉 

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Clarifai 美国 计算机视觉 图像及视频识别 API B 轮 3000 万美元
Affectiva 美国 计算机视觉和深度学习 实时面部表情分析和情绪识别解决方案 四轮融资共获得 3372 万美元
ViSenze 新加坡 计算机视觉、视觉搜索、图像识别 电子商务、移动商务、 在线广告等图像识别解决方案 两轮融资共获得 1400 万美元
Orbital 
Insight
美国 计算机视觉、深度学习和数据科学 分析海量卫星图像,用于经济趋势分析和公益研究 C轮融资共 5千万美元
Planet 
Labs
美国 计算机视觉和数据科学 将卫星图像识别用于农业、城市规划和灾害响应等 2015 年 5 月融资 1830 万美元
Descartes
Labs
美国 计算机视觉和深度学习 通过 DLFP 平台为农业提供数据分析和预测的解决方案 B轮 3千万美元
商汤科技 中国 计算机视觉和深度学习 人脸识别、危险品识别、行为检测、车辆检测等的安防监控系统 6亿美元C轮融资
依图科技 中国 计算机视觉和深度学习 基于图像理解的信息获取和人机交互服务 3.8亿元C轮融资
图普科技 中国 计算机视觉和深度学习 图像识别、视频鉴黄、智能审核、图片增值等云服务 新一轮千万美元融资
Neurala 波士顿 深度学习、计算机视觉 帮助机器人和智能设备学习和适应环境的软件 A 轮融资约1400 万美元
云从科技 中国 人脸识别、计算机视觉 金融机构人脸识别应用、公安系统实时布控、追逃等 B 轮 5亿人民币
深醒科技 中国 计算机视觉、人脸识别 智能安防、智慧金融、智慧楼宇等领域 A 轮亿元级


3. 芯片和硬件

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Wave
Computing
美国 深度学习芯片架构 DPU (Dataflow Processing Unit) 3轮融资共5900万美元
Ceva 美国 人工智能芯片技术 用于机器学习的第二代神经网络软件框架 CDNN2 纳斯达克上市,市值 9.12 亿美元
Tera
Deep
美国 基于 FPGA,针对于服务器端的高性能深度学习平台 被移动设备直接嵌入的深度学习模块 未透露
寒武纪科技 中国 深度学习 中国首款神经网络处理器 1亿美元 A 轮融资
深鉴科技 中国 深度学习 DPU 平台 深度学习 DPU 平台 A+轮约4000万美元融资
Graphcore 英国 深度学习硬件和软件开发 开源软件框架 Poplar 和「智能处理器」IPU A 轮融资 3000 万美元

Groq 美国 深度学习硬件、芯片 暂无信息

1030 万美元融资


4. 智能机器

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
ABB 
Robotics
瑞士 机器人及自动化技术 工业机器人、智能设备 468.95 亿美元市值
Fanuc 日本 机器人及自动化技术 工业机器人 4.4兆日元市值
KUKA 
Robotics
德国 机器人及自动化技术 工业机器人 美的 272 亿美元拿下库卡 94.55% 的股份
Rethink
Robotics
美国 机器人、人机交互 智能机器人 1800万美元新一轮融资
Universal
Robots
丹麦 机器人及自动化技术 工业机器人 未透露
3D Robotics 美国 计算机视觉、机器人技术 无人机,软件服务 五轮融资超 1 亿 2 千 600 万美元
Cyberdyne 日本 可穿戴设备 医疗助理机器人 2083.56 亿日元市值
iRobot 美国 计算机视觉、机器人技术 电子产品,家用机器人 27亿美元市值
ReWalk
Robotics
德国 计算机视觉、机器人技术 代步机器人,残障专用智能设备 2000万美元市值
Dyson 英国 智能机器,自动视觉定位及室内地图构建 清洁机器人 未透露
新松机器人 中国 机器人及自动化技术 工业机器人和行业解决方案 约 289 亿市值
埃夫特
机器人
中国 机器人 工业机器人、智能装备和行业解决方案 未透露
大疆 中国 计算机视觉、无人机控制、环境及障碍感知、视觉跟随、自动寻路 无人机航拍和图像传输 估值约100亿美元
Embodied Intelligence 美国 可以接入机器人的智能模块,工厂、仓库等自动化技术 智能设备 种子轮 700 万美元融资


5. 医疗

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Arterys 美国 深度学习系统生成医疗图像 深度学习分析系统 Arterys System 1200 万美元 A 轮融资
Enlitic 美国 深度学习、大数据、图像检测 癌症检测系统 三轮融资共 1500 万美元
VoxelCloud(体素科技) 美国 深度学习 医疗影像分析云服务 千万美金 A 轮融资
Insilico
Medicine
美国 深度学习和大数据 癌症诊疗 1000万美元最新融资
Oncora
Medical
美国 大数据和机器学习技术 通过数据分析为放射肿瘤学家提供临床决策支持,用于个性化医疗。 两轮融资共 132 万美元
Atomwise 美国 深度学习 药物发现 4500万美元A轮
TwoXAR 美国 深度学习 通过药物研发平台 DUMA™来评估大型公共和私有数据集,以迅速识别药物,并对药物和疾病的匹配度按照概率进行排序。 种子轮 340 万美元
Berg 
Health
美国 深度学习 Interrogative Biology® 平台结合病人生物学和人工智能分析来进行药物发现、开发和诊断等。 未透露
Cloud
MedX
美国 机器学习、自然语言处理 拥有 MedxExchange 、MedxInsights 和 MedxCare 三款服务产品的医疗人工智能平台,提供数据、医疗洞见和健康管理服务。 融资 660 万美元
Deep
Genomics
加拿大 深度学习、基因生物学 精准医疗 种子轮 370 万美元
碳云智能 中国 大数据、人工智能 通过数据挖掘和机器分析提供个人性健康指数分析和预测。 A 轮融资近 10 亿人民币


6. 金融

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Context
Relevant
美国 数据挖掘、预测分析 本地分析软件和云服务 五轮融资 4430 万美元
Zest
Finance
美国 数据挖掘、机器学习 信用服务 四轮共 1.12 亿美元
Aire 英国 信用评级 金融产品的信用评级 四轮共 700 万美元
高盛 美国 数据挖掘、机器学习 AppBank、金融业务自动化 市值 867.10 亿美元
蚂蚁金服 中国 人工智能、数据挖掘 智能助理、信用评级和风险管理等应用 估值 600 亿美元
Citadel 美国 人工智能、数据挖掘 对冲基金 目前掌管至少 260 亿美元资产


7. 智能驾驶

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Waymo 美国 自动驾驶 自动驾驶汽车 谷歌无人驾驶项目开始以独立公司的身份运营
Tesla 美国 自动驾驶 电动汽车 498.35 亿美元市值
Drive.ai 美国 深度学习 自动驾驶汽车 5000 万美元B轮融资
Innoviz 
Technologies
以色列 智能 3D 传感、传感器融合和精准地图和定位等核心自动驾驶技术 物美价廉的高清晰度固态激光雷达 6500万美元B轮融资
Peloton Technology 美国 雷达和专用短程通信安全系统 自动驾驶卡车 最新一轮6000万美元融资(2017 年 4 月)
SmartDrive 美国 计算机视觉、数据挖掘 交通安全和表现的智能解决方案 六轮融资共 1.8 亿美元
Zoox 美国 全自动驾驶 全新的自动驾驶汽车 3 轮融资共 2.9 亿美元
图森未来 中国 计算机视觉和深度学习 自动驾驶 5500 万美金的 C 轮融资
Minieye 中国 计算机视觉、智能驾驶 辅助驾驶系统 A 轮数千万人民币
Argo AI 美国 人工智能和自动驾驶技术发 自动驾驶汽车 福特将持续注资 10 亿美元
Nuro 美国 人工智能和自动驾驶技术 自动驾驶汽车Level 4 无人配送车 A 轮融资 9200 万美元


8. 垂直应用

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
Darktrace 英国 利用机器学习和独家算法来检测和响应以前未识别的网络威胁 Darktrace 的核心产品为「企业免疫系统」(EIS) 三轮共融资 1.045 亿美元
Uber 美国 自动驾驶、机器学习、数据挖掘 自动驾驶汽车、智能交通和智能出行应用 12 轮融资 87.1 亿美元,估值 660 亿美元
Airbnb 美国 机器学习 开源 AeroSolve 机器学习框架、智能助手、智能推荐、定价 9 轮共融资 20 亿 9 千万美元
Salesforce 美国 云计算、深度学习、数据处理 CRM 解决方案 市值约 638.37 亿美元
Slack 美国 机器学习 企业通讯应用,bots 平台 总融资 5.4 亿美元,估值约 38 亿美元
Sentient
Technologies
美国 人工智能、大规模分布式计算 解决复杂商业问题的综合智能系统 1.03 亿美元 C 轮融资,三轮共 1.3578 亿美元
Dataminr 美国 数据挖掘 基于社交网络的数据分析服务 1.3 亿美元 D 轮融资。五轮共 1.83 亿美元
ROSS 
Intelligence
美国 认知计算、深度学习、自然语言处理 法务研究智能辅助工具 未透露
滴滴 中国 自动驾驶、机器学习、数据挖掘 自动驾驶汽车、智能交通和智能出行应用 超55亿美元新一轮融资 (2017 年 4 月)
今日头条 中国 深度学习、自然语言处理、图像识别 媒体产品的应用 估值约 120 亿美元
地平线机器人 中国 基于云端的深度神经网络算法、图像、语音、自然语言理解和运动控制、技术集成 智能机器解决方案 A+ 轮近亿美元
Cylance 美国 机器学习、数学科学 使用人工智能来预防网络攻击 已融资 1.77 亿美元
Sift Science 美国 机器学习 利用人工智能/机器学习来开发网络安全应用的公司 4 轮共 5360 万美元融资
SparkCognition 美国 机器学习、人工智能、数据分析 使用机器学习和人工智能技术来分析预测网络安全漏洞与系统故障 新一轮3250万美元融资
达闼科技 中国 云端智能机器人运营商 安全云计算网络、大型混合人工智能机器学习平台 A 轮融资 1 亿美金


9. 机器学习

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
DeepMind 英国 人工智能基础研究 AlphaGo、医疗健康、谷歌内部产品应用。 以 4 亿英镑(约 5.32 亿美元)被谷歌收购
Vicarious 美国 人工智能基础研究 新的计算机视觉系统,机器人视觉 五轮获得 7200 万美元融资
Bonsai 美国 深度学习 Inkling 脚本语言和集成开发环境 Mastermind 760 万美元A轮融资
Preferred
Networks
日本 深度学习 深度学习操作系统 Chainer,机器学习在物联网的应用 9500 万美元最新一轮融资
Skymind 美国 深度学习 深度学习企业应用包 SKIL、开源框架 Deeplearning4j 种子轮融资 300 万美元
H2O.ai 美国 机器学习 开源机器学习平台和商业化支持 四轮融资 3360 万美元
Uptake 美国 数据挖掘、机器学习 为铁路、建筑等大行业提供数据预测分析 SaaS 服务 B轮融资5000万美元(2017 年 4 月)
Indico 美国 机器学习 为数据科学家提供图像、文本的识别和分析的工具 4轮融资共 438 万美元
第四范式 中国 机器学习 金融应用和「先知」平台 三大国有银行联合投资金额未公开
Gamalon 美国 机器学习 Bayesian Program Synthesis 可以自行编写代码,用最优的方法解释收集到的数据 来自 DARPA 的 770 万美元投资、来自 Felicis Ventures 的 450 万美元种子轮融资
DataRobot 美国 机器学习 机器学习平台公司,DataRobot 平台上有数百个开源机器学习算法 5400 万美元 C 轮融资
Petuum 美国 机器学习与人工智能平台 PetuumOS、Poseidon 框架、Petuum Healthcare Solutions 9300万美元B轮融资
Algorithmia 美国 算法 类似于苹果 App Store 的「算法应用」商店 1050 万美元 A 轮融资


10. 大公司

公司 国家 技术研究 产品应用 市值 / 估值 / 融资额
谷歌 美国 人工智能综合研究 TensorFlow 等开源框架,Google Photos、Now、Inbox 和搜索等多项产品和服务、硬件 市值 6701 亿美元
Facebook 美国 人工智能综合研究 多个开源框架和硬件平台,Messenger、社交网络和定向广告等多项产品和服务 市值 4296 亿美元
亚马逊 美国 人工智能综合研究 云服务、Echo 等智能家居、机器人、电商产品应用 市值 4696 亿美元
微软 美国 人工智能综合研究 CNTK 等开源框架,Cortana、小冰等多项产业和服务,硬件 市值 5362 亿美元
IBM 美国 人工智能综合研究 Watson、行业认知计算解决方案、量子计算机等 市值 1434 亿美元
苹果 美国 人工智能综合研究 基于智能手机等硬件的多项产品和硬件、智能助手、智能家居、医疗等 市值 8067 亿美元
百度 中国 人工智能综合研究 开源框架 PaddlePaddle、百度大脑、自动驾驶、互联网应用 市值 849.78 亿美元
阿里巴巴 中国 人工智能综合研究 云服务、人工智能平台 DT PAI、电商产品应用 市值3079 亿美元
腾讯 中国 人工智能综合研究 互联网应用 25683.98亿人名币
NVIDIA 美国 人工智能硬件 GPU、深度学习超级计算机 DGX-1、自动驾驶超级计算机 Xavier 市值 832.07 亿美元
英特尔 美国 人工智能硬件 CPU、Xeon Phi、Nervana 市值 1706.30 亿美元
高通 美国 人工智能硬件 移动智能设备芯片 市值约 899.36 亿美元
赛灵思 美国 全可编程技术和器件 All Programmable FPGA、SoC 和 3D IC 提供商 160.70 亿美元
华为 中国 人工智能综合研究、硬件 人机交互设备应用、芯片等 2017 年以 785.108 亿美元营业收入首次打入《财富》前百强
京东 中国 人工智能综合研究 电商产品应用、金融 市值约 559 亿美元
小米科技 中国 人工智能综合研究、智能硬件 智能音箱、智能手机、IOT 据传即将上市


「 AI00 开源项目」参与方式:

您可以在 Github 页面进行 contribute ,https://github.com/SyncedAI00/AI00,或扫以下二维码。

]]> 原文: https://ift.tt/2KNSHrG
RSS Feed

机器知心

IFTTT

AI复现大脑导航功能:DeepMind重大研究突破再次登上Nature

老鼠使用网格细胞来导航,这一能力如今被 AI 程序所模拟。图片:Al Fenn/LIFE Coll

科学家已经使用人工智能来创造复杂神经节点来模拟人类大脑的空间导航能力。这一成绩证明了人工智能算法的强大能力,能够协助传统的神经科学研究来测试大脑工作原理。但研究员称,该方法还并不能取代传统的神经科学家们。

它真的是形式与功能的显著聚合。

该研究的详细计算细节今天发表在 Nature 上,由英国伦敦大学的神经科学家与 DeepMind 的 AI 研究员一起开发。它使用了深度学习技术来训练一只计算机模拟老鼠,在虚拟环境中追踪其位置。

DeepMind 使用人工智能体实现了类似于网格的表示(「网格单元」),它们与觅食哺乳动物的生物网格细胞非常类似。

该项目让科学家们吃惊的是,它自发地产生了类似于哺乳动物大脑中巡航细胞所产生的六边形活动模式,这种模式被称为网格细胞。在老鼠实验中,网格细胞被证明是动物定位自身空间位置的基础。

更重要的是,模拟的老鼠能够使用网格状细胞编码在虚拟迷宫中导航,甚至学会了走捷径。

挪威特隆赫姆(Trondheim)卡弗里系统神经科学研究所(Kavli Institute for Systems Neuroscience)的神经科学家 Edvard Moser 说:「这篇论文突然冒出来,像一发子弹,非常令人兴奋。」。Moser 分享了 2014 年诺贝尔生理学或医学奖,因为他共同发现了位于海马区及其周围的网格细胞和其他与巡航相关的神经元,包括定位细胞和头部方向细胞。

Moser 说:「很显然计算机模型是通过完全不同角度的方法来解决问题,并最终得出了生物学中的网格模式。」他补充到,这项工作是一个强有力的证明,它表明哺乳动物的大脑已经发展出最优的方法来处理这种类型的空间编码。

德国慕尼黑 Ludwig Maximilian 大学的计算神经科学家 Andreas Herz 说:「分析深度学习系统的内部工作原理,并探讨作者是否发现了一个普遍的空间导航计算法则是非常有意思的。」

这种神经网络被训练用于探索虚拟迷宫

深度学习模拟老鼠

研究者使用基于互相交流的循环计算单元的深度学习网络,来测试神经科学中的一个假设:即大脑使用网格细胞通过整合身体移动的方向和速度,映射其在环境中的位置。

首先,研究者生成数据以训练他们的算法。他们模拟老鼠在围栏内觅食时的路径,以及随着模拟动物移动时的头向细胞和位置细胞的活动,但并没有模拟网格细胞的活动。然后他们使用这些数据来训练深度学习网络来识别模拟老鼠的位置。在实验中,他们发现,计算单元中自然地涌现了类似网格活动的六角形模式,正如他们在实验室的真实老鼠大脑上所得到的结果。

来自 UCL 的神经科学家、合作研究者 Caswell Barry 说道,「我们曾经希望能看到这些网格,但当它们真的出现的时候,仍然感到很惊讶。」「我在实验中多次观察到了它们,那种规律性实在是太美了。」


科学家很好奇地发现他们需要调整该系统来添加额外的噪声,使其单元与大脑中的单元更加类似,以使网格状的活动显现。「这是理论神经科学家想到过,但是没有测试过的。」Herz 说道。

然后研究者将该系统融入它的步伐,测试虚拟小鼠是否使用它进行导航。他们将仿真小鼠放在较大的类似迷宫的场地中,虚拟小鼠必须学习如何前往特定目标。作者向该系统添加了另一个系统,引入了学习必需的记忆和奖励函数。仿真小鼠很快就学会通过试错找出目标,并非常熟练地完成任务,优于尝试过该任务的人类专家,小鼠甚至开始走捷径。

研究者发现如果他们故意防止网格图形的形成,则仿真小鼠不再能够高效地走迷宫。「实验中不能对小鼠关闭网格单元。」Barry 说道。

「与神经科学家的合作激励了 AI 研究,」DeepMind 研究者和该研究的共同作者 Andrea Banino 说道,「但是目前这只是制造智能算法的基础研究,还不是应用。」

研究者认为 AI 是测试大脑假设的有效工具,但是它不大可能回答关于大脑如何和为什么使用特定编码方式的问题。「我读到这篇论文时非常兴奋,看起来 AI 或许能够加速我们对大脑导航方面的研究。」Moser 说道。但这不会侵占神经科学家的研究领域。

论文:Vector-based navigation using grid-like representations in artificial agents

摘要:深度神经网络在目标识别、复杂游戏(如围棋、导航)等领域中取得了很大成果,但是在人工智能体方面仍然面临巨大挑战,使用强化学习方法训练的深度神经网络也无法匹敌哺乳动物的空间行为,这种行为主要是受内嗅皮层中网格单元的支持。网格单元被认为提供多尺度周期性表征,可作为编码空间的度量,且对于整合自运动(路径整合)和规划前往目标的直接轨迹(基于向量的导航)非常关键。这里我们开始利用网格单元的计算函数来开发具备哺乳动物导航能力的深度强化学习智能体。我们首先训练一个循环神经网络来执行路径整合,从而得到类似网格单元和其他内嗅单元类型的表征。然后我们发现该表征能够为智能体提供在陌生、变化的环境中定位目标的有效基础,通过深度强化学习优化导航的主要目标。


具有类网格(grid-like)表征的智能体性能已经超过了人类专家和对比智能体,此外从类网格单元推导出基于向量的导航有必要的度量。此外,类网格表征允许智能体产生类似于哺乳动物的行为捷径。我们的研究结果表明,新兴的类网格表征为智能体提供了欧几里德空间度量并与向量运算相关联,以为精准导航提供基础。


我们的结果支持把网格单元作为基于向量的导航关键因素的神经科学理论,展示了后者可以与基于路径的策略结合起来支持在有难度环境中的导航。

]]> 原文: https://ift.tt/2ItrU5L
RSS Feed

机器知心

IFTTT

英伟达官方解读:Volta Tensor Core GPU实现AI性能新里程碑

具备深度学习力量的人工智能现在已能解决一些曾被认为不可能解决的难题,比如自然语音和自动驾驶领域内的计算机理解和交谈。深度学习现在已能有效解决大量难题,在这种进展的推动下,算法复杂度的指数级增长已经带来了对更高速的计算的极大渴求。为了满足这些需求,英伟达设计了 Volta Tensor Core 架构。

英伟达和很多其它公司与研究者一直都在开发计算硬件和软件平台来解决这一需求。比如,谷歌打造了 TPU(张量处理单元)加速器,能够给可以运行在 TPU 上的数量有限的神经网络带来优良的表现。

在这篇博文中,我们将分享英伟达最近的一些进展,这些进展能为 AI 社区带来极大的 GPU 性能提升。采用这些改进,我们已经在单块芯片和单个服务器上实现了创纪录的 ResNet-50 性能表现。

最近,fast.ai 也宣布了他们在单个云实例上的创纪录性能表现,请参阅:https://ift.tt/2rgdRXw

我们的结果表明:

  • 在训练 ResNet-50 时,单个 V100 Tensor Core GPU 能实现每秒 1075 张图像的处理速度,相比于前一代 Pascal GPU,性能提升了 4 倍。

  • 具有 8 个 Tensor Core V100 的单个 DGX-1 服务器能实现每秒 7850 张图像的处理速度,几乎是一年前同样系统 4200 张图像/秒的处理速度的 2 倍。

  • 由 8 个 Tensor Core V100 驱动的单个 AWS P3 可以用不到 3 小时时间训练完 ResNet-50,比 TPU 实例快 3 倍。

图 1:Volta Tensor Core GPU 创造了 ResNet-50 的新速度记录(AWS P3.16xlarge 实例包含 8 个 Tesla V100 GPU)

英伟达 GPU 在多种不同算法上的大规模并行处理性能优异,自然非常适合深度学习。但不止于此。凭借我们多年的经验以及与全世界 AI 研究者的紧密合作,我们创造了一种针对多种深度学习模型优化过的新架构——英伟达 Tensor Core GPU。

通过将高速 NVLink 互连与深度优化组合到所有当前的框架中,我们实现了当前最佳的表现。英伟达 CUDA GPU 的编程能力能确保用于大量不同现代网络的性能表现,同时还能提供一个催生新型框架和未来深度网络创新发明的平台。

V100 Tensor Core 创造单块处理器最快速度记录

Volta GPU 中的英伟达 Tensor Core GPU 架构是英伟达深度学习平台巨大进步的代表。这种新型硬件能加速矩阵乘法和卷积计算,这些计算占到了训练神经网络计算操作的大部分。

英伟达 Tensor Core GPU 架构让我们既可以提供比单个功能的 ASIC 更优的性能,同时又是可编程的,可用于各种不同的工作负载。比如说,每个 Tesla V100 Tensor Core GPU 都能提供 125 TFLOPS(每秒万亿次浮点运算)的深度学习性能,相对而言,谷歌 TPU 芯片的速度是 45 TFLOPS。一个 Cloud TPU 中的 4 块 TPU 芯片能提供 180 TFLOPS 的性能;相比而言,4 块 V100 芯片能提供 500 TFLOPS 的性能。

我们的 CUDA 平台让每一种深度学习框架都能充分利用我们的 Tensor Core GPU 的全部力量来加速正在快速增多的各种神经网络类型,比如 CNN、RNN、GAN、RL 以及每年涌现的数以千计的变体。

让我们再向 Tensor Core 架构继续深入一点,以凸显其特有的能力。图 2 展示了 Tensor Core 正在操作以低精度 FP16 存储但以更高精度 FP32 计算的张量,这能在最大化吞吐量的同时仍然维持必要的精度。

图 2:Volta Tensor Core 矩阵乘法和累加

使用最近的软件改进,ResNet-50 训练现在可以在独立测试(standalone testing)中在单个 V100 上达到 1360 张图像/秒的惊人速度。我们现在正在努力将这个训练软件整合进流行的框架中,如下所述。

为了实现最佳的表现,Tensor Core 所运行的张量应该处于内存中一个通道交织的数据布局中(数量-高度-宽度-通道,通常简称为 NHWC)。训练框架在内存中所预期的布局是以通道为主要的数据布局(数量-通道-宽度-高度,通常简称为 NCHW。所以要使用 cuDNN 库来执行 NCHW 和 NHWC 之间的张量转置操作,如图 3 所示。正如之前提到的,因为现在卷积本身已经非常快了,所以这些转置会占到相当可观的一部分运行时间。

为了消除这些转置,我们采用的方法是直接用 NHWC 格式表示 ResNet-50 模型图中的每个张量,这是 MXNet 框架支持的功能。此外,我们还向 MXNet 和 cuDNN 添加了用于所有其它非卷积层的优化过的 NHWC 实现,从而在训练阶段无需任何张量转置。

图 3:优化过的 NHWC 格式能消除张量转置

阿姆达尔定律(Amdahl's Law)带来了另一个优化机会,该定律预测了并行处理的理论加速能力。因为 Tensor Core 能显著提升矩阵乘法和卷积层的速度,训练工作负载中的其它层就会占到运行时间的更大一部分。因此,我们确定了这些新的性能瓶颈并且对它们进行了优化。

很多非卷积层的性能都受限于在 DRAM 中移入或移出数据,如图 4 所示。将连续层融合到一起要用到片上内存和避免与 DRAM 的数据流动。比如,我们在 MXNet 中创造了一种图优化传递(graph optimization pass)来检测连续的 ADD 和 ReLU 层,并在任何可以替代的时候用融合后的实现来替代它们。使用 NNVM(神经网络虚拟机),在 MXNet 中实现这些类型的优化是很简单的。

图 4:融合层能消除数据读/写

最后,我们通过为常出现的卷积类型创建额外的专用核来继续优化单个卷积

我们目前正将这些优化方法中的许多方法纳入到多个深度学习框架中,其中包括 TensorFlow、PyTorch 和 MXNet。通过我们为 MXNet 贡献的方法,使用标准的 90 epoch 训练方案,我们在单个 Tensor Core V100 上实现了 1075 张图像/秒的性能,同时还实现了与单精度训练一样的 Top-1 分类准确度(超过 75%)。这为我们留下了进一步提升的巨大空间,因为我们可以在独立测试中实现 1360 张图像/秒的速度。英伟达 GPU Cloud(NGC)上的英伟达优化的深度学习框架容器将会提供这些性能提升。

最快的单节点速度记录

多个 GPU 可以作为单个节点运行,从而实现显著更高的吞吐量。但是,扩展成在单个服务器节点中合作的多个 GPU 需要在 GPU 之间有高带宽/低延迟的通信路径。我们的 NVLink 高速互连结构让我们可以将性能扩展成单个服务器中的 8 个 GPU。这些得到了大规模加速的服务器能提供 1 PFLOPS(每秒千万亿次浮点计算)的深度学习性能,并且可广泛用于云和内部部署。

但是,扩展到 8 个 GPU 会显著增加训练性能,甚至足以让该框架中主 CPU 执行的其它工作成为性能的限制因素。具体而言,该框架中向 GPU 馈送数据的流程需要很大的性能提升。

这个数据流程包括从磁盘读取编码的 JPEG 样本、解码样本、调整尺寸和增强图像(见图 5)。这些增强操作能提升神经网络的学习能力,让训练后的模型有更高准确度的预测表现。使用 8 个 GPU 处理该框架的训练部分时,这些重要的操作就会限制整体的性能表现。

图 5:用于图像解码和增强的数据流程

为了解决这一问题,我们开发了 DALI(数据增强库),这是一个不受限于具体框架的库,可以将 CPU 的工作负载迁移到 GPU 上执行。如图 6 所示,DALI 将部分 JPEG 解码工作以及尺寸调整和所有其它增强工作移到了 GPU 上。这些操作在 GPU 上的执行速度比在 CPU 上快得多,因此减轻了 CPU 的工作负载。DALI 凸显了 CUDA 的通用并行处理能力。去除了 CPU 的瓶颈限制,我们可以在单个节点上维持 7850 张图像/秒的处理速度。

图 6:使用 DALI 进行了 GPU 优化的工作负载

英伟达正在助力将 DALI 整合进所有主要的 AI 框架中。这个解决方案也让我们可以将性能扩展到不止 8 个 GPU,比如最近宣布的英伟达 DGX-2 系统,带有 16 个 Tesla V100 GPU。

最快的单个云实例速度记录

对于我们的单个 GPU 和单节点运行,我们使用了事实上标准的 90 epoch 来训练 ResNet-50 达到超过 75% 的准确度。但是,训练时间可以通过算法创新和超参数调节来进一步减少,以便更少的 epoch 也能达到同样的准确度。GPU 为 AI 研究者提供了编程能力,并且支持所有深度学习框架,从而让他们可以探索新的算法方法和利用已有的算法。

fast.ai 团队最近分享了他们的出色结果,使用 PyTorch 在远低于 90 epoch 内实现了很高的准确度。Jeremy Howard 和 fast.ai 的研究者整合了关键的算法创新和调节技术来在 ImageNet 上训练 ResNet-50,在单个 AWS P3 实例上仅使用了 3 个小时——而该实例包含 8 个 V100 Tensor Core GPU。相比于基于 TPU 的云实例(训练 ResNet-50 需要接近 9 小时时间),ResNet-50 在 GPU 云实例上的运行速度可以达到其 3 倍之多。

我们还进一步期望本博客中所描述的提升吞吐量的方法也将适用于其它方法(比如 fast.ai 的方法),并能帮助它们实现更快的融合。

带来指数级的性能提升

Alex Krizhevsky 使用 2 个 GTX 580 GPU 赢得了第一届 ImageNet 比赛以来,我们在加速深度学习方面已经取得了非凡的进展。Krizhevsky 花了 6 天时间才训练完他那出色的神经网络 AlexNet,其表现超越了当时其它所有图像识别方法,开启了深度学习革命。现在,使用我们最近宣布的 DGX-2,我们可以在短短 18 分钟内训练完 AlexNet。图 7 展示了在过去短短 5 年时间里实现的 500 倍性能提升。

图 7:在 ImageNet 数据集上训练 AlexNet 的时间

Facebook 人工智能研究所(FAIR)已经共享了他们的语言翻译模型 Fairseq:https://github.com/facebookresearch/fairseq。使用我们最近发布的 DGX-2 和我们为数众多的软件堆栈提升,我们在不到 1 年时间里在 Fairseq 上实现了 10 倍的性能提升(见图 8)。

图 8:训练 Facebook 的 Fairseq 的时间

研究者正在使用 AI 的力量来解决数不胜数的用例,图像识别和语言翻译只是其中的两个代表。在 GitHub 上,使用 GPU 加速的框架的神经网络项目数量已经超过了 60000。我们的 GPU 的编程能力能为 AI 社区正在构建的各种各样的神经网络提供加速。这样的快速提升让 AI 研究者可以去构想更加复杂的神经网络,以使用 AI 攻克富有挑战性的难题。

这些持续的提升改进源自我们为 GPU 加速的计算开发的全栈式的优化方法。从构建最先进的深度学习加速器到复杂系统(HBM、COWOS、SXM、NVSwitch、DGX),从高级数值库和深度软件堆栈(cuDNN、NCCL、NGC)到加速所有深度学习框架,英伟达在 AI 方面的努力能为 AI 开发者提供无与伦比的灵活性。

我们将继续优化整个堆栈并继续提供指数级的性能提升,以为 AI 社区提供推动深度学习创新向前发展的工具。

总结

AI 在继续变革每个行业,催生数不胜数的用例。理想的 AI 计算平台要能提供出色的性能,能够扩展支持巨大且越来越大的模型规模,并且还要具备编程能力以应对越来越多样化的模型架构。

英伟达的 Volta Tensor Core GPU 是目前世界上最快的 AI 处理器,单块芯片就能提供高达 125 TFLOPS 的深度学习性能。我们很快就将在单个服务器节点中集成 16 个 Tesla V100,以打造世界上最快的计算服务器,能提供高达 2 PFLOPS 的性能。

除了性能,每家服务器制造商的每个云为整个 AI 社区所提供的 GPU 的编程能力和广泛的可用性都在推动实现下一代人工智能

不管哪种深度学习框架,英伟达的硬件都能对其提供加速:Caffe2、Chainer、Cognitive Toolkit、Kaldi、Keras、Matlab、MXNET、PaddlePaddle、Pytorch 和 TensorFlow。此外,英伟达 GPU 能用于各种各样且越来越多的网络类型,其中包括 CNN、RNN、GAN、RL、混合网络架构以及每年新出现的数以千计的变体架构。AI 社区已经创造了很多精彩出色的应用,我们希望能为 AI 的未来发展提供力量。 

原文链接:https://ift.tt/2jB8nT1

]]> 原文: https://ift.tt/2jO4U3w
RSS Feed

机器知心

IFTTT

M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」-InfoQ每周精要No.900

「每周精要」 NO. 900 2025/11/01 头条 HEADLINE M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」 精选 SELECTED a16z 将 3000 万开发者标价 3 万亿 网友:几个初创公司 + 大模型就...