2018年1月4日星期四

我们拿什么拯救正身处险境的孩子?算法!

编译 | 程耀彤、Rik

来源 | 纽约时报杂志


2016 年感恩节后,周三下午 3 点 50 分,有人拨通了匹兹堡虐待和忽视儿童热线。


在办公室的小隔间中,Timothy Byrne 听一位幼儿园老师讲述了一个三岁孩子告诉他的事情。这里以前是一家工厂,现在是阿勒格尼县警察局以及儿童青少年和家庭服务工作办公室(以下简称 C.Y.F.)。


小女孩说,母亲的一位男性朋友在她家中,「弄伤了头,他在流血,还在地板和浴盆上摇晃。」据这位幼儿园老师说,他已经从新闻里得知这位男性朋友已经因为用药过量,死在家中。


根据案件记录,Byrne 搜索了部门的电脑数据库,找到了有关这个家庭的一些资料。


有多项针对该家庭的指控,可以追溯到 2008 年:父母滥用药物、卫生状况不佳、家庭暴力、食物供给不足、身体护理和医疗疏忽以及来自叔叔的性虐待(涉及女孩两个姐姐中的一个)。


不过,这些指控都没有得到法律支持。


尽管发生了上面那件耸人听闻的事情,但是,目前没有法律要求社会工作人员前去调查家庭状况。


关闭文档之前,Byrne 不得不评估孩子未来生活状况的风险指数。


像他这样的工作人员,几乎每天都能听到比这更令人震惊的儿童身处危险的故事。他在计算机中输入:「低风险」。


会不会威胁儿童的直接安全?他必须勾选一个选项,结果是「没有安全威胁」。


如果这一结果完全由 Byrne 决定,故事可能就到此为止了。


过去,这些筛选人和司法辖区的主管人员有权作出最后决定。Byrne 本来会过滤掉这个电话。阿勒格尼县每年会收到 14,000 份指控,大约有一半的指控都会被过滤掉,不被关注。电话指控中,有些可能涉及针对儿童身体的暴力行为,有些仅仅是一些心怀不满的房东、无监护权父母或唠叨邻居的抱怨。


2015 年,全国共收到 400 万项指控,有42% 案件涉及 720 万名儿童)的指控被过滤掉。根据上,既有合理的法律推理,也会基于判断、意见、偏见和信仰。


然而 2015 年,更多的美国儿童死于虐待和被忽视。据官方资料,死亡数字为 1670 人,但也有人说,实际人数是这个数字的两倍,比死于癌症的儿童数量还要多。


这一次,决定指控是否被过滤掉,并不是 Byrne 一个人。


2016 年 8 月,阿勒格尼县成为第一个吃螃蟹的司法辖区:他们允许预测分析算法为每一通投诉电话的处理结果(选出还是 pass 掉),提供备选答案,以更好地识别出最需干预的家庭。在此之前,预测性分析多用于信用报告、股票的自动买卖等。


所以Byrne 的最后一个工作步骤,还需要点击阿勒格尼家庭筛选工具的图标。


几秒钟后,他的屏幕显示了一个垂直的颜色条,底部绿色 1(最低风险),顶部红色 20(最高风险)。


评估建立在 4 年电话投诉统计分析基础上,使用了监狱、精神病服务、公共福利、药物和酒精治疗中心等机构的 8 个数据库中的 100 多个标准。


这个 3 岁孩子的家庭最终得分 19 分。


究竟哪些背景因素,导致了筛查工具将它标记为未来有虐待和忽视的风险,尚无法确定。但是,仔细阅读这些文件,我们发现:


这位母亲正在参加戒毒治疗中心;曾被指控持有毒品而被捕入狱;小女孩的三个父亲和她的两个姐姐都有重大毒品或犯罪史,包括暴力指控;年长的兄弟姐妹有终身残疾;两个年幼的孩子已经被诊断出发育或心理健康问题。


在迷宫般的数据库中找到有关这个家庭的所有信息会花费 Byrne 很多时间,但是,筛选员被要求在最多一个小时内做出决定。


筛选员无法知道哪些因素,或哪些因素的组合,最能预测未来的不良后果。然而,算法在几秒钟内给出了得分。


现在,尽管 Byrne 最初持怀疑态度,但是,高的分数会促使他和上级标记这个案子,以便进一步的调查。24 小时内,一位 C.Y.F. 工作人员必须见见这位母亲,看看 19 分的原因在哪里。


几十年来,关于如何保护儿童不受虐待和忽视的争论,主要集中在哪些补救措施最有效:向父母提供服务,帮助他们解决问题?还是应该让孩子尽快离开家? 如果父母被隔离了,孩子是否应该与亲戚或养父母住在一起?


不过,两个开创性的社会科学研究提出了另一个思路。


从 2012 年开始,南加州大学 Emily Putnam-Hornstein 和新西兰奥克兰理工大学教授 Rhema Vaithianathan 提出的问题是:哪些家庭的风险最大,需要帮助?


「你知道吗,你提供的服务很好,但是,你可能将服务提供给了错误的家庭,」Vaithianathan 告诉我。


Vaithianathan,50 岁出头,小时候就从斯里兰卡移民到新西兰; Putnam-Hornstein,比他小十岁,已经在加州生活了多年。

两人都对使用公共数据库为公众服务的前景抱有热情。


三年前,他们被要求调查预测分析,如何能够提高阿勒格尼县处理虐待指控的能力。最终,他们发现自己关注的是电话筛选过程。一系列悲剧之后,他们发现在这些悲剧中,孩子们大多在电话指控被 pass 掉后死去的。


这是每个儿童福利机构的噩梦。最严重的一次事故发生在 2011 年 6 月 30 日。


当时,消防员们接到了火警电话,大火发生在位于匹兹堡市东部 McKeesport Boulevard 的一个三层公寓大楼上。当消防队员把锁着的门砸开后,他们在卧室一堆衣服下面发现了 7 岁的 KiDonn pollford - Ford。显然,他是在那里躲避烟雾。


KiDonn 的四岁的弟弟,KrisDon williams - Pollard 躺在床下,没有了呼吸。两天后在医院去世。


他们发现,孩子们被他们的母亲,27 岁的 Kiaira Pollard 单独留下了。那天晚上,她要去做脱衣舞娘。


邻居们说,她是个好妈妈,大一点的男孩成绩不错。


对于 C.Y.F. 来说,这场悲剧中最让人沮丧的部分是:该部门接到了无数关于这个家庭的电话,却把电话都 pass 掉了,认为不值得对其进行全面调查。


是筛查员不称职?不,Vaithianathan 说。


他花了几个月的时间与 Putnam-Hornstein 一起挖掘这个县的数据库。基于 2010 年 4 月到 2014 年 4 月间的所有 76,964 项虐待指控,他们搭建出了算法。


「筛查员有非常多的数据,但他们很难判断哪些因素是最重要的。」她说。


一个打给 C.Y.F. 的电话中,可能涉及很多因素。比如,可能有两个孩子,一个被指控的行凶者,还有妈妈,家里可能还会有另一个成年人。所有这些人都有可供调查的历史记录,但是,人类大脑并不擅长驾驭和理解所有数据。


她和 Putnam-Hornstein  将数十个数据点联系在一起(电话指控出现之前,县里掌握的所有家庭每一个数据信息),预测孩子们的命运。


结果令人吃惊和不安:48% 的低风险家庭正在接收干预服务,而 27% 的高危家庭被过滤掉了。2010 年至 2014 年期间,在打给 C.Y.F. 的 18 个电话中,由于父母虐待而后来导致儿童死亡或严重受伤的,8 例(44%)被筛查为不值得调查。


Rachel Berger 是一名儿科医生,也是国匹兹堡儿童医院虐待儿童研究中心负责人,领导着一项旨在消除儿童虐待和忽视致死的联邦委员会研究。


问题不在于大海捞针,而是在一堆针中找到合适的针,她认为。


「所有这些孩子都生活在混乱之中。如果面临诸多危险因素,C.Y.F. 如何挑选出最危险的因素? 你肯定不会信任充满大量主观性的保护决策。这就是我喜欢预测分析技术的原因。它最终带来了一些客观和科学的决定,这些决定可能会难以置信地改变人的生活。」她说。


算法促使 C.Y.F. 调查上述那位三岁小孩的家庭,之后,一位名叫 Emily Lankes 的工作人员敲响了她家的门。


这座饱经风霜的两层砖砌建筑周围,环绕着许多被夷为平地用木板封起来的房屋。


没有人回答。Lankes 接着开车去了孩子的幼儿园。小女孩看起来很好。Lankes 打电话给孩子妈妈。这个女人反复问她为什么要接受调查,但同意了第二天下午的走访。


Lankes 再次来到小女孩家中,发现家里没有家具,也没有床,尽管这位 20 多岁的母亲坚持她正在保护那些孩子,孩子们都睡在亲戚家里。


所有的电器都是好的,冰箱里有食物。母亲的性格很亢奋且反复无常,但她坚持认为自己没有用过毒品,没有去过治疗中心。


这三个孩子都表示,不会担心母亲怎么照顾自己。Lankes 仍然需要与这位母亲的治疗中心来确认相关事宜,但目前看来,算法似乎被三振出局了。


为了避免公共政策中出现的预测错误,预测分析法应运而生。


然而在刑事司法中,分析法现在已经被确立为法官和假释委员会的工具,这使得算法运作本身的保密性激起了公众更为强烈的不满,因为大部分算法是由私营公司所开发、销售与严密保护的。


争论矛头主要指向佛罗里达州的 2 家公司:非营利组织 Eckerd Connects,及其营利性伙伴 MindShare Technology。他们的产品叫 Rapid Safety Feedback,是一种预测分析软件包。


据该公司称,其客户包括康涅狄格州、路易斯安那州、缅因州、奥克拉荷马州和田纳西州的儿童福利机构。


上个月初,伊利诺斯州儿童与家庭服务部政府宣布,将停止使用该公司的产品,此前他们已经支付了 36.6 万美元。项目终止的部分原因源自一桩儿童死亡案件,该公司的产品没有将其标记为高风险事件,而 Eckerd 和 MindShare 在事故发生后拒绝透露有关产品算法的部分细节。


不过,由 Vaithianathan 和 Putnam-Hornstein 所共同开发的 Allegheny 家庭筛选工具(Allegheny Family Screening Tool)则不然:它属于 Allegheny 县政府。其运作方式是公开的。其筛选标准可在学术出版物中查到,当地官员也会对它吹毛求疵。


在采用该系统前,政府在市中心匹兹堡举行了一次公共会议,邀请了律师、儿童权利倡导者、为人父母者,甚至包括之前被收养过的儿童。他们的问题都很尖锐,不仅关于学术界,也与县政府的管理者有关。


「我们试图行事正确,做到公开透明,并与社会各界讨论事情的进展,」Erin Dalton 说,她是该县的人力资源部副主任,也是该县数据分析部的负责人。


她同 Allegheny 项目的其他参与者都表示,公共机构在采购算法时往往把控不严。


「这让人担心,」Dalton 告诉我,「因为那些公益性领导人生怕丢了工作,因而倾向于快速签单。他们不会做那么复杂的产品评估。」


声讨这类算法的另一个着眼点落在了预测未来行为上。


反对者认为,对于哪些家庭应当受到调查,其评判标准应该仅立足于该家庭所受到的指控,而不是基于对未来事件走向的预测。


在 2016 年举行的白宫会议上,纽约儿童服务机构的行政专员 Gladys CarrióN 就儿童寄养中心问题发表了讲话,表达了对儿童保护机构使用预测分析软件的担忧。


她说:「这让我害怕得不得了。」尤其是在公民自由权的潜在影响方面。「我担心帮助儿童的初心会助长问题产品的扩散。」


但在匹兹堡,那些倡导父母、儿童和公民权利的受访者都表示,C.Y.F. 对方案的实施考虑得很周全。甚至连宾夕法尼亚州的美国公民自由联盟(ACLU)也不吝惜溢美之词。


「我认为他们做了很深入的检查工作。」Sara Rose 说,她是 ACLU 在匹兹堡的一名律师。


「他们只让检查员使用这些预测分析软件,让他们决定哪些电话需要调查,哪些儿童需要关注。去别人家里做调查或有冒犯,但至少不需要强行将孩子带走或强迫家庭接受服务。」


对预测分析在儿童福利方面的第三个指控是最为强烈而令人不安的。


表面上,这些算法是为避免人为判断失误而设计的。但是,如果算法使用了充满偏见的数据,那该怎么办?


人们普遍认为,许多数据都暗含着对人种的根深蒂固的偏见。(就在上个月,纽约市议会投票决定,将对该市算法使用中的偏见进行详细研究。)然而,值得注意的是,Allegheny 的经验表明,在权衡偏见方面,其筛选工具只是没有人为检查那么糟糕而已,至少在某些方面是如此,比如预测哪些儿童最可能受到严重的危害。


「这是一个难题。」Dalton 说。


「算法所依据的所有数据都是有偏差的。相对而言,我们的系统对黑人孩子的监视更多,对白人孩子的监视更少。我们的调查标准与虐待无关,与是否受到指控有关。」


2015 年,黑人儿童占 Allegheny 县所有虐待热线来电的 38%,按照我们之前根据其人口数量所做的预测,这一数字是其 2 倍。他们因虐待而被安置在家外的比例更是不成比例:2015 年,每 1000 个居住在该县的黑人儿童中,就有 8 个被安置在家外,而白人儿童中只有 1.7 个。


圣路易斯州华盛顿大学社会学布朗学院教授 Brett Drake 的研究认为,在美国各州儿童福利机构所调查的黑人家庭中,导致黑人儿童更易流离失所的原因不能归咎于偏见,而是因为其贫困率更高。


同样,由 Putnam-Hornstein 等人在 2013 年所做的一项研究发现,在加利福尼亚州,黑人儿童被控受虐和被送去寄养的数量是白人儿童的两倍多。


但是,在调整了社会经济方面的因素后,她发现,相较于白人贫困儿童,贫穷的黑人儿童实际上更不可能成为受虐指控对象,或是被送往寄养家庭。


所有密切关注儿童福利问题的人都会同意,所有陷入儿童虐待或寄养危机的家庭,普遍都要归于贫穷。


当我与社会工作者们一道,走访家庭并参加家庭法院的听证会时,我看到白人家长与黑人家长一样多——而他们都很贫穷,生活在该县最差的社区中。


较为贫穷的人更可能被纳入刑事司法系统,也更需要公共援助,在公立诊所接受心理健康和药物上瘾方面的治疗——所有这些数据都由 Vaithianathan 和 Putnam-Hornstein 的预测分析算法进行解析。


Allegheny 县人力服务部主任 Marc Cherna 自 1996 年起就负责监督 C.Y.F.,比该县任何官员的在职时间都长。


他承认,在他的工作中,偏见或许是不可避免的。在采用该产品前,他对预测分析项目进行了独立的伦理审查。其结论是,实施该项目是合乎道德的,而不实施它才可能不道德。


报告中说:「如果使用的是最准确的预测工具,那么很难想出一条伦理方面的反对论据。」通过在筛选过程中加入客观的风险措施,该筛选工具被 Allegheny 县的许多官员看作是一种减少偏见问题的工具。


「我们知道许多决策都存在种族偏见,」C.Y.F. 副主任 Walter Smith Jr. 说,他是一位黑人。


「存在各种各样的偏见。如果我是一名筛选员,成长于一个酗酒之家,那么我在检查时可能会更加看重父母的酒精使用量。如果我的父母很暴力,我就可能会更加关心暴力问题。预测分析提供了一个机会,可以让我们更加一视同仁地看待所有这些变量。」


2 个月前,Emily Lankes 造访了一名儿童的家庭,该名儿童曾目睹一次药物过量致死事件。从那之后,她便一再试图重新联系上那位母亲,以完成自己的调查。


她一遍又一遍地给他们打电话、发短信,甚至直接登门造访。而这些尝试都没有成功。她还给治疗中心打过 6 次电话,想确认该名母亲是清醒的,但都无人接听。


最终在 2 月 2 日的早晨,Lankes 拨出了第 7 通电话。她了解到,该名母亲没有通过最近三次的药物试验,她的尿液中含有可卡因和鸦片。


然后,Lankes 与她的导师 Liz Reiter,同 Reiter 的老板及一个由其他管理人员与社会工作者醉成的小组,聚在一起商讨解决办法。


「将孩子从家里接走,这从来都不是一个容易的决定,即使我们知道这样做对他们最好,」Reiter 告诉我。


但是,她说,「当我们看到有人在使用多种药物时,我们需要保证孩子们的安全。如果不能进到他们家里,就会开始担心事情的进展。这是一个警示。」


该小组决定向家庭法院的法官申请一份紧急监护授权书。到下午晚些时候,他们得到了授权,来到了那名儿童的家,一位警官在那里与他们会面。


最大的孩子帮他们开了门。母亲不在家,但三个孩子都在,他们和年迈的曾祖父在一起。在过去的 2 个月里,Lankes 终于联系上了他们的妈妈,电话那头传来一阵嚷嚷,声称她们随意入侵别人的家庭。


不过,这名母亲告诉了 Lankes 有哪些家庭成员可以暂时照看孩子们。打包衣物,穿上冬装,孩子们跟 Lankes 上了车。就这样,政府授权一个陌生人把他们从母亲身边接走了。


在第二天的一次听证会上,首席官员命令那位母亲在孩子们回来之前先戒毒。她参加的戒毒所建议她进行康复治疗,但被她拒绝了。


「我们不能与她经常联系,「Reiter 最近告诉我,「很明显,她现在不方便沟通。目前两个最小的孩子正与他们的爸爸在一起。他们都表现得非常好。」他们 13 岁的哥哥与曾祖父住在一起。


12 月,距离 Allegheny 家庭筛选工具的使用已经过去了 16 个月,Cherna 的小组和我就预测分析程序如何影响筛选决策的问题,分享了一些初步情况。


到目前为止,他们发现,与实施该程序前相比,黑人和白人家庭之间基于风险评分所计算出的待遇差别降低了;而被推荐调查的低风险案件的比例,也已经从之前的将近一半下降到现在的大约三分之一。


这意味着,社会工作者在运转良好的家庭调查方面花的时间更少,毕竟这些家庭不需要被政府机构介入。与此同时,高风险电话的筛选频率增加了。虽然只提高了几个百分点,但在儿童福利领域,这是巨大的进步。


为了确定这些调查结果能否经得起推敲,Cherna 找来了斯坦福大学卫生政策研究员 Jeremy Goldhaber Fiebert 来独立评估该程序。


「到目前为止的初步分析显示,该工具的作用范围似乎并没有越界,」Goldhaber Fiebert 说。特别是,他告诉我,被筛选出的孩子更可能有服务需求,「所以他们的筛选就像是在那些真正有风险的孩子之中进行的。」


由于第 1 年的运作情况较好,更多高风险案件被标记为待调查项,Allegheny 的家庭筛选工具吸引了全美各地的儿童保护机构。


科罗拉多州道格拉斯县,位于丹佛和科罗拉多斯普林斯之间,正与 Vaithianathan 和 Putnam-Hornstein 展开合作,在当地部署预测分析程序;而加利福尼亚社会服务部则委托他们对全州进行初步分析。


「从匹兹堡的早期运营结果来看,预测分析技术似乎是儿童保护领域在过去 20 年间最令人兴奋的创新之一。」华盛顿大学研究员 Drake 说。


他最近参与撰的写一份研究报告显示,三个美国儿童中就有一个会被儿童福利机构列为 18 岁以下的调查对象,他认为各机构必须尽一切可能来提高他们的关注度。


即使在伊利诺斯州也是如此,该州儿童与家庭服务部主任 B.J. Walker 正在终止与 Rapid Safety Feedback 的开发商合作。然而预测分析是不会结束的。


Walker 在 12 月告诉我:「我仍然认为这是一个很好的决策工具。」Walker 知道 Cherna 和 Dalton,也看到了他们在开发家庭筛选工具过程中的漫长探索。


「他们做得很细致,」她说,「他们对于透明度的追求向来值得称赞。而透明性也是一把双刃剑,因为你也会犯错,也会搞砸,你想要做出一些改变。」


Cherna 和 Dalton 已经开始监管 Allegheny 县的算法重组工作。到目前为止,他们已经将该程序在预测不良后果方面的准确率从 78% 左右提高到了 90% 以上。


此外,呼叫筛选员及其主管现在被赋予了更少的自行决定权,不能将个人意志凌驾于程序推荐之上,而是得根据其专业判断,在过滤掉最低风险案件,不漏掉风险最高的案子。


「很难改变检查员的思维定势。」Dalton 告诉我。


「这是一种非常强大的、深入人心的文化。他们希望关注于直接的指控,而不是孩子们在未来一两年内可能面临的风险。他们称之为临床决策。我称之为某人的观点。需要时间才能让他们相信,电脑屏幕上的分数是真实可靠的。」


]]> 原文: http://ift.tt/2AqqqRX
RSS Feed

机器知心

IFTTT

「AI芯片公司」比特大陆的路线图上,除了四款TPU还有在这三个产业落地的野心

撰文 | 王艺


「我们现在是一家领先的人工智能芯片公司。」比特大陆产品战略总监汤炜伟说。


1 月 4 日,超性能计算芯片厂商比特大陆在京举办媒体沟通会,这也是其 AI 芯片「SOPHON」(中文名:算丰)正式发售后首次媒体交流。会上,比特大陆对其 AI 芯片及销售成果进行了详细的介绍,并发布了其 2018 年战略规划。


比特大陆成立于 2013 年,在比特币矿机领域处垄断地位。


有数据显示,比特大陆供应了全球 80%-90% 的矿机芯片。


到目前为止,比特大陆已经迭代了十余款基于 ASIC 架构的矿机专用芯片。2017 年 11 月,比特大陆的首款 AI 芯片 SOPHON BM1680 正式发售。


SOPHON 基于 ASIC 架构,是专为张量计算设计的 TPU 芯片,运行在服务器端,也是继谷歌 TPU 之后的第一代深度学习专用处理器。与谷歌自研自用不同的是,比特大陆的 SOPHON 芯片已经实现量产。


据汤炜伟介绍,目前 SOPHON 服务器等相关产品在公司官网渠道已售罄,销售量在数百台量级。同时在谈客户逾百家,涵盖安防、医疗等多个行业,与一些国内头部大型互联网公司也在合作洽谈。

2018 年,比特大陆计划在芯片升级、提升性能的同时,加快在公安安防、大数据、互联网等领域的场景化落地,提供 SOPHON 人工智能解决方案,加速自身人工智能全方位布局。



图中从左至右依次为:基于 SOPHON BM1680人工智能芯片的加速卡SC1+、SC1、智能视频分析服务器 SS1。

SOPHON 的诞生


尽管在比特币矿机领域成果颇丰,比特大陆还是更愿意将自己定义为 HPC 计算公司。


目前,从芯片到算法,再到中间的软件驱动、固件以及深度学习工具都有相应的团队负责,拥有一支规模达 200 人的 AI 团队。


据公司产品技术总监王俊介绍,自创立初期,公司就在高性能计算的硬件以及软件方面开始积累。只是由于公司创立当时,数字货币芯片是一个较好的产品,才深扎比特币矿机。


「做矿机芯片的公司到底能不能做 AI 芯片?」机器之心将这一问题抛给了汤炜伟。得到的答案是,这两个领域有很多技术储备可以复用。


汤炜伟介绍道,芯片设计团队有很大一部分比重是在做物理设计,这一部分的经验和能力在两个领域是通用的,都是在追求最优的工艺制程。除物理设计外,工程师团队也有很大的复用空间。


因此,比特大陆 AI 团队与矿机团队在人员上是打通的。


「我们趟过了芯片从设计到制造上的很多坑,这些坑是创业公司不可避免的要一路走过去的,所以我们前期积累到的经验是很重要的。」汤炜伟说。


这就很好地解释了人工智能专用芯片 SOPHON 的诞生。以比特币矿机芯片的大量生产所积累下来的 ASIC 芯片设计及制造经验为基础,2015 年初,看到 AI 的兴起以及当前计算架构在应对人工智能特别是深度学习所用的张量计算时的乏力,公司决定进入 AI 领域。


2015 年底,SOPHON 的设计进程正式开始,2017 年 4 月流片,并于同年第二季度拿到样品。


在未来一年半时间内完成计划内 4 款 AI 芯片的迭代,刨除已经发布的 BM1680 以及已流片的 BM1682,平均 9 个月一代。


过快的迭代速度不禁让人担忧,因为这有悖于摩尔定律(芯片行业以 18-24 个月为周期,计算能力翻一番)。但汤炜伟自信地表示,这不是计划,而是已经达到的能力,当前的第一代 AI 芯片就是在这样的速度下量产出来的。


汤炜伟将这一切归功于「一批经过数字货币芯片的战火洗礼的人才」,以及人才身上所具备的经验。




跨过 FPGA 直接做 ASIC 的底气


第三方调查机构 Tractica 于 2016 年底进行的调查结果显示,尽管当时 GPU 仍为深度学习计算的主流架构,但随着行业的发展、深度学习算法的成熟、计算体系架构的不断演进,到 2020 年,专用深度学习芯片在人工智能领域的应用数量将会超过 GPU。


汤炜伟认为,这从一个侧面表明了比特大陆所进入的这一新兴市场是符合行业发展趋势的。



图中绿色表示 GPU 颗数,蓝色表示 ASIC 颗数(均为百万量级)

当年比特币矿机芯片走过了从 CPU 到 GPU 再到 ASIC 专用芯片的进程。与之类似地,深度学习算也将走过从 CPU 到 GPU 再到 ASIC(TPU)的进程。


在人工智能时代,与 GPU 和 ASIC 经常被一同提及的计算架构还有 FPGA。由于 FPGA 的可反复编程的灵活特性,在深度学习算法还在不断摸索中前进的今天,看起来比只能编写一次的 ASIC 更适合当下的产业需求。


王俊对此解释道,FPGA 确实是很不错的硬件架构解决方案,开发周期短,易迭代。但比特大陆将 AI 看作公司长期战略方向,会持续多年进行投入。着眼于未来的成熟神经网络计算芯片产品,FPGA 在性能、性价比、功耗等方面都不具备优势,到时候 ASIC 肯定是那个更合适的方案。


王俊认为,在未来市场存量足够大时,对 ASIC 的设计就可以从现在着手做起,而很明显地,AI 具备这样的条件与潜力。


关注场景落地的下一年


和众多芯片厂商一样,由于处于产业上游,因此需要借助客户以及合作伙伴的力量赋能行业。比特大陆从产品及产业两个层面在 AI 领域进行布局。


产品层面,比特大陆提出 ABCR 布局,即 AI+Big Data+Cloud+Robot,2017 年 12 月 8 日,比特大陆收购了机器人公司萝卜科技,代表着比特大陆向机器人领域迈出的第一步。


比特大陆认为,在未来,机器人领域将是一块很大的蛋糕,在智能家居和机器人方面,比特大陆看到了很高的需求。因此,尽管当前比特大陆没有终端 AI 芯片的量产计划,仍然提早布局。


这让人不禁猜测,比特大陆在终端芯片上的研发是否已经悄然进行,这一猜想在会后机器之心从王俊口中得到了证实。


服务器端芯片是比特大陆的基因所在,但并不代表比特大陆会不碰终端芯片的市场。王俊表示,终端和云端是互相扭合促进的过程,比特大陆已在默默准备。


产业层面,比特大陆着眼安防、互联网、以及城市大数据三大领域。


比特大陆认为,这三大领域相对其他如医疗、金融、教育等领域技术更成熟、落地程度更高、且需求更明确。加之比特大陆观察到其产品在这三个领域的云端有更好的表现,因此决定选择这三个领域进行布局。


王俊称:「我们结合了市场需求与自身技术的擅长点。」


比特大陆计划从芯片层开始,封装算法层,最终形成一个一体化的解决方案,与合作伙伴进行深度合作,向行业进行推进。比特大陆认为,其产品在局端(云端边缘)的小规模服务器集群上会有需求。


中美的芯片「不争」


近两年,包括寒武纪、地平线在内的众多人工智能初创芯片公司相继成立,引发了业内的探讨热情。国内的芯片热能否在人工智能时代打破长期以来半导体市场被国外巨头强行垄断的情形。


曾供职 Intel 及英伟达两大芯片巨头的汤炜伟对此发表了看法。他认为,巨头在行业内长时间耕耘和积累以及巨头已经形成的芯片生态,是国内企业所欠缺的;但相反,国内企业有更多的人才优势以及更大的市场体量。


但当记者提到中美芯片「抗衡」这个词时,汤王二人均表示不认同。他们认为,技术是跨国界的,随着人才的流动和技术的交流,技术是相通的。


「人工智能芯片是大家共同看到的蓝海,」汤炜伟说,「在蓝海中肯定是合作大于竞争。」


]]> 原文: http://ift.tt/2lZhgY3
RSS Feed

机器知心

IFTTT

2017年57家独角兽名单重磅出炉,这18家中国公司不容错过!

编译 | 张震

来源 | visual captalist


近日,美国数据分析公司 PitchBook 发布 2017 年全球最新企业估值名单,全球共 57 家初创企业估值超 10 亿美元,跻身「独角兽」行列。其中,包括一些非常知名的公司,如 Reddit、 Quora 以及一些迅速崛起的公司如来自中国的今日头条。57 家公司市值高达 1165 亿美元。


2017 年榜单中,占比最大的仍然是美国公司,达 32 家。中国有 18 家公司上榜,占比超过三成。其他国家(比如英国等)一共有 7 家公司上榜。


其中,中国 18 家独角兽公司分别是:今日头条、链家、蔚来汽车、北汽新能源、摩拜、Ofo、商汤科技、大搜车、优客工场、Vipkid、Seasun、InMyShow(天下秀)、DotC United Group、阿里体育、Lalamove、QingCloud(青云)、越海全球、知乎。


中国 18 家独角兽公司


基于 PitchBook的数据,我们获得了一份完整的独角兽名单。


不难看出,中国「独角兽」涉及多个领域,覆盖当下最热门领域,比如人工智能、物流、云计算服务、共享经济、新能源汽车等。汽车服务、出海全球化、教育等多个互联网领域企业的快速成长,也为中国军团的全球化竞争增添了新的力量。


相较于美国独角兽正逐年递减,中国正大踏步前进。独角兽公司从 2013 年的零家增长到 2017 年的 18 家。覆盖领域从单一的互联网社交、电商,扩展到如今的互联网 O2O、内容、教育、汽车服务、出海全球化等多领域。


其中,成立于 2012 年,如今市值 200 亿美元的今日头条绝对是今年独角兽榜单中的庞然大物。


作为一个新闻和信息平台,今日头条采用人工智能技术向用户进行推荐,平台拥有 1.2 亿活跃用户。目前,公司也走在了收购的道路上,收购了如 Flipagram 和 Musical.ly 等公司。


另外一个值得关注的独角兽是 Coinbase。随着加密货币呈爆炸式增长,成立于 2012 年的 Coinbase 赶上了这一波热潮。

在美国,最重要的加密平台有很大的影响力,「Coinbase 效应」成为世界各地贸易商谈论的话题。只要 Coinbase 向它的 1000 万用户介绍一款新的加密货币,价格就能被推得很高。现在,Coinbase 每一个动态都被加密用户和一些有影响力的人紧紧跟踪。


基于 PitchBook的数据



全球每年的独角兽公司数字


投资者相信独角兽公司能够提供代表未来的平台或者产品,因此,他们都在这些公司上压了很大的赌注。


2014 年开始,全球「独角兽」企业数量呈现出爆发式增长态势,2015 年达 81 家。随后呈下滑趋势,2017 年 57 家的数字虽不及高峰期,仍然相当可观。不过,这也清楚的说明了,2015 出现的独角兽大爆发的泡沫已经破灭。风投资本家们抛弃了一些公司,重新关注那些高质量的投资项目,而不是全面撒网。


对一家初创公司来说,达到 10 亿美元的估值无疑是具有里程碑意义的一步,然而,这并不是未来成功的必要保证。


这些公司究竟是不负所望还是最终走向独角兽的坟墓?让我们拭目以待。


]]> 原文: http://ift.tt/2CJHx71
RSS Feed

机器知心

IFTTT

2018,人工智能可以在哪些领域最快得到应用和普及?

文章来源于APICloud。

 

根据腾讯互娱发布的《2017 Q3 AI 行业全景热度观察》,2017年第三季度,全球AI公司融资总额高达 77.42 亿美元,仅比前两个季度之和低10亿美元,而与2012年同期相比则增长了70余倍。


虽然第四季度还没结束,但10月底旷视科技4.6亿美元的C轮融资额已经刷新了此前由商汤科技所保持的4.1 亿美元的融资记录,也成为全球人工智能企业迄今为止所获得的最大一笔融资。不难看出,火遍整个2017年的人工智能,到了年末依旧是势头不减,甚至很可能再次打破之前的各项融资记录。


回顾过去,从1956年的达特茅斯会议到今天,人工智能已经走过了60多年的历史。在这60多年中,人工智能经历过高峰,也曾跌落到低谷,但从来没有哪一次像今天这样,成为街头巷尾无人不谈的话题。虽然这一定程度上得益于移动互联网时代信息传播效率的飞速提升使得热点话题的影响力得以成千上万倍的扩大。但另一个更重要的原因是,这一次的人工智能复兴与以往的最大区别在于,它让人们真正看到了 AI 技术改变人类未来生活方式的可能性。


用李开复的话说:"今天的人工智能是'有用'的人工智能……这一次人工智能复兴的最大特点,就是 AI 在多个相关领域表现出可以被普通人认可的性能或效率,并因此被成熟的商业模式接受,开始在产业界发挥出真正的价值......我们说'人工智能来了',其实是说,人工智能或深度学习真的可以解决实际问题了。"


可以和李开复这段话相互映证的是,在上周阿里云主办的2017云栖大会·北京峰会上,阿里巴巴明确表示人工智能不应仅仅是"概念上的 AI",更是"产业上的 AI",同时宣布了阿里云人工智能技术在金融、零售、航空、交通等多个行业的实践成果。


越来越多的迹象表明,今天的人工智能,真的和以往大不一样。


在过去这一年中,无论是互联网公司还是传统企业,无论是在公司内部宣讲战略还是在外部会议上发表报告,都是三句话不离 AI,唯恐自己被抛弃于时代潮流之后。但与之前的几次技术浪潮相比,人工智能对人才和资源的要求显然要高出不少,不是谁都能玩得转的。


那么,对于大多数公司来说,进入人工智能领域有哪些难以跨越的门槛?企业如何利用 AI 技术助力现有业务更上一层楼?还有,在未来的几年里,人工智能在哪些产业领域可以最快得到应用和普及?


近日,IBM 全球杰出工程师、IBM 研究院认知系统全球研究负责人林咏华女士接受了"AI时代的移动技术革新"大会主办方的采访(大会将于2018年1月5日在北京国际会议中心举行,林咏华女士是受邀演讲嘉宾之一),聊了聊她对上述问题的看法。以下内容根据采访记录整理而成。

 

如何看待当下的人工智能热潮?有多少是理性驱使,又有多少是人云亦云?


人工智能目前无论在企业还是投资界都是被火爆地追逐着。说实在话,当IBM在 2011年构建出 Watson,并首次在智力竞赛中打败最优秀的人类选手时,能预见人工智能对未来业界发展的重要性,但没有想象到这种人人谈人工智能的火爆局面。


纵观整个信息技术在过去10年的发展,无论是10年前移动通信的发展热潮,还是5年前云计算的风起云涌,都没有今天人工智能被关注的广泛性和火爆性。原因是什么呢?是今天人工智能的可实验性远远高于之前的信息科技。


这个"可实验性"是指一个开发者、一个大学生,甚至会编程的中学生都可以进行人工智能实验性的尝试。它来源于整个开源社区在代码和数据上的整体贡献, 得益于整个信息科技领域对开源文化的推动,也得益于几个大的人工智能会议对被录用文章的数据和代码的公开性要求。


在过去几年,围绕深度学习、神经网络等算法的代码以及公开数据集层出不穷。一个开发者,只需要懂 Python,就可以在一天之内构建起一个开发环境,并把开源的代码跑起来。利用开源的数据集,就可以重现别人的结果。


一个新的人工智能研究方向出现,就伴随着一些优秀的数据集公开。例如,当年李飞飞主导的 ImageNet 为今天的图象识别奠定了最大的数据集基础,今年12月 MIT IBM Watson Lab 为了推动视频中的动作识别,共同推出的百万量级的视频动作数据集。所有的这些贡献,都是为了降低大家实验的难度,推动业界更快速地解决人工智能中的难题。在这种人人都可以尝试的氛围下,既推高了大家对这个领域的关注和兴趣,必然也带来了人云亦云的火爆。


但是,这是否就代表了今天在学术界解决了的问题,相关的技术已经可以大量地使用到工业界呢?我觉得大家需要看到工业界和学术界之间的差距。之前我也看到一些人工智能领域的专家进行了许多分析,我这里就讨论两点:

 

● 第一是数据的差异


数据是人工智能必不可少的用于训练机器的输入。而今天能在公开途径获得的数据集绝大多数都是非商业用途数据,大多数都是从互联网上积累的数据。真正用于工业场景的高价值数据是难以放到公开数据集中,也难以让千千万万研究者进行算法研究的。


IBM 研究院在医疗、汽车驾驶、生产制造等重要行业领域与相关企业进行人工智能合作研究。在这些行业和企业中,我们遇到了大量公开数据集所没有的数据分布。在面对行业生产部署的严苛要求时,我们一些已有的研究是不适用的,许多在顶级会议中号称的最佳结果也是不适用的。因此,这里需要我们脚踏实地,深入工业行业进行人工智能的研究和开发。

 

● 第二是人工智能系统本身的成本


把人工智能用到工业界,我们需要认真审视它附加到现有产品上的成本开销。以视频监控为例,在视频监控中使用人工智能是一个很热的话题。今天,使用人脸识别、人或车辆的自动捕捉进行初步的视频分析已经开始广泛使用在城市、公共安全等领域。


其实基于计算机视觉的人工智能可以做得更多,它可以检测和识别各种物体(而不仅仅是人或车辆),检测人的各种动作等等。但基于深度学习的目标检测算法往往需要大量的GPU计算资源。基于今年最新的GPU硬件能力,一块高性能的GPU也就只能支持3~4路视频的复杂目标检测(单个模型)。平摊到每路视频,就要大约1000~2000美金的硬件成本。相比起目前4K摄像头的成本,将近是10倍的成本差异。


如果我们进一步考虑动作检测,使用光流计算或3D深度学习或者更复杂的算法,这个成本的叠加更加难以接受。所以,在人工智能向前行进时,我们需要更多的研究和创新,去解决全系统的优化问题,而绝对不能只停留在单一的功能或精准度的层面。

 

对于在 AI 领域技术基础比较薄弱的企业,如何才能享受到 AI 带来的红利?


为什么今天的企业都争先恐后的想要进入 AI 领域?他们是希望成为像 IBM、Google 这样的 AI 公司,每年到 AAAI 或 NIPS 发几篇文章吗?答案当然不是。企业想进入 AI 领域,还是希望在自己的业务领域能获得新的增长点,希望借用 AI 的力量能打造出新的产品赢得更多市场份额,希望通过 AI 能把已有的产品提升一个水平从而更快地击败市场上的竞争对手。所以,对于这些希望利用 AI 技术的企业而言有两点是重要的。第一,找准 AI 技术在自身业务领域的定位,也就是未来产品的战略思考。这一点是无论如何不能由别的公司代替你去思考的,因为只有企业自己最了解自身的业务领域、发展机遇和企业现状。第二,Time-to Market,时间是十分宝贵的。在目前信息平坦的年代,市场机遇的赛跑就是时间的赛跑。


所以,对于各个行业的企业,如果希望享受到人工智能带来的红利,需要自身花更多时间去思考和策划上面提到的第一点问题(产品战略),而在第二点(Time-to Market)上,需要懂得借助外力。今天,在与时间赛跑的过程中,企业面临的最大挑战是人才和数据的问题。如何"借助外力",往往也是企业犹豫的。如果像传统的购买企业服务模式来解决人才问题,对于一些行业会行不通。对于许多行业,他们的数据是具有高度保密的性质,不能把这些数据都交由第三方公司进行数据训练和分析。此外,企业的生产环境所针对的数据类型也会随着时间有所改变,例如零售业中货架的商品品类,生产线上产品的批次改变等。因此,哪怕企业交由第三方公司开发了一个机器学习的模型,是否之后所有在生产环境中的变化都要依赖第三方公司进行调整呢?所以,在引入 AI 技术的过程中,企业往往会在"人才培养时间过长"和"把控产品"之间犹豫。正因为看到这种现状,IBM 在为企业市场打造的 AI 平台中引入了 "AI for AI"的概念。我们为企业打造的 AI 开发平台不仅仅是一套工具或方法论,而是真正把一个"AI大脑"潜入到 AI 开发平台。我们在"AI大脑"中率先引入了多种深度学习的技术,如迁移学习、自动化机器学习(auto machine learning)、数据增强(data augmentation)等。一方面我们把 IBM 研究院多年的机器学习研究成果内嵌到系统中,让 AI 开发平台更像一个专家系统;另一方面,我们通过AI for AI的技术,让这样的平台可以针对企业自己的数据进行自动化学习和优化。通过这些技术的内嵌,我们希望企业开发团队在没有深度学习的技术背景下,也能很容易地获得好的机器学习准确率。通过"AI for AI"的开发平台,我们希望帮助企业自身拥有 AI 的大脑,应用开发团队很快就能上手,使用企业自己的数据去进行机器学习以及AI 产品的研发。


在人才的问题之后,另一个困扰企业的问题是数据的问题。过去几年,深度学习的成功是基于海量的互联网开源数据。但这些数据都是互联网的数据,和企业希望解决的问题(如特定病种的医疗影像、产品质量的影像等等)没有直接的关系。所以,当需要使用 AI 技术来赋能自己的业务领域时,企业需要自己准备业务场景的数据集,也需要由具备专业领域知识的人员来标注数据集。因此,准备数据这个过程本身就极耗时间和人力。另外,企业往往会面临数据不足的问题,尤其是需要高度关注的数据类型。例如,在医疗影像中,往往有着各种症状的数据比健康人群的数据更为重要;在生产制造中,有着各种瑕疵问题的数据比质量正常的产品数据更需要关注;在汽车驾驶中,在各种恶劣天气路况下的数据比正常天气和光照的时候获得的数据更需要我们注意。但这些数据往往是小概率情况下的数据。因此,如何针对这些数量稀少却又十分重要的数据进行机器学习呢?不解决好这个问题,就难以把 AI 真正用到工业界场景。意识到这个问题的重要性,IBM 研究院确立了一系列针对小数据(Small Dataset)的研究,基于迁移学习、数据增强等课题进行深入研发。这些技术也应用到了 IBM 的 Watson 及企业 AI 开发平台(PowerAI)之上,直接帮助企业解决数据的问题。

 

未来几年内,哪些 AI 应用可以大规模投入市场?哪些还需要更长时间的研究及验证?


由于业界的你追我赶,AI 俨然是在一个高速跑道上发展。大家对短期的定义是1~2年,中长期是3~5年。一个新的 AI 技术是否可以大规模投入市场,应该看这个市场对该技术的差错容忍程度的高或低,例如,该技术能有 80% 的准确度就可以被接受,还是需要有 95%,甚至 99% 的准确度才可以?


记得在 2015 年,一个玩具厂商推出了 CogniToys(一个能跟孩子对话的绿色小恐龙),当年还被评为"2015 年度最佳玩具"。其实当年 CogniToys 的对话能力比今天国内好些公司推出的智能音箱要差好些。但因为 CogniToys 只是一个玩具产品,它不需要有很高的准确度。跟孩子的对话对一句错一句也没有多大关系。所以在 2015 年,哪怕机器对话技术还不成熟,也不能阻挡 CogniToys 在亚马逊上热卖。但是,同样的对话技术,如果我们用于要求严谨的医疗行业,或银行理财行业,就需要有更长的技术成熟期。


又例如,有一些技术今天可能只做到 90% 的准确率,如果我们希望在未来 1~2 年能广泛使用,就需要从应用场景上进行折中。折中的手法可以是多样的,例如加入人为判定。我们在 top1 的准确率不够的情形下,可以提供给用户 top5 的识别结果,让用户再从 top5 人为判断。通过这样的手法,可以让某些 AI 技术加快在一些领域的使用。当然,可以使用这样折中手法的应用领域,必须不是工业控制领域的。对于需要实时控制的系统领域,包括无人驾驶、自动化控制等,都必须有完全高准确率的要求。而这种对高准确率有完全硬性要求的应用场景,必然需要更长时间的研究和验证。


哪怕同一个技术,同一个工业领域,放在不同的地区使用,也会有时间的先后问题。例如,使用 AI 技术进行无人驾驶,目前多个厂商都先挑选诸如特定场区工程车辆、园区班车等,因为路况相对单一和简单。我们最近到印度参展,看到印度的汽车行业,就连辅助驾驶的研发,也都才刚刚开始。重要原因就是该地区的路况复杂度远高于美国和中国。所以,无人驾驶如果要在印度落地,或许需要 3~5 年的时间。


]]> 原文: http://ift.tt/2AncKH4
RSS Feed

机器知心

IFTTT

2018年1月3日星期三

年度AI跳槽指南 | 想去大公司?先试试做完这套真题

2018已来,一个崭新的跳槽季即将上演。

在AI人才严重短缺的时代,新一年你会如何选择未来的职业方向?或许有的公司已为你抛出橄榄枝,或许你仍在纠结,又或许你已经早有准备跃跃欲试。

可是你真的准备好了吗?你真的了解这些公司吗?

欢迎来到量子位特别策划的"跳槽指南"系列首篇:大公司怎么选。这有一份关于跳槽去BAT的开卷试题,希望能帮你更好的做出职业选择。

来,那就开始吧~

前往答题:年度AI跳槽指南 | 想去大公司?先试试做完这套真题

上面就是这套试卷的截图……由于有交互效果,还是再次推荐大家前往下面这个网址参与:

年度AI跳槽指南 | 想去大公司?先试试做完这套真题

就酱~

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2Am9j3t
RSS Feed

RSS5

IFTTT

年度AI跳槽指南 | 想去大公司?先试试做完这套真题

2018已来,一个崭新的跳槽季即将上演。

在AI人才严重短缺的时代,新一年你会如何选择未来的职业方向?或许有的公司已为你抛出橄榄枝,或许你仍在纠结,又或许你已经早有准备跃跃欲试。

可是你真的准备好了吗?你真的了解这些公司吗?

欢迎来到量子位特别策划的"跳槽指南"系列首篇:大公司怎么选。这有一份关于跳槽去BAT的开卷试题,希望能帮你更好的做出职业选择。

来,那就开始吧~

前往答题:年度AI跳槽指南 | 想去大公司?先试试做完这套真题

上面就是这套试卷的截图……由于有交互效果,还是再次推荐大家前往下面这个网址参与:

年度AI跳槽指南 | 想去大公司?先试试做完这套真题

就酱~

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 http://ift.tt/2Am9j3t
RSS Feed

RSS5

IFTTT

110 TFLOPS的Titan V是否值得买?这里有一份对比评测


去年 12 月 8 日,英伟达在 NIPS 2017 大会的一次活动中发布了最新消费级旗舰显卡 Titan V——Volta 架构,包含最新的神经网络计算单元 Tensor Core。英伟达宣称这块最新 Titan 旗舰的性能可达上一代产品(Titan Xp)的九倍。这款售价高达 3000 美元的显卡是否值得购买?随着 Titan V 陆续进入用户手中,已有人对其进行了评测。


Titan V 是英伟达最近推出的「桌面级」GPU,基于新一代 Volta 架构(12nm 工艺),拥有 211 亿个晶体管、12 GB 的 HBM2 显存,可以提供 110 TFLOPS 的「深度学习算力」,对于单块显卡而言,这是一个惊人的数字。相比之下,此前的最强显卡 GeForce 1080 Ti 可以输出 11 TFLOPS「常规算力」,内存为 11GB DDR5,而售价则是相对亲民的 699 美元。


Titan V 身上的数字看起来非常 exciting,其 2999 美元的售价虽然有点难以让人接收,但其接近 10 倍的算力提升是最大的卖点,我们能否用一块 Titan V 代替 10 块 1080 Ti?或者说,从价格来看,它能否超过 4 块 1080 Ti?


另一方面,英伟达 DGX 计算站现在的售价也下调至 49900 美元(原价 69900 美元)。这种设备内含 4 块水冷服务器级计算芯片 Tesla V100,这种芯片理论上性能强于桌面级的 Titan V(虽然价格要贵上很多,但其中应该包含技术支持和整套服务级协议)。尽管如此,大多数人(包括大量学校和科技公司的 AI Lab)是不会准备这种数量级的经费用于 GPU 的。即使这样的设备也在考虑范围之内,我们也要先讨论一下性价比的问题。


所以我们的问题是,Titan V 是不是当前构建深度学习环境最为值当的选择?


让我们从头说起,Titan V 和它服务器级的亲属 Tesla V100 都是在去年推出的(V100 在 2017 年 5 月份推出,而 Titan V 在 12 月推出)。大多数深度学习架构已经加入了对 Volta 架构的支持,确保其 Tensor Core 的潜力在模型训练时充分发挥。


例如,PyTorch 在近期发布了 0.3.0 版本,加入了 CUDA 9 和 Volta 架构 GPU 的支持。在我近期对于新硬件的测试中,PyTorch 社区提供了很大帮助。我已经在用 Titan V 运行 PyTorch 神经网络框架上的程序了,目前的一些测试程序可以用来对比硬件性能的差异。目前,我只能给出基于 PyTorch 0.3.0 的基准测试,我会在未来加入其他框架下的性能对比,这些测试将基于 CUDA 9.0.176 和 CuDNN 7.0.0.5,也有可能在这些 API 之外。



Titan V 与 1080  Ti 的性能测试对比


我们让 Titan V 和 GeForce 1080 Ti 在相同的设置下进行了对比测试(这些显卡在同样的计算机上经过了测试,都插在了 16x PCIE 接口上)。


上表中显示的时间是 CNN 前向传播(eval)和反向传播(train)所需的时间,以毫秒计。这些数字是超过 10 次操作的平均值,因为运算过多次,所以该数字相对稳定。


其中有趣的地方在于:

  • 显然,Titan V 的速度要快于 GeForce 1080 Ti。然而如果仅比较 32-bit 位的运算(单精度),Titan V 仅比 1080 Ti 快 20% 左右。
  • Titan V 在 16-bit 运算(半精度)上的运行速度要比 32-bit 位的运算速度快上很多。1080 Ti 也可以从半精度设置上受益,但速度提升相比 Titan V 而言较为平滑。

这些数字告诉我们「无脑选 Titan V」并不一定是对的。


关于接近 10 倍的算力提升,英伟达说谎了吗?我确定他们的营销人员是诚实优秀的人,但是这里存在多个因素。一,我确定从软件的角度来看,充分利用 Volta 超快的 Tensor Core 还有改进空间。但是即便如此,如果大部分代码路径不符合允许最大理论性能的条件,商家宣称的大幅度性能提升就有待商榷了。时间会告诉我们在框架/CUDA/CuDNN 级别可以有多大改进来充分利用 Volta GPU 的能力,但是我在常见的 CNN 上(我专注于计算机视觉,所以在这里使用卷积神经网络进行了测试)观察到的初始值似乎并不足以证明值得去升级成 Titan V,尤其是「买一个 Volta GPU,模型就能跑得起来」这种情况并不会出现。


尽管使用最新技术很有趣(先买先享受),但如果你使用个人 GPU 进行 AI 研究或构建产品,那么我建议你继续使用 GeForce 1080 Ti(直到英伟达不久之后发布更好、更合适的产品,GeForce 2080 Ti?)。此外,单块 Titan V 内存只有 12GB,1080 Ti 内存稍小,有 11GB。但是如果你用单个 Titan V 的钱买四个 1080 Ti(注意:为此你还需要更强大的电源、可支持 4 个 GPU 的主机、更大的 RAM,以及更好的冷却系统等),那么你将拥有更多的显存(44GB vs 12GB)。


如果你需要不止一个 GPU,那么更实际的方法是买 2 个 1080 Ti。这样,GPU 就不会一个一个地堆叠起来(堆叠需要更多的气流才能冷却,如果多个 GPU 热量过大,则性能损失会很严重……你可以采取水冷的方式,但该方法大幅增加成本和风险)。另外,如果只有两个显卡,那显卡所需电量是 250Wx2,这样你就不必担心供电不足。不管怎样,我发现拥有多个 GPU 并进行独立实验是一种性价比较高的做法,这样我可以快速迭代,因此我推荐此方法作为折中方案。


解决堆叠、空气冷却 GPU 的发热问题的另一种方法是,如果你必须使用 3-4 个 GPU,且不想使用水冷却,同时也不关心美感或噪声,那么大可以买一些 PCIE 扩展槽/立管,遵循这位 Kaggle 竞赛冠军的做法:



Vladimir Iglovikov(2017 年 Carvana Image Masking Challenge 冠军团队成员之一)搭建的 4x 1080 Ti 机器。



原文地址:http://ift.tt/2EpcOt8


]]> 原文: http://ift.tt/2CBQtLP
RSS Feed

机器知心

IFTTT

LangChain 彻底重写:从开源副业到独角兽,一次“核心迁移”干到 12.5 亿估值 -InfoQ 每周精要No.899期

「每周精要」 NO. 899 2025/10/25 头条 HEADLINE LangChain 彻底重写:从开源副业到独角兽,一次"核心迁移"干到 12.5 亿估值 精选 SELECTED 1000 行代码手搓 OpenAI gpt-oss 推理引...