2018年5月7日星期一

Drive.ai无人打车服务进德州,我们用15分钟见识了这位「新手驾驶员」

在位于德州达拉斯以北约 40 公里的小城弗里斯克(Frisco, TX),一辆行驶在路面上的橙色迷你货车特别显眼:

车顶上装载着密集、精密的仪器;车头车身和车后总共安装了四块小屏幕;车头刻着「Self-driving Vehicle」,车身则印着 Drive.ai 几个大字。

无人车所至,自然引起路人的瞩目。德州人鲜有见过如此「外表张扬」的无人车。他们挥手、大笑、指指点点,似乎想引起这辆车的注意。弗里斯克这座城市在近几年迅速崛起。风景秀丽,加上政府鼓动地产项目,以及低税收,弗里斯克已经吸引了多个大型跨国企业总部搬到这里,其中包括了丰田的北美总部、隔壁的 FedEx 正在建设的新总部、以及 NFL 球队达拉斯牛仔队(Dallas Cowboys)的新总部兼娱乐和餐饮中心 The Star。当地市长甚至自夸,「弗里斯科被公认为是使用『智能』创新交通技术的领导者。」

今天,这座小城迎来了一位来自加州的客人—— Drive.ai。

美国中部时间 5 月 7 日,加州无人车初创公司 Drive.ai 宣布,他们将和弗里斯克的运输管理协会(Frisco TMA — Transportation Management Association)合作,在当地启动一项基于无人驾驶的试点打车服务。今年 7 月,服务正式对外开放,为期六个月。

该服务覆盖弗里斯克的两个商业园区——面积 0.65 平方公里的 Hall Park 和前文提到的 The Star。当地的上班族只要在固定的接送地点,使用 Drive.ai 提供的 App,就能穿梭于两个商业园区之间吃饭和休闲娱乐。

Drive.ai 将这项新服务称之为「微交通系统」——结合园区接送和公共运输的区域型交通服务。随着项目的推进,Drive.ai 会扩大服务区域至附近的弗里斯克车站。
吴恩达发布会上,曾一手打造 Google Brain 和百度大脑、目前仍是 Drive.ai 董事会成员的吴恩达也感叹道:

「我记得在 2007 年参加 DARPA  城市挑战赛,看到斯坦福大学、CMU 和许多其他开拓性的自驾车队的出色工作。现在过了十年了,我特别激动自动驾驶汽车终于走到了这一步(Self-driving vehicles are finally here)

Drive.ai 正式成立于 2015 年,是一家再典型不过的「加州创业公司」,由一群斯坦福人工智能实验室的学生在车库里起家。公司创始人 Carol Reiley 是约翰霍普金斯大学计算机科学和机器人专业的博士,也是吴恩达的妻子。

Drive.ai 强调以深度学习算法优先,打造 Level 4 无人驾驶的全栈式解决方案,在底层核心技术上引入不同的合作商。去年 6月,公司完成了 5000 万美元 B 轮融资。9 月,Drive.ai 和美国第二大专车服务公司 Lyft 签署了战略合作,在旧金山部署了十多辆自动驾驶车辆提供打车试点服务。

公司联合创始人王弢告诉机器之能,Drive.ai 的服务并不只是试验项目,而是希望在当地实现无人驾驶的商业落地,并以此作为一个标杆,建立更多的合作关系。王弢

「我们挑了许多城市,最后定在了德州弗里斯克。德州的法律法规很健全,州政府和市级政府以及商业园区都对我们落地项目很支持;弗里斯克又是美国发展最快的城市之一,在这边会有很好的发展前景。」王弢说。

Drive.ai 将会在项目初期部署 3-4 辆无人车。而在此之前,机器之能作为受邀的中国媒体,在今天体验了 Drive.ai 的无人车试乘。

来,认识一下这位满分的新手驾驶员

Drive.ai 并没有选择过去常用的两款车型——林肯 MKZ 以及奥迪 A4 ,而是一款可以客货两用的燃油迷你货车。王弢解释说,「迷你货车内部空间比较大,适合共享出行;同时,也为物流服务做准备。」

和目前市面上大部分无人驾驶技术公司一样,Drive.ai 采用了包括 10 个高清摄像头、1 个毫米波雷达、以及 4 个激光雷达的多传感器方案。其车载电脑包含了 CPU 和 GPU ,计算能力相当于一个家用台式电脑。

据王弢透露,Drive.ai 谈妥了在弗里斯克的合作项目后,就在第一时间将无人车运了过去,并在之后的 4-5 天内完成了从数据采集和标注、绘制地图、训练无人车到细节调试的整个过程。工程师使用了低精度 GPS 和传感器来绘制厘米级别定位的高精地图,地图格式和储存的框架采用分布式,这样可以迅速生成并创建地图,同时能对新的区域或者地貌第一时间做出改动。

试乘前,机器之能记者注意到了 Drive.ai 无人车上的前后侧总共四个 LCD 屏幕,这是 Drive.ai 自研的车外人机交互系统,通过文字和符号完成和车外行人和车辆的沟通。比如,当行人过马路时,车前显示屏会打出「 waiting for you to cross」,车后屏幕则显示「stopping for passenger」。「这套车外交流显示屏上的设计只是暂时的,是我们认为目前会比较有效的交流方式,」Drive.ai 的用户体验设计师 Chip Alexander 说道,「我认为这种交互方式非常必要。比如无人车遇到行人过马路的时候会立即停下,但是它后面的车辆是看不到前方情况的。当无人车屏幕打出文字之后,后方司机马上就清楚了。」

车内的乘客座位前摆放了一个显示屏,能让乘客观察「车子所看到的一切」。画面上,红色标注物是一切在道路上需要规避的物体,包括路沿、路人、其他车辆等;绿色的是和道路无关的植被以及大楼;橙色标注的是车道线。屏幕上方有一个GoPro,用来检测多少乘客上车、以及他们是否系紧了安全带。为了保障乘客安全,尤其鉴于上个月在亚利桑那发生的无人车意外事件,Drive.ai 计划初期会安排驾驶员在无人车里。安全驾驶员只有在需要干预的情况下才会控制方向盘。

在中控台上有两盏小灯:红色是指人为模式,绿色是指无人驾驶模式。右边是一个红色的紧急制动按钮,按下则会立即停止无人车。技术逐步成熟后,Drive.ai 会进入第二个阶段:「抛弃」驾驶员。车内依然会配一名起到监督作用的员工,可以完成紧急制动。最终,Drive.ai 会完全达到 Level 4 的水平,不安排车内监控人员,只有一名远程的「决策员」,他可以在车遇到特别复杂的情况时,帮助车做决定。

「比如车辆修路要求换道,肢体语言不能识别,车有可能停下来,建议决策员选做决定。这样的数据会在之后反馈到数据集中进行训练。」王弢说。

而对于接下来的15分钟试乘,可以用一句话来形容—— Drive.ai 的无人车像是一个在驾照测试中获得满分的新手驾驶员。

首先是道路情况:总试乘路段长度目测不超过三英里,其中一半路段是在商业园区内,另一半则是在公共道路上,包括一个双向四车道的十字路口。道路情况虽然不复杂,但也存在挑战。

场景一:停车场,包括突然倒车以及冷不丁窜出来的行人。试乘过程中,无人车就多次遇上了在停车场内前方车辆倒车的情况,不过都及时地停下了。

场景二:没有任何交通灯或指示灯的十字路口,这种路况在中国以及加州都不常见。当车辆要通过一个十字路口时,必须要等到两边车辆、行人都没有的情况下才能通行。这就比较考验无人车的感知和决策的能力。

其中有一个细节值得注意。在大部分路口,无人车都会避让其他车辆。但返程途中经过一个复杂的路口时,过往车辆选择停下避让无人车,无人车在确定对方车辆完全停止后徐徐通过路口,似乎领会了人类司机的意图。

其次是亲身体验:Drive.ai开的速度不快,最高时速也不过50公里每小时。在园区内的时速基本控制在25公里每小时左右。行驶状态非常稳,全程没有出现急刹车或者任何可能会造成的意外情况。

只不过,一些性子比较急的乘客(比如记者本人)会认为无人车像是一个刚刚从驾校毕业的新手司机,它在路口停留的时间相比一般人类司机要更长些,可能会让不耐烦的德州司机们在车后摁喇叭。

这并不是一个负面的评价。相反,机器之能记者在和两位同行的交流过程中,都得到了类似这样的反馈:

「现在的人们一提到无人车,脑子里第一反应都是亚利桑那的那场车祸。Drive.ai 采取了一种非常小心翼翼的方式,这很好,让乘客觉得特别安全。」

弗里斯克是好地方,但德州人民可能对新技术不买账

「这是一个巨大的突破(tremendous breakthrough),解决了这里最后一英里移动性难题,」弗里斯克市长 Jeff Cheney 在现场说,「 Drive.ai 的团队们,恭喜你们!欢迎你们的到来!」

的确,对于弗里斯克乃至德州而言,Drive.ai 的计划确实具有历史性意义:因为这是首个在德州对外开放的无人驾驶打车服务。

然而,政府开绿灯,真的代表民众会接受吗?至少在许多德州人看来,无人车要想在这块西部土地上普及,还有很长的路要走。

「要知道,德州人民开车的风格相当的狂野。强行变道、超速、超车、甚至在车道上挤压甚至碰撞其他车,这种事情都很多见。同时,德州人爱车,而且对车有控制欲。比如我,我就不喜欢坐在后座上,不把着方向盘我就不舒服。」一位对无人驾驶不太感冒的 Uber 司机 Christoper,在我们前往弗里斯克的路上说道。

Christoper 做了三年多 Uber 兼职司机,乘客评价 4.8 分,拥有 6000 多个五星好评。

无人驾驶也能提供这样的优质服务吗?他表示怀疑,「这项技术不会一下子颠覆共享出行业务,它会成为一种选择,但短期内,大部分人还是会相信人类司机吧。」

在我们对 20 多位当地市民的简单调研中发现:在相同价格下,81% 的人会选择拥有人类司机的打车服务;如果无人驾驶打车服务提供的价格非常便宜、甚至是免费,比例下降到了 52%。

Drive.ai 自然不必在当下担心这个问题,但要想持续扩大服务覆盖面,民众对技术的接受程度会是一个难题。

「我们也做了一些调查,发现当人们乘过 Drive.ai 的无人车之后,会降低他们对无人车的负面印象。」Drive.ai 的 CEO Sameep Tandon 在采访中正面回应了这个问题,

「我们在和商业合作伙伴,包括市政府和私营机构紧密地合作,开展一些对于社区公众的科普,让大家对自动驾驶车的决策和机制更加熟悉,司机和行人知道在车辆周围怎么样是最安全的。」

在发布会上,Drive.ai 的一位合作伙伴、年近八旬的丹顿县交通管理局董事会主席Charles Emery 在发表演讲时,回忆起了他的童年:他 13、14 时就开始在附近的农场里割麦子,当时最怕的就是自行驱车把这些麦子送到弗里斯克的老城区。

他小时候不曾想象,在他的有生之年能够在家乡看到无人车。他看着身边的吴恩达说,「弗里斯克是我一生的全部。我由衷地感谢你们能来到这儿,将这项新技术投入到这座城市中。」

]]> 原文: https://ift.tt/2K4AtkN
RSS Feed

机器知心

IFTTT

微软Build大会:押注更快的芯片并让计算无处不在

在微软的 2018 年度开发者大会演讲的开始,微软 CEO 萨蒂亚·纳德拉搬出了普适计算概念创始人 Mark Weiser 这样一句话:

「最深刻的技术是那些消失的技术,它们融入生活,变成生活。」这就像去年微软 Build 大会上,无处不在的云和 AI 、边缘计算占据了全部重点,到今年,这些策略已经成为实实在在的基础设施正通过不同平台形成从物联网、合作商到开发者的生态。

而「如何将微软关于智能云计算与智能边缘计算的愿景转化为现实」?这既是微软的大会讨论主题,也仍然是接下来需要反复应答的挑战。

让 AI 能力「拆箱即用」

「三年前,我在旧金山举办的 Build 大会上正式发布了微软认知服务。今天,已经有 100 万开发者使用了我们的服务。」微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋表示,「通过认知服务,我们为大家提供了最广泛的、可定制的人工智能技术,而且同时适用于云与边缘计算。」

不言而喻,输出 AI 能力最重要的还是要回到「好用」上,微软各个层面的 AI 技术正被越来越多地「组装整合」,让开发者可以更方便地构建和管理内置人工智能的解决方案。

比如,Azure 认知服务升级中包括了针对语音、对话机器人、搜索,其中与 Azure 搜索的集成是一项新功能。

统一语音服务,是把语音识别、文本到文本到语音转换、定制声音模型和翻译功能放在一起。对开发者而言,只用按需自定义就能方便改造自己的智能化应用。

认知服务和 Bot Framework 则是在功能上满足企业品牌化定位的需求,能和任何代理机器人实现无缝集成的同时,能完成更丰富和个性化的声音定制。从两年前萨提亚在 Build 大会上首次发布 Bot Framework 以来,已经有 30 万开发者参与尝试。

「对话机器人正在成为新的应用,这是一个不容忽视的前景。对于今天的开发者来说,你必须要懂得如何构建、部署和运行一个对话机器人。」沈向洋说,「我们看到了大量来自企业的推动和需求——他们要的不只是像微软小娜这样的智能助理,更需要可以用于人力资源管理、招聘、客户支持和服务等领域的业务机器人。」

除此之外,还有一个针对语音设备的开发工具包,在类似不停车点餐系统、车内或室内语音助手、智能扬声器等场景下,开发者可以通过其中降噪、远场声音识别等技术实现识别准确率。

在基础层面,实时的人工智能推算能力至关重要,像是视频流、图像处理都是相当消耗资源的过程,但开发者仍然要面对批尺寸(batch size)和性能之间的矛盾。大会上发布的 Project Brainwave 预览版就是为解决这一问题而来。

Project Brainwave 是用于深层神经网络处理的架构可用于 Azure 与边缘环境,帮助 Azure 提速人工智能的实时运行,并且已经实现与 Azure 机器学习的完全整合。另外,Project Brainwave 预览版支持了英特尔的 FPGA 硬件的同时融合了 ResNet50 的神经网络,这意味着在一片拥抱专用芯片呼声中,微软坚定地站在了 FPGA (可编程门阵列)这一边。

除了工具和产品,微软也把微软研究院和人工智能事业部的资源开放出来。在沈向洋看来,微软始终坚持进行的尖端技术研究最终都要服务于开发者。他公布了一个叫做 AI.lab 的网站,这是向开发者提供人工智能实践的分享社区,任何想要学习人工智能的开发者都可以访问微软 AI School ,免费获得在线课程、指导和资源。

重仓智能边缘计算的机遇

从家庭到商业场合,不同种类的智能设备快速涌现,微软提供了一个预测,到 2020 年,其总数将超过 200 亿台。而这些设备区别于以往的数字化产品,它们甚至无需一直连接云端,就能具备看、听、推理、预测的能力。

「当每个人都在谈论云计算时,最有趣的部分就是云的边缘,」萨提亚曾说,「无论是 IoT行业、汽车行业或零售行业发生了什么,本质上都是在数据生成之处产生的计算,海量的设备,也就是云的边缘,不断产生数据并消耗计算能力。」

而这也意味着,从一个家庭、一个公司的办公室到医院手术室再到生产车间等不同环境下,都布满了智能边缘计算的可能性。

微软则用构建横跨 Azure,Microsoft 365 等平台新型应用的姿态迎接这个新机遇。「计算正变得无处不在,而智能边缘计算将会是下一个关键技术前沿。」微软全球执行副总裁、云计算与企业级事业部负责人Scott Guthrie 说。

Microsoft 365 是 Office 365、Windows 10 和企业移动+安全套件(EMS)的结合体,被微软视为智能边缘计算的关键组成部分。从大会上公布的数据来看,其商业月活跃用户数已经超过 1.35 亿,而联网的 Windows 10 设备有将近 7 亿台。

针对这一庞大人群,微软发布了在 Microsoft 365 使用的智能化开发工具,包括让开发者和组织在 Excel 中自行编制计算公式的 Azure 机器学习和 JavaScript 定制功能,以及能在智能云上开发机器学习模型并实现离线部署在本地以高性能模式运行的 Windows 机器学习平台等。

针对外部用户,微软也推出了帮助他们进入边缘计算领域的服务。

Azure IoT Edge 边缘运算服务是在去年 Build 大会提出来,简单说就是在不用事事都上云端的情况下,把 Azure 服务、定制工具及 AI 服务带向前端物联网装置上,减少资料传输云端往反的延迟时间。

今年,在此基础上,微软开源了 Azure IoTEdge Runtime ,让用户能够对边缘应用进行修改、调试,并拥有更高的透明度和控制能力。在提供的服务方面,主要集中在视觉能力上:

一方面,微软宣布与高通合作,打造运行 Azure IoT Edge 的视觉人工智能开发工具包,为开发基于摄像头的物联网解决方案提供软硬件支持。由此,除了 Azure 机器学习服务,开发者可以用到高通视觉智能平台和人工智能引擎的硬件加速开发应用解决方案。

另一方面,在 Azure IoT Edge 上可以运行定制化的视觉服务,让无人机或工业装备可以在不联网的状态下快速响应。

大会上,微软还宣布了与大疆创新(DJI)的战略合作,为大疆无人机带来先进的人工智能机器学习能力,帮助企业用户更好地驾驭商用无人机与智能边缘云计算。合作主要集中在面向 Windows 10 电脑的全新开发工具包(SDK),向全球 7 亿Windows 10 活跃设备提供完整的飞行控制和实时数据传输功能。作为这项商业合作的组成部分,大疆创新和微软还将利用Azure IOT Edge 和微软人工智能服务合作开发适用于农业、建筑行业、公共安全及更多应用场景的解决方案。]]> 原文: https://ift.tt/2JYW1iM
RSS Feed

机器知心

IFTTT

Uber致命车祸调查:软件探测到行人,但未被系统视为威胁

科技媒体 The Information 称,两位知情人士透露,Uber 车祸( 3 月份亚利桑那州一辆原型自动驾驶汽车撞击行人致其死亡)的原因是一个软件问题,这个软件决定汽车应该如何应对它所探测到的物体。汽车的传感器探测到正骑着自行车过马路的行人,但是 Uber 的软件决定汽车不需要马上做出反应。

和其他无人车系统一样,Uber 软件有能力忽略假阳性,或者说道路上那些不会真构成威胁的物体,比如一个漂浮在路面上的塑料袋。 在这种情况下,Uber 的高管们相信,系统会进行调试以对这些情况做出不那么大的反应。 但在这个事故中,调试太过,车辆反应也不够快,其中一位知情人士说。

与此同时,开车的司机本应接管并防止事故发生,但在汽车以接近每小时 40 英里速度撞击伊莱恩 · 赫兹伯格之前的几秒钟,他并没有注意到。

在碰撞调查中,Uber 发现,自动驾驶汽车的一个重要部分很可能仍在正常工作,亦即感知软件,这种软件结合了汽车相机、激光雷达和雷达数据,以识别和标记周围的物体。感知软件被认为已经看到了行人,问题在于更广泛的系统选择如何处理这些信息。

目前还不清楚 Uber 对司机采取了什么行动,但该公司此前在一份公开声明中表示,Uber 仍然雇佣 了他。 该公司与受害者家属达成了财务协议,受害者被认为是第一个死于自动驾驶汽车原型的人。

而这个发现,可能会促使其他的自动驾驶汽车开发者去检查自己所做的有关处理潜在误报方面所做的软件调整。 

其实,Uber 之所以会调整自己的系统使其对车周围的物体不那么谨慎,是有原因的: 

Uber 正在尝试开发一款舒适的自动驾驶汽车。 相比之下,最近 Waymo 和通用汽车(General Motors)巡航车上的乘客表示,尽管看不到任何威胁,但突然踩下刹车的人可能会突然停下来。 这通常是由于车辆对误报作出反应。 Uber 认为,一个不断猛踩刹车、停下来的自动驾驶汽车原型也是危险的。

一位知情人士表示,在 3 月份发生事故之前,Uber 一直在追赶对手,实现年终目标: 允许乘坐 Uber 自动驾驶的沃尔沃(Volvo)自动驾驶汽车,而不需要安全驾驶员坐在后面。 

据两位熟悉内部反应的人士透露,在得知行人死亡后,部分人在办公室里掉了眼泪。 这些人说,从那以后,大多数员工都被蒙在鼓里,不知道哪里出了问题。 

该部门的负责人埃里克•梅霍费尔( Eric Meyhofer )告诉研究小组,开发自动驾驶汽车将最终结束与汽车导致的相关死亡,因此他们应该继续他们的工作。

目前还不清楚 Uber 可能会对其系统进行什么样的改革,以便雇佣和监控那些坐在原型车后面、出现问题及时接管的人。 但是,自主开发过程需要很多年,所以 Uber 有机会雇佣司机,更好地培训他们,或者为有多年专业经验的司机支付费用,就像公司开始时那样,付钱给豪华轿车司机来接送乘客。 大多数无人车项目会雇佣 20 岁出头到30 岁左右的司机,每小时支付 25 美元左右。 公司培训司机通过测试,并监管他们的行为。

无人车开发人员说,人类安全员(比如 Uber 原型中的那个)是创建一个有能力的自动驾驶系统的必要条件。 雇佣更好的司机,给他们更好的工具来避免这样的事故,比如当系统决定忽略某些对象并认为它们不是威胁时,视觉或音频警报也可能是必要的。 否则,司机就有可能对自动驾驶系统的监控感到自满,并且会发生更多的事故。

大多数开发项目中,会在测试过程中让两个人随时待在车里ーー安全驾驶员和乘客座位上的某个人,他的工作就是记录出现的问题。 在事故发生之前,Uber 已经将第二个人从亚利桑那州的一些测试车辆上去掉了。 从安全角度来看,第二个人究竟有多大用处还不得而知。

]]> 原文: https://ift.tt/2K2pqIK
RSS Feed

机器知心

IFTTT

全栈技能与平衡艺术:首枚面向物联网AI芯片UniOne背后的故事

「下周就能看到封装好的芯片了。」在云知声位于冠捷大厦办公室接受采访的 CEO 黄伟,难掩内心的喜悦。

这是国内首枚面向 AIoT (AI+IoT)的 AI 芯片(UniOne),指令集和微架构均由云知声自研,拥有全新的芯片结构。

「三年了,我们花费的精力和时间不比这些公司(寒武纪、地平线等公司)少。」黄伟感叹道,「而且我要强调一下,这不是语音芯片,是针对深度学习进行架构设计,是对计算本身的加速,而不是算法加速。」

借由这枚芯片的流片成功,云知声也成为中国语音 AI 公司中,第一家拥有自研 AI 芯片的公司。

采访结束后不久,笔者终于见到了这枚 AI 芯片。

UniOne 量产版

芯片基于 UniOne 的 AI 指令集和 DSP 指令集,针对语音应用场景,将麦克风阵列信号处理、语音识别及语音合成结为一体。

巧合的是,就在那段时间,芯片领域又接连传来几枚重磅消息。

阿里宣布全资收购中国大陆唯一的自主嵌入式 CPU IP Core 公司——中天微系统有限公司。而在此之前,阿里达摩院就曾表示正在自研 Ali-NPU。

最近,阿里又宣布全资收购语音信号处理领域的创业公司——北京先声互联,意在布局语音专用芯片。这家公司曾为阿里、百度、小米等多家公司提供远场语音交互软硬件的解决方案,

放眼海外,亚马逊自研 AI 芯片已不是新闻。这枚芯片将用于下一代 Echo 设备,提升 Alexa 的响应时间与搜索速度。

「从 400 多人的研发团队规模来看,应该很早之前就开始做了。」黄伟说。

最近又有消息指出 Facebook 正在研发智能音箱,LeCun 甚至在社交媒体上贴出了 ASIC 与 FPGA 职位的招募信息。

面对越来越热闹的赛道,「这证明我们走的路是对的。」黄伟说。三年前,「我们想到做的时候,地平线还没有成立。我们决定搭建团队时,地平线刚成立。」

谁也逃不过漫长的研发周期,至少目前「在工业界,我们是走在前面的。」Bring up,各项工作都完成,可以投向量产了。左一为公司物联网事业部副总裁李霄寒,右二为公司CEO黄伟

作为大多数语音交互公司演化逻辑的「云·端·芯

国内从事语音交互的公司其实不算多,除了 BAT 巨头,比较知名的公司就是搜狗、科大讯飞、云知声、思必驰、出门问问、声智科技、蓦然认知、三角兽等公司,而且以创业公司为主。

在商业模式上,这些技术见长公司的选择逐渐趋于共性:做 B 端产品公司的技术服务商,提供软硬一体的解决方案。(做消费类硬件的出门问问和以 G 端业务为主的科大讯飞是两个比较明显的例外。)

其背后逻辑并不难理解:就尚处早期的新技术而言,其核心问题往往是「使能」(enabling technology),而这通常是一个软硬融合的问题。

历经十多年市场验证的 Mobileye 模式就是一个典型案例:算法距离应用场景非常近,而由此产生的优势就是可以针对使用场景需求研究最适合的算法框架,然后将算法框架实现在芯片方案上。在加速技术落地同时,也不断滚动数据收集,并与行业深度结合。

不过,云知声将这个内在逻辑更加形象地概括为了「云·端·芯」。调试用的测试封装。

具体说来,语音AI公司最初会从算法团队转型为「云平台」商。

语音识别技术最关键的是先要有充足的语料积累,不光是找人去录语音,更需要用户真实的数据。尽快实现算法的云平台化,能够在短时间内、很低成本地完成大量语音数据积累。

因此,语音技术公司初创后,通常会向拥有海量用户产品开放 API,将算法云平台化,实现算法团队到云平台服务的转变。而免费+定制化收费(比如与垂直领域紧密结合的 ASR),亦即 Freemium(免费+增值)模式成为语音技术起家公司的多数选择。

2012 年,成立后短短三个月内,云知声就迅速完成了算法团队向云平台服务的转变,将基于深度学习语音识别引擎部署到云端。并随着技术的变化,逐步扩展了自己的算法能力边界,涵盖信号处理、NLP 等。

「我们做云,不是闭门造车。而是在商业化落地过程中,结合具体场景演化云平台。」黄伟说。

借由观察到的平台数据,云知声逐渐清晰接下来的具体业务方向: 语音与非手机硬件设备的深度交互是未来的方向,IoT 产业下的语音业务大有可为。

比如一方面,平台数据显示当时比较热的手机语音助手「是一个伪命题。」用户活跃度很低,不足以支撑一个商业模式。

而另外一些应用用户量规模并不是很高,但是它的场景很明显,比方说汽车和客厅的电视。应用的运行总量也许不大,但每个用户每天消费频次非常高。

接下来,由于语音链条比较长,为了实现算法最优效果,在技术落地过程中,技术服务商也需要考虑硬件问题。

事实上,众多的语音识别厂商也都有联合芯片厂商推出自己的语音识别模组,或者推出自己的麦克风阵列方案,以提升语音识别的体验;同时,这种「Turn-Key」解决方案也更有利于传统硬件厂商快速将新的产品推向市场。

2014 年 3 月,云知声正式提出「云·端·芯」战略——即从云平台到设备语音交互,再到设备语音专用芯片与麦克风阵列的集成式解决方案。

「2014 年我们引入了高通的战略投资。这一年开始研发通用模组,2015 年投入商用。」云知声 IoT 事业部副总裁李霄寒说,他也是这枚芯片研发工作的负责人。

无论如何,「先将芯片做出来再说。」黄伟回忆道。

「云·端·芯」升级迭代的背后:长出来的需求

当大家都还停留在与通用芯片厂商合作定制自己的硬件方案时,这枚流片成功的 AIoT 芯片已经从一定程度上打破了相对稳定了几年的竞争格局。

「如果说我专注地来做一些事的话,我一定会专注地死去。」黄伟说。

但是,与从算法转型云平台商、再接着做通用模组相比,一家算法技术公司上溯至产业链上游自研芯片,已经打破了既有的市场分工,跨度不可谓不大,更何况当时国内还没有寒武纪、深鉴科技这样的芯片公司。

「四年前下这个决心,还是比较难的。」黄伟坦言。做芯片前前后后砸了几千万(如果将兼职等其他人员和时间等成本加上,可能是大几千万。)「这也是决定难做的一个重要原因。」他说,「不过,有人因为相信而看到。」

企业的核心竞争力无外乎几种:产品或服务的差异化;规模效应带来的成本优势以及网络效应。

然而,经过几年的技术发展,目前语音识别行业似乎维持着最大平衡,国内外多数公司的引擎识别率都基本在同一个水平线上,接近当前语音识别技术极限。

服务的同质化,加上多数公司业务都有不少重合(比如车载、智能家居、机器人),谁能赢得客户很大程度上成了拼商务,这也意味着,价格战甚至恶性竞争几乎无法避免,毕竟产品方更替方案的成本低。如果技术服务商的供应链砍价能力不够,自身既有方案价格反而还会高出百分之几十。

因此,现有业务的升级必须诉诸内部结构的优化。这就像谷歌一定要去做 TPU,才可能把它的 AI 服务做得特别好,同时降本并拉开差异化距离。公司总部一角

「以前的场景,比如移动端、嵌入式端、PC 端都有各自的一些芯片体系作为支撑。」李霄寒说,

「现在, 我们面临的是 AIoT 场景,需要引入人工智能的能力。以前既有芯片产品体系无法满足当前场景的巨大要求。」

对于云知声来说,一枚 AIoT 芯片可以帮助实现技术服务的差异化,形成新的核心竞争力。随着云知声自 主 AI 芯片的落地,通过提供标准化的人机交互产品对接接口,可为合作客户提供允许在端和云两方面均可进行高度定制的解决方案。

事实上,近几年,云知声在家居、智能音箱、儿童机器人等市场已经实现百万级别的 IVM(通用芯片方案)应用,成功验证了市场、产品和用户场景的合理性。而返回的数据进一步打磨了算法,也为 ASIC 芯片的研发奠定了坚实基础。

「我们做芯片的逻辑和亚马逊差不多。」黄伟说。

不过,一个更为现实的开「芯」因素是百万级别 IVM 规模化应用,也将通用方案的弊端充分暴露出来。

本质上,通用方案是一个双芯片方案。

一方面,通用方案没有深度学习能力,而应用需要比较高的主频,比较强的计算能力芯片。另一方面,需要单独的降噪芯片去跑对实时性要求很高的降噪算法。

双芯片,再加上每一个都配备的相应外围器件,板子不仅会变大,价格也会上去。卖的越多,生产和维护成本也跟着上涨,很大程度妨碍了服务的规模化。通用模组方案,个头比较大。

(是原有方案价格区间)百这个量级的。」李霄寒说。也就是说,BOM 每增加一块钱,最终到用户手里边的售价就会增加 3 到 8 块钱(一般在 6 块钱左右。)如果成本增加了 100 块钱,最后售价会增加 600 块钱。

这意味着你有两个选择,要么改变当前比较低成本的产品形态,原来是 500 块钱区间,现在变成 1000 多块钱区间的。不过,用户范围马上变了。或者,只能放在相对对成本不那么敏感的高端产品上,卖一万块钱,这个是可以的。但这又大大局限了产品的应用范围。

通过把成本降下来,可以在原来可能是金字塔尖上那些产品可以为金字塔的主体所用。而在云知声看来,这才是物联网的本来意义。

重构芯片架构的专用型芯片,成为平衡这些诉求的唯一方案。据介绍,UniOne 能将当前语音 AI 的相关的能力能够充分的发挥出来。

「从前面的评测数据来讲,是绰绰有余的。可以把当前最先进的语音技术放到我们的芯片上跑,完全没问题。」李霄寒说。

至于有多么省钱,黄伟举了一个例子。

以智能音箱为例。跟声音相相关的部分,BOM 差不多在 100 快左右(看你用几个麦克风和什么芯片,基本上在 100 块左右)。有了这枚芯片,以我们主推方案为例,BOM 可以控制在 3 美金以内。就是说,以前 100 块钱做的事情,现在十几块人民币可以搞定。我们 3 美金方案做的事情是同价位通用方案的 40 倍。

UniOne : 全栈能力与平衡艺术

和已经呈现红海状态的图像和视频深度学习加速芯片领域不同,语音交互领域的芯片正处在上升期,目前玩家也比较少。

一个比较重要的原因在于,语音交互链条比较长,全栈打通的少。就此而言,这类芯片的设计,比图像和视频深度学习芯片更复杂。

云知声能将降噪、语音识别和语音合成结合到 UniOne ,离不开云知声修建的「高速公路」 Atlas,「你可以叫它云知声版本的 TensorFlow」 黄伟说。

公司将统计学习和深度学习的算法抽象出来,搭建出一个通用 ML 平台。在这条高速公路的帮助下,云知声衍生出语音识别、NLP、TTS 等技术。只需少数的人才即可完成全栈的能力,无需(实际上也不可能)为全链条的每个技能建造一支深度学习团队。

「包括我们的芯片也是从这衍生出来的。」黄伟介绍道,指令集(也是最为重要的部分)就是函数,我们将 Atlas 里面的深度学习的一些常规算法、函数硬件化了。由于 Atlas 是与硬件耦合在一起(这一点与TF不同)的,因此研发效率也高很多。云知声 CEO 黄伟讲述公司为什么可以在人数并不多的情况下做了这么多事情。全栈能力与研发效率固然是一方面,但是让李霄寒印象最为深刻的体验是:AI 芯片在保证高性能、高能效比的同时,兼顾灵活性和通用性。他认为,这是芯片设计中最难把握的事情之一。

「我们曾经追求过极致性能,也追求过极致功耗。但后来发现过了一定程度,超出你的需要之后,真心没那么重要。追求极致功耗很容易,但是你的成本会上来,技术挑战也会上来。」李霄寒说。

「风险加大。一旦你失败,意味着你这一年来白做了。」窗口期的时间成本,谁都浪费不起。

还有算法方面的平衡。比如,既要考虑到对算法要有一定的耦合性,这样才能最优化,又考虑到要降低它的耦合。

而且做智能家居,光有声音是不够的,未来还需要画面甚至执行能力(比如机器人)。 「我们这枚芯片还可以跑图像。」黄伟说,我们判断教育未来也应该是多模态的。

过去三年中,云知声花了很多时间在调研,而流片时间其实只有半年。

「其余时间都是利用各种工具在纸上推演。从当初许多选择,最后剩下一两个。」李霄寒说。云知声 IoT 事业部副总裁李霄寒

「如果三年前,现在这些芯片创业公司已经存在,你们会选择与他们合作吗?」笔者不禁好奇。

「不会」李霄寒坦言。因为无法确定有限时间里,是否可以做出芯片。不过,最关键的是「不知道最后适不适合我们。」

算法本身是在演进。「这需要芯片公司对算法有深刻的了解,而且对这个算法有一个比较强的抽象能力,你对他未来的演进是有足够的信心,你才去敢为这个东西为它不变的那部分去设计芯片。」李霄寒说。而这,正是很多芯片公司比较纠结的地方。芯片公司永远不知道哪个时间点算法会稳定下来。

所谓指令集,其实就是函数。对于算法公司来说,他们几乎不可能将核心算法的源代码开放给芯片公司。然而,ASIC 存在的目的就是让深度学习发挥最大威力,如果没有深度耦合,彼此不能开诚布公,这也就失去研发这枚芯片的真正意义。黄伟补充道。

公开资料显示,UniOne 功耗与性能的设计上,通过运算单元之间的可编程互联矩阵,在保证运算效率的同时,采用多级 - 多组 - 多端口的 Memory 架构以保证片内数据 带宽的提升及降低芯片功耗。

而在架构灵活性方面,通过 Scratch-Pad 将主控 CPU 与 AI 加速器内部 RAM 相连,提供高效的 CPU 与 AI 加速器之间的数据通道,以便 CPU 对 AI 加速器运算结果进行二次处理。

另外,连接各个运算单元的可编程互联矩阵架构,提供了扩展运算指令的功能,从而进一步提升硬件架构的灵活性及可扩展性。

此外,芯片架构方面的其余探索还包括多级多模式唤醒、从能量检测到人类声音检测到唤醒词检测、针对语音设备及使用场景的定制化 Power Domain 等技术,将芯片功耗降至最低。如果将镜头从语音交互公司身上离开,拉远至整个物联网领域的玩家,几乎所有的互联网巨头都进入到了视野。

今年 4 月,阿里高调进军物联网。作为电商和云计算巨头,阿里无疑具有成为中国版「Echo」的野心。

即将赴港 IPO 的小米也在说明书中表明所募资金的30%将用于 IoT(物联网)、生活消费产品及移动互联网服务(包括人工智能)等生态链建设。

陆奇空降百度后,DuerOS 就上升到了与 Apollo 一样的战略高度。目前,已经广泛赋能智能家居、可穿戴、车载和移动多个行业,并与小鱼在家、联想、美的的多家企业达成生态合作。

什么类型的公司会有更有胜算?是「从软到硬」的技术公司,还是「从硬到软」的玩家?还是互联网巨头?这枚 AI 芯片又能为「从软到硬」的公司赢得多大分量的胜算筹码?

「百度是先 DuerOS,然后通过投资和并购落地。我们是通过芯片模组植入设备来落地,然后同时去满足云端服务需求。」黄伟说,一个是自上而下,一个自下而上。

但是,端落地比云端复杂地多,也不具有很强的复制性,这可能不是巨头擅长的。巨头也要补足自己全栈上的短板。

不过有一点是肯定的,由于 AI 芯片的交叉学科性质,这里存在一定的技术纵深。

「一年前的技术领先可能被后来的人追赶上了,但是这个基础上,仍然有我们向前进的空间。」李霄寒说。

所以,对于创业公司也好,或者比较有实力技术公司也好,在一定时间之内,它们可以与后面的公司持续性地拉开距离,并保持这一优势。

而在黄伟看来,现阶段最重要的仍然是数据。

「假如我的芯片成本是 2 美金,给车厂卖 8 美金,6 美金里包含了我的利润,包含了软件部分。」他说,

「现阶段最重要的是让中国千万台车植入我们的芯片,所有的数据和服务内容都连接到我们的云端,这会是更大的价值。」

]]> 原文: https://ift.tt/2rs1xmi
RSS Feed

机器知心

IFTTT

13亿美元能催生下个DeepMind?这是英国最好的十家AI公司

曾几何时,大英帝国统治了世界四分之一的人口。当时有句流行语,「大英帝国的太阳从不落下」。时至今日,即使殖民和征服已经成为过去时,英国仍然是引领世界发展的重要力量,尤其是茶叶和烤饼。正如我们知道的那样,英国经济状况良好,以作为全球第五大经济体而自豪。你必须得承认,英国有一种实干的勇气让他们把有限的岛国资源成为转化为强大的竞争力。这不,我们看到英国刚刚加入到了人工智能的军备竞赛。在过去的四年里,法国在人工智能领域投资了 18 亿美元。与此同时,中国人正在全力押注人工智能,AI 芯片类的硬件公司和诸如计算机视觉类的技术公司数量都在大幅增加。为了赶上法国人和中国人,英国人积攒了 13 亿美元的多年期资金池来促进本土人工智能技术发展。DeepMind 就是其中之一,它是英国最好的人工智能创业公司之一,其在 2014 年被谷歌以 6 亿美元收购,所以英国本土还是有人才的。

我们使用了下 Crunchbase,总结出了一份名单,上面是迄今为止英国融资额最多的前十家人工智能公司。

用 AI 来贷款

名单的首位是英国的最新独角兽,OakNorth,这家三岁的金融科技公司搭建了 ACORN 人工智能平台,该平台为中小企业贷款提供数据驱动的决策支持。这家公司已经融到了令人惊讶的 4.485 亿美元,包括去年 11 月 1.25 亿美元的 B 轮融资,B 轮融资里公司的估值达到了 14 亿美元。据报道称,OakNorth 去年甚至达到了 1460 万美元的利润,放出去了 16.5 亿美元的贷款,是一年前的四倍。公司最近宣称今年会再增加 20 亿美元的贷款,且已经通过贷款增加了 4000 多个工作岗位和 55 亿美元的经济产出,促进了英国的经济发展。

它的旗舰产品 ACORN 是通过把各个行业成百上千的贷款数据整合来进行信用风险分析,听起来和其他 AI 类的科技金融创业公司一样。该平台能让贷款经理迅速成为一个行业的专家。而且,它还实时监控着同一行业的其他贷款,提供一个基准系统和早期预警系统来主动监测风险。OakNorth 也把 ACORN 授权给其他银行机构使用,这是另一个巨大的潜在收入来源。

用 AI 来研发新药另外一家英国独角兽,在四月份 1.15 亿美元的融资之后估值到了 20 亿美元。BenevolentAI 总的募集了 2.02 亿美元,这让它成为全世界最具价值的私人 AI 药物研发公司。它的算法能够利用 500 亿语境化的医学事实,来给出很多疑难杂症的病情诊断。这家公司宣称它的平台能减少早期药物研发阶段四年的时间。而且,平台在整个药物研发的过程中能够更加有效的工作,相较于制药行业平均水平,它减少了 60% 的成本。正如你想到的那样,那是并非是一个不重要的成本:在 Tufts 中心为药物研发研究而发布的一份最新报告中显示,研发一款市场认可的处方药成本在 26 亿美元左右。

BenevolentAI

该公司瞄准了一切疾病,从帕金森症到到黄斑退化引起的失明。今年的早些时候,BenevolentAI 也收购了剑桥一处药物研发设施来从事临床试验工作。

用 AI 维护网络安全

我们一年以前就深入研究过 Darktrace,不久之后,这家位于剑桥的网络安全公司完成了新一轮 7500 万美元的 D 轮融资,融资总额为 1.795 亿美元,其中有 SoftBank 这样的投资者。这家公司在 2013 年创建,创始人包括来自剑桥大学的学霸们和 Bond-esque MI5 等间谍机构的专家们。上一次的拜访之后,DarkTrace 一直发展的很好,不仅签下了两倍的业务合同,还又增加了 200 名雇员。

Darktrace

Darktrace 的灵感来自于人类的免疫系统。人类的免疫系统通过学习什么对人体是正常的来工作,然后识别并攻击那些不符合现状的一切事物。Darktrace 把这个逻辑运用到机器学习和 AI 算法上,让它们学习什么是对网络上的设备和用户来说正常的事物,不符合这个标准的事物则会被攻击。

用 AI 来制作芯片

这家 2016 年创建的公司完成最新一轮 8000 万美元的融资后达到了 1.1 亿美元的总融资额。红杉资本也在它出色的投资者名单中。Graphcore 处于一个竞争愈发激烈的 AI 处理器领域,但是它有一些有前景的硬件,比如它的 IPU (intelligence processing unit),公司宣称其 IPU 能大大提高机器学习处理任务的效率,相较于市场上的其他产品能提高 10 倍到 100 倍之多。据报道称,一项测试表明,8 个 IPU 芯片训练一个模型的时间和 128 个 GPU 的相当。小心了,Nvidia!

用 AI 来旅行

这家公司从 2016 年之后就再也没有融资过,它的融资总额为 9900 万美元。然而,去年这家公司发布了一个 AR 旅行应用,它通过所谓的市区视觉定位给使用者在全球 300 多个城市进行导航。

它用计算机视觉来提供超过两倍以上的位置精确度,而且移动设备指到哪,它就会提供街区和建筑的 3D 图像,方向和名字等等。以后串酒馆再也不会迷路了。

用 AI 来保持健康

位于伦敦的 Babylon 创建于 2013 年,它是一家医疗应用公司,强大的 AI 对话机器人是它的业务之一。这家公司刚募集了 8500 万美元的资金,从那时起,它就开始和中国的腾讯合作,腾讯想把它的医疗 AI 对话机器人引进自己的体系里。那很可能意味着,十亿中国人将很快能从腾讯的社交平台微信上使用到这个 APP。

用 AI 来定制位于伦敦的 Qubit 创建于 2010 年,已经募集了 7500 万美金,其中包括 GoldmanSachs,Accel Partners 和 Salesforce 等重磅投资者。Qubit 做的其实和量子计算一点关系也没有,它是一家通过机器学习让更多客户从网上购买衬衫的公司,是关于个性化和定制化的公司。Qubit 服务包括零售,旅游和电子游戏在内的多个领域。它的机器学习平台筛选数据并找出和其他人相比花钱不够多的顾客。

Qubit

Qubit 的客户能够从这些分析里找到可以提供定制化服务的顾客来增加未来收入。Qubit 宣称使用它的平台后每位顾客能为企业带来 14 倍之多的收入。

用 AI 来发声

位于布里斯托尔的 XMOS 在 2005 年创建,共募集了 7240 万美元,它瞄准的是物联网市场,意在推广其语音交互硬件,它之前还孵化出了 Graphcore。这家公司是收购了一家叫做 Setem 的美国小型创业公司之后才有的 AI 能力,Setem 曾经通过研发噪音环境下识别不同语音的技术和算法解决了「鸡尾酒会问题」。XMOS 的一些语音识别硬件

那项突破让这家公司有了能给亚马逊 Alexa 语音服务提供开发套件的能力。也就是说 Alexa 不用再放在房间的靠前或者中间的位置,它也能听到你说的一切。

用 AI 来识别身份位于伦敦的 Onfido 创建于 2012 年,已经募集了大约 6000 万美元,Salesforce 也是它的投资者。Onfido 使用机器学习来识别生物特征从而验证一个人的身份,所以它必须有一些不错的计算机视觉算法。Onfido 的机器学习技术可以自动检测来自大约 200 个国家的 600 多份文件,全球范围内有大约 1500 名消费者。

用 AI 来登陆

位于伦敦的 Callsigh 创建于 2012 年,已经从 Accel Partners 和 Qualcomm 那里融到了 3880 万美元。该公司开发了一种智能认证系统。

]]> 原文: https://ift.tt/2I1EaHf
RSS Feed

机器知心

IFTTT

你好,人口贩卖的算法侦查员

即便是在今天,「奴役」仍然在以不同的形式出现。人被当作物品直接买卖很罕见,但通过欺骗、胁迫或暴力威胁等手段强迫他人在异国他乡从事体力劳动和性奴役却经常发生。

避免和解决这种隐藏在社会阴暗面问题的麻烦之处在于,奴役事件很难被监测到,受害者也不愿意谈,劳动力市场上工作的人很多都是自愿工作,而且工作也是合法的,很难区分哪些是被奴役,哪些是自愿工作。

不过,高科技侦查手段,正改变这一局面。

新手段正改变现状

在东南亚,一个典型的危害就是渔船工们被迫进行劳作。船员们根本无法逃脱,因为船只从不靠岸,他们在海上获得补给,捕捞的东西也是从海上卸下来。曼谷 MAST 慈善机构联合创始人 Dornnapha Sukkree ,想开发一种数据分析软件来停止这种现象,数据来自安装在船只上的无线收发器,无线收发器会通过卫星来追踪船只的移动,把那些经常不靠岸的船只会标记出来。

有十只渔船在帮助 Sukkree 进行研究。如果研究取得成功,她想说服泰国渔业当局要求所有超过一定吨位的船只安装无线收发器。很多国家都有这类政策,只是多数用于管理渔业而非保护船员。非法渔民为了「消失」,有时候会把他们的无线收发器关掉,但是这种行为恰好增加了嫌疑。

不同于劳工胁迫,人口贩卖依赖于合同替换的欺诈行为。一些雇主会通过高报酬诱骗境外人士,然后再对合同的措辞进行修改,有时候这些合同会用劳工根本看不懂的语言书写。

前美国国务院反人口贩卖部门主管的 Luis CdeBaca,在加入开放社会基金会( Open Society Foundations )之后,在尝试用区块链分布式数据库来遏制这种诱骗行径。政府会在劳动合同被区块链确认之后,才发放那些本为未来移民而准备的工作签证。

软件还能识别「皮条客」。纽约大学的 Damon McCoy 开发了一个程序,帮警察找出了加利福尼亚和德克萨斯五个大型涉嫌卖淫团伙。这个程序搜索诸如用词、标点和表情等符号,这些符号可以揭示出在线色情广告幕后黑手——他们看似没有关联但却正进行着有组织犯罪活动,比如它还能链接上为这些广告量身定做的比特币支付。他计划今年晚些时候发布这个程序并免费提供下载,下一个版本还会监测图片像素的细小变化,可以用来识别用同一个相机拍摄的照片。

连点成线

McCoy 的程序并不是美国唯一一个被用来打击性交易行为的软件。

2017 年 6 月以来,一个未透漏名称的联邦机构已经开始使用类似软件,它是由位于匹兹堡卡耐基梅隆大学研究者 Eduard Hovy 开发的。像 McCoy 的产品一样,这个程序寻找不同色情广告所使用的文字和图片之间的联系。但是,Hovy 称,它也会搜集到其他渠道的数据。举个例子,它会把推特、网络社区等渠道的内容进行关联分析,像是推特上有关夜晚某个特殊建筑内的尖叫声和网上「约翰板」里讨论上次见过一个外国女人满身淤青的话题。

通过不断完善,未来这类软件能把不同类型的「现代奴役」关联信息整合到一起——例如,苦于背部疼痛的草莓采摘工去往专为穷人设立的医疗诊所的次数。但Hovy 警告称,不能单单凭借软件就推断谁是人口贩卖的嫌疑犯。他曾经和警察一起去解救过那些软件程序所标记出的人群,但这群人辩称他们是自愿在艰苦条件下工作的,他们宁愿受苦也不想呆在家里闲着。

不管合不合法,「现代奴役」的目的是为了谋取利益,而获得的钱财总得存在某个地方,这也给调查者提供了一个线索途径。在一些国家,银行如果不对疑似人口贩卖的交易进行筛查将会面临严重罚款。因此,一些银行会使用自主研发的软件来监测洗钱。算法会对杂乱无章的交易进行标记,然后分析员根据这些被标记的交易撰写「可疑行为报告」。

「美国财政部越来越频繁地收到来自于银行的相关报告」,国土安全局调查部人口贩卖调查员 Hector Colon 说,调查部是国土安全局的一个下属部门。

具有人口贩卖嫌疑活动的指纹数量和种类都很多。深夜多次给汽车加油的付费行为,可能意味着强制劳动力正在夜幕的掩护下被运走;每周的避孕套购买行为也会增加嫌疑;过高的鸡尾酒收费可能是对卖淫行为的支付,尤其是如果这家酒吧还在三陪网站上买了广告位……「从各家银行发到加拿大财政部的可疑交易报告中有大约二十分之一提到人口贩卖,其中的一半被确认为犯罪。」 Peter Warrack 说道,他是一名加拿大的监测软件专家。

人口贩卖者知道正在发生什么,并且尽最大努力去瞒过算法。其中一个可以轻易避免的就是,给单一账户支付时要在不同地方开收据。但是监管者也在进步。根据列支敦士登金融智库 Daniel Thelesklaf 的说法,政府已经在考虑监测即时通讯应用上的收发信息来寻找人口贩卖的踪迹。「如果是通过 Wi-Fi 来收发信息,这些信息有时是可以被拦截的。」Thelesklaf 说,「这块具有巨大潜力。」

当然,这招也面临巨大争议。监测色情广告是一回事,网罗大部分无辜群众的收发信息就是另外一回事了。讽刺的是,「1984」代表着一个监视无处不在的社会,除了监视者,此外每一个人,实际上,都是奴隶。 

文章来源:https://www.economist.com/news/science-and-technology/21741539-and-also-other-unsavoury-forms-human-bondage-software-detects-human

]]> 原文: https://ift.tt/2jGzvQw
RSS Feed

机器知心

IFTTT

M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」-InfoQ每周精要No.900

「每周精要」 NO. 900 2025/11/01 头条 HEADLINE M2 模型杀回 Coding 和 Agent 领域,MiniMax 想要「普惠智能」 精选 SELECTED a16z 将 3000 万开发者标价 3 万亿 网友:几个初创公司 + 大模型就...