2018年5月5日星期六

优于MobileNet、YOLOv2:移动设备上的实时目标检测系统Pelee

已有的在移动设备上执行的深度学习模型例如 MobileNet、 ShuffleNet 等都严重依赖于在深度上可分离的卷积运算,而缺乏有效的实现。在本文中,来自加拿大西安大略大学的研究者提出了称为 PeleeNet 的有效架构,它没有使用传统的卷积来实现。PeleeNet 实现了比目前最先进的 MobileNet 更高的图像分类准确率,并降低了计算成本。研究者进一步开发了实时目标检测系统 Pelee,以更低的成本超越了 YOLOv2 的目标检测性能,并能流畅地在 iPhone6s、iPhone8 上运行。

在具有严格的内存和计算预算的条件下运行高质量的 CNN 模型变得越来越吸引人。近年来人们已经提出了很多创新的网络,例如 MobileNets (Howard et al.(2017))、ShuffleNet (Zhang et al.(2017)),以及 ShuffleNet (Zhang et al.(2017))。然而,这些架构严重依赖于在深度上可分离的卷积运算 (Szegedy 等 (2015)),而这些卷积运算缺乏高效的实现。同时,将高效模型和快速目标检测结合起来的研究也很少 (Huang 等 (2016b))。本研究尝试探索可以用于图像分类和目标检测任务的高效 CNN 结构。本文的主要贡献如下:

研究者提出了 DenseNet (Huang et al. (2016a)) 的一个变体,它被称作 PeleeNet,专门用于移动设备。PeleeNet 遵循 DenseNet 的创新连接模式和一些关键设计原则。它也被设计来满足严格的内存和计算预算。在 Stanford Dogs (Khosla et al. (2011)) 数据集上的实验结果表明:PeleeNet 的准确率要比 DenseNet 的原始结构高 5.05%,比 MobileNet (Howard et al. (2017)) 高 6.53%。PeleeNet 在 ImageNet ILSVRC 2012 (Deng et al. (2009)) 上也有极具竞争力的结果。PeleeNet 的 top-1 准确率要比 MobileNet 高 0.6%。需要指出的是,PeleeNet 的模型大小是 MobileNet 的 66%。PeleeNet 的一些关键特点如下:

 两路稠密层:受 GoogLeNet (Szegedy et al. (2015)) 的两路稠密层的激发,研究者使用了一个两路密集层来得到不同尺度的感受野。其中一路使用一个 3×3 的较小卷积核,它能够较好地捕捉小尺度的目标。另一路使用两个 3×3 的卷积核来学习大尺度目标的视觉特征。该结构如图 1.a 所示:

图 1: 两路密集层和 stem 块的结构

瓶颈层通道的动态数量:另一个亮点就是瓶颈层通道数目会随着输入维度的变化而变化,以保证输出通道的数目不会超过输出通道。与原始的 DenseNet 结构相比,实验表明这种方法在节省 28.5% 的计算资源的同时仅仅会对准确率有很小的影响。

没有压缩的转换层:实验表明,DenseNet 提出的压缩因子会损坏特征表达,PeleeNet 在转换层中也维持了与输入通道相同的输出通道数目。

复合函数:为了提升实际的速度,采用后激活的传统智慧(Convolution - Batch Normalization (Ioffe & Szegedy (2015)) - Relu))作为我们的复合函数,而不是 DenseNet 中所用的预激活。对于后激活而言,所有的批正则化层可以在推理阶段与卷积层相结合,这可以很好地加快速度。为了补偿这种变化给准确率带来的不良影响,研究者使用一个浅层的、较宽的网络结构。在最后一个密集块之后还增加了一个 1×1 的卷积层,以得到更强的表征能力。

研究者优化了单样本多边框检测器(Single Shot MultiBox Detector,SSD)的网络结构,以加速并将其与 PeleeNet 相结合。该系统,也就是 Pelee,在 PASCAL VOC (Everingham et al. (2010)) 2007 数据集上达到了 76.4% 的准确率,在 COCO 数据集上达到了 22.4% 的准确率。在准确率、速度和模型大小方面,Pelee 系统都优于 YOLOv2 (Redmon & Farhadi (2016))。为了平衡速度和准确率所做的增强设置如下:

特征图选择:以不同于原始 SSD 的方式构建目标检测网络,原始 SSD 仔细地选择了 5 个尺度的特征图 (19 x 19、10 x 10、5 x 5、3 x 3、1 x 1)。为了减少计算成本,没有使用 38×38 的特征图。

残差预测块:遵循 Lee 等人提出的设计思想(2017),即:使特征沿着特征提取网络传递。对于每一个用于检测的特征图,在实施预测之前构建了一个残差 (He et al. (2016)) 块(ResBlock)。ResBlock 的结构如图 2 所示:

图 2:残差预测块

用于预测的小型卷积核:残差预测块让我们应用 1×1 的卷积核来预测类别分数和边界框设置成为可能。实验表明:使用 1×1 卷积核的模型的准确率和使用 3×3 的卷积核所达到的准确率几乎相同。然而,1x1 的核将计算成本减少了 21.5%。

研究者在 iOS 上提供了 SSD 算法的实现。他们已经成功地将 SSD 移植到了 iOS 上,并且提供了优化的代码实现。该系统在 iPhone 6s 上以 17.1 FPS 的速度运行,在 iPhone8 上以 23.6 FPS 的速度运行。在 iPhone 6s(2015 年发布的手机)上的速度要比在 Intel i7-6700K@4.00GHz CPU 上的官方算法实现还要快 2.6 倍。

论文:Pelee: A Real-Time Object Detection System on Mobile Devices

论文链接:https://arxiv.org/pdf/1804.06882.pdf

摘要:在具有有限的计算力和内存资源的移动设备上运行卷积神经网络模型的与日俱增的需求激励着高效模型设计的研究。近年来已经出现了很多高效的结构,例如 MobileNet、 ShuffleNet 和 NASNet-A。然而,所有的这些模型都严重依赖于在深度上可分离的卷积运算,这些运算在绝大多数深度学习框架中都缺乏有效的实现。在本论文的研究中,我们提出了一个叫做 PeleeNet 的有效结构,它没有使用传统的卷积来实现。在 ImageNet ILSVRC 2012 数据集上,PeleeNet 实现了比目前最先进的 MobileNet 高 0.6% 的准确率 (71.3% vs. 70.7%),并且将计算成本降低了 11%。然后,我们通过将单样本多边框检测器(Single Shot MultiBox Detector,SSD)方法与 PeleeNet 相结合,并为了加速而进行结构优化,提出了一个实时目标检测系统。我们的实时系统 Pelee 在 PASCAL VOC2007 数据集上达到了 76.4% 的 mAP(平均准确率),在 COCO 数据集上达到了 22.4 的 mAP,在 iPhone 6s 上的运行速度是 17.1 FPS,在 iPhone 8 上的运行速度是 23.6 FPS。在 COCO 数据集上的结果以更高的准确率、13.6 倍的计算资源节省以及小 11.3 倍模型大小优于 YOLOv2。

表 1:PeleeNet 架构概览

表 2: 不同的设计选择的效果得到的性能

表 3: 在 Stanford Dogs 数据集上的结果。MACs:乘法累加的次数,用于度量融合乘法和加法运算次数

表 4:在 ImageNet ILSVRC 2012 数据集上的结果

表 5: 不同设计选择上的性能结果

表 6:在 PASCAL VOC 2007 数据集上的结果。数据:07+12,VOC2007 和 VOC2012 联合训练;07+12+COCO,先在 COOC 数据集上训练 35000 次,然后在 07+12 上继续微调。

表 7: 实际设备上的速度

表 8: COCO test-dev2015 数据集上的结果

]]> 原文: https://ift.tt/2HRzrM8
RSS Feed

机器知心

IFTTT

对不起,抓错人了。

李杉 岳排槐 编译整理量子位 出品 | 公众号 QbitAI

过去十四年来,每当夏季结束,威尔士南部的波斯考尔(Porthcawl),都会一改往日的宁静,被狂欢者"入侵"。

3.5万名猫王的粉丝,会一起涌入这个只有1.6万居民的小城。他们大都梳着大背头,戴着超大号太阳镜,穿着一身白衣。

但2017年的猫王音乐节,与往年有些不同。

警方首次在这一活动期间,利用自动的人脸识别技术追踪嫌犯。摄像头扫过打扮相似的汹涌人流后,发现了17位疑似通缉犯。最终,10位抓捕准确,剩下7位属于误判。

10:7,这已经是个佳绩。

去年6月以来,南威尔士警方一直在测试自动人脸识别系统,然而在多数情况下,人脸识别系统识别嫌疑犯的错误率都高于正确率。

这不是信口胡说,警方把这套系统的工作成绩,也就是识别正确和错误的情况,通过互联网进行了公开披露。

例如,在去年6月的欧冠联赛最后一轮比赛中,当人脸识别相机首次应用时,系统发出了2470次警报。其中有2297次错误,173次正确——错误率高达92%

警方发言人认为问题出在数据库中的图片品质太低,而且这也是该系统首次正式使用。

在Anthony Joshua和Kubrat Pulev于2017年10月进行的拳击比赛中(威尔士警方在那个月改进了系统算法),正确识别5人,错误识别46人,错误率高达90%

在威尔士与澳大利亚的橄榄球比赛中,正确识别6人,错误识别42人。误报率87.5%

在哈里王子和梅根·马克尔(Meghan Markle)2018年1月访问卡迪夫时,南威尔士警方的自动人脸识别系统并未提示任何警报。

上面这张图,就是南威尔士警方人脸识别系统的战绩。

"错误率高得令人失望。"曾经研究过警方识别技术的诺森比亚大学法医学教授Martin Evison说,"识别错误,会把一个完全无辜的人变成嫌疑犯。"他还表示,现实世界中的面部识别,与实验室中的效果往往差异很大。

警方使用的系统需要被仔细调整以提高精度。这些设备不应该产生太多不必要的错误。"如果想抓住更多的嫌疑人,必须设置足够低的门槛,以防漏网之鱼,"他说"但这样又会产生更多的匹配错误。"Evison说。

"没有任何系统能100%准确,"南威尔士警方表示,自从使用这套系统以来,已经抓获了450名嫌犯,其中有一名抢劫犯被判6年监禁,一名入室盗窃犯被判刑4年半。

测试人脸识别

利用自动化系统来扫描公共场所的人脸并匹配数据库的技术,在英国还处于发展初期。而在中国,这套系统却要先进得多。

在一部BBC拍摄的短片中,参与测试的记者,短短的7分钟后,行踪就被摄像头捕捉到。而据此前的报道,中国警方还利用这套系统在一场张学友的演唱会上找到一名嫌疑人,随后将其抓获。

人脸识别给警方带来的好处显而易见。威尔士警方希望利用这套系统来发现和阻止犯罪活动。"对警方来说,能把找到嫌犯的时间缩短到几分钟甚至几秒钟。"考文垂大学研究员Alexeis Garcia-Perez说,"这样就能尽可能减少错误逮捕的次数,还有其他一些在公众看来不太好的问题。"

南威尔士警方在对科技进行隐私评估的过程中表示,这种技术"非常先进",无需人类协助。

该系统由两个接入笔记本或服务器的摄像头构成。这些摄像头的内容都会被录制下来,然后从脚本中提取人脸,自动与关注名单进行匹配。这份名单构成了一个数据库,其中可能包含成千上万张人脸图片。

"关注名单和相关的元数据会被手动添加到系统中,然后会定期进行评估,确保精确度和及时性,而且会在相应的行动结束后才能删除。"南威尔士警方在隐私评估中说。

警方表示,未来有可能将人脸识别技术与其他来源的数据库进行整合。该公司表示,拥有1900多万张图片的警察国家数据库、自动车牌识别数据库、护照和驾照信息都会添加到系统中。

每次系统发出警报时,警方都会核查准确与否,以及决定是否派出机动队。警队只有在确认匹配正确时才会触动。

"机动队执行任务时,会先派警员跟嫌疑人接触,"警方发言人表示,"这名警员会迅速核实嫌疑人到底是不是要找的目标。"

应用这一技术之后,南威尔士已经有过多次逮捕行动。今年1月,报告称警方因此发起了50次指控,进行了12次抓捕行动。

2月,一位用过这套系统的警员发了条推特:"英国警察已经完全不同!主动识别系统一个月前通过夜店的监视系统发现嫌犯,并为今天的抓捕行动提供了准确的定位。"

当然是用这套系统会引发担忧。来自警方自己的评估报告也显示,这套系统会让人们担心自己的隐私被侵犯。

法律基础

英国警方不止在南威尔士使用人脸识别系统。

2015年,莱斯特郡警方就在著名的下载音乐节(Download Festival)尝试了面部识别技术,那次活动有9万人参加,但没有发现任何罪犯。

2017年11月,伦敦警方在诺丁山狂欢节,以及一战阵亡将士纪念碑举行的纪念活动中,分别使用了人脸识别系统。

在伦敦警方最近一次因这套系统误抓嫌犯后,人权组织Liberty抗议说使用这套系统没有"法律基础"。另一个维权团体Big Brother Watch指出,议会从未审查过这一技术在公共场所使用的情况。

警方在公共活动中使用的人脸识别系统,与警方通过社交媒体上的照片或者闭路监控视频进行面部对比的系统,是相互独立的两套。

2012年,英国高等法院裁定,警方存储数百万非嫌疑人的照片是非法的。目前,只有当一个人向警方投诉时,他的照片才会被删除。

"如果这套系统能合理合法高效的运行,公众会更乐于接受,但目前离大家的期望还有一些差距,"Porter说。

Evison表示,使用面部识别系统时,应该有更多的考虑。他更期待这套系统能更有效地应对足球暴力,以及摇滚音乐会期间的团伙抢劫。

但专家警告称,南威尔士警方和其他机构使用的系统并未受到太多监管,而且对具体运作模式缺乏透明度。关于他们的准确度也存在疑问。

"这些数据表明实时人脸识别不仅对公民自由构成威胁,而且会成为极其不准确的执法工具。"公民权利组织Big Brother Watch负责人Silkie Carlo说。

该组织计划在本月晚些时候针对英国议会展开一项反对人脸识别技术的宣传活动。"南威尔士的统计显示,这项技术错误识别无辜群众的比例高得惊人,但真正能够支持警方的情况却很少见。"Carlo说。

编译来源:https://ift.tt/2IhxKXS

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2wcRc32
RSS Feed

RSS5

IFTTT

对不起,抓错人了。

李杉 岳排槐 编译整理量子位 出品 | 公众号 QbitAI

过去十四年来,每当夏季结束,威尔士南部的波斯考尔(Porthcawl),都会一改往日的宁静,被狂欢者"入侵"。

3.5万名猫王的粉丝,会一起涌入这个只有1.6万居民的小城。他们大都梳着大背头,戴着超大号太阳镜,穿着一身白衣。

但2017年的猫王音乐节,与往年有些不同。

警方首次在这一活动期间,利用自动的人脸识别技术追踪嫌犯。摄像头扫过打扮相似的汹涌人流后,发现了17位疑似通缉犯。最终,10位抓捕准确,剩下7位属于误判。

10:7,这已经是个佳绩。

去年6月以来,南威尔士警方一直在测试自动人脸识别系统,然而在多数情况下,人脸识别系统识别嫌疑犯的错误率都高于正确率。

这不是信口胡说,警方把这套系统的工作成绩,也就是识别正确和错误的情况,通过互联网进行了公开披露。

例如,在去年6月的欧冠联赛最后一轮比赛中,当人脸识别相机首次应用时,系统发出了2470次警报。其中有2297次错误,173次正确——错误率高达92%

警方发言人认为问题出在数据库中的图片品质太低,而且这也是该系统首次正式使用。

在Anthony Joshua和Kubrat Pulev于2017年10月进行的拳击比赛中(威尔士警方在那个月改进了系统算法),正确识别5人,错误识别46人,错误率高达90%

在威尔士与澳大利亚的橄榄球比赛中,正确识别6人,错误识别42人。误报率87.5%

在哈里王子和梅根·马克尔(Meghan Markle)2018年1月访问卡迪夫时,南威尔士警方的自动人脸识别系统并未提示任何警报。

上面这张图,就是南威尔士警方人脸识别系统的战绩。

"错误率高得令人失望。"曾经研究过警方识别技术的诺森比亚大学法医学教授Martin Evison说,"识别错误,会把一个完全无辜的人变成嫌疑犯。"他还表示,现实世界中的面部识别,与实验室中的效果往往差异很大。

警方使用的系统需要被仔细调整以提高精度。这些设备不应该产生太多不必要的错误。"如果想抓住更多的嫌疑人,必须设置足够低的门槛,以防漏网之鱼,"他说"但这样又会产生更多的匹配错误。"Evison说。

"没有任何系统能100%准确,"南威尔士警方表示,自从使用这套系统以来,已经抓获了450名嫌犯,其中有一名抢劫犯被判6年监禁,一名入室盗窃犯被判刑4年半。

测试人脸识别

利用自动化系统来扫描公共场所的人脸并匹配数据库的技术,在英国还处于发展初期。而在中国,这套系统却要先进得多。

在一部BBC拍摄的短片中,参与测试的记者,短短的7分钟后,行踪就被摄像头捕捉到。而据此前的报道,中国警方还利用这套系统在一场张学友的演唱会上找到一名嫌疑人,随后将其抓获。

人脸识别给警方带来的好处显而易见。威尔士警方希望利用这套系统来发现和阻止犯罪活动。"对警方来说,能把找到嫌犯的时间缩短到几分钟甚至几秒钟。"考文垂大学研究员Alexeis Garcia-Perez说,"这样就能尽可能减少错误逮捕的次数,还有其他一些在公众看来不太好的问题。"

南威尔士警方在对科技进行隐私评估的过程中表示,这种技术"非常先进",无需人类协助。

该系统由两个接入笔记本或服务器的摄像头构成。这些摄像头的内容都会被录制下来,然后从脚本中提取人脸,自动与关注名单进行匹配。这份名单构成了一个数据库,其中可能包含成千上万张人脸图片。

"关注名单和相关的元数据会被手动添加到系统中,然后会定期进行评估,确保精确度和及时性,而且会在相应的行动结束后才能删除。"南威尔士警方在隐私评估中说。

警方表示,未来有可能将人脸识别技术与其他来源的数据库进行整合。该公司表示,拥有1900多万张图片的警察国家数据库、自动车牌识别数据库、护照和驾照信息都会添加到系统中。

每次系统发出警报时,警方都会核查准确与否,以及决定是否派出机动队。警队只有在确认匹配正确时才会触动。

"机动队执行任务时,会先派警员跟嫌疑人接触,"警方发言人表示,"这名警员会迅速核实嫌疑人到底是不是要找的目标。"

应用这一技术之后,南威尔士已经有过多次逮捕行动。今年1月,报告称警方因此发起了50次指控,进行了12次抓捕行动。

2月,一位用过这套系统的警员发了条推特:"英国警察已经完全不同!主动识别系统一个月前通过夜店的监视系统发现嫌犯,并为今天的抓捕行动提供了准确的定位。"

当然是用这套系统会引发担忧。来自警方自己的评估报告也显示,这套系统会让人们担心自己的隐私被侵犯。

法律基础

英国警方不止在南威尔士使用人脸识别系统。

2015年,莱斯特郡警方就在著名的下载音乐节(Download Festival)尝试了面部识别技术,那次活动有9万人参加,但没有发现任何罪犯。

2017年11月,伦敦警方在诺丁山狂欢节,以及一战阵亡将士纪念碑举行的纪念活动中,分别使用了人脸识别系统。

在伦敦警方最近一次因这套系统误抓嫌犯后,人权组织Liberty抗议说使用这套系统没有"法律基础"。另一个维权团体Big Brother Watch指出,议会从未审查过这一技术在公共场所使用的情况。

警方在公共活动中使用的人脸识别系统,与警方通过社交媒体上的照片或者闭路监控视频进行面部对比的系统,是相互独立的两套。

2012年,英国高等法院裁定,警方存储数百万非嫌疑人的照片是非法的。目前,只有当一个人向警方投诉时,他的照片才会被删除。

"如果这套系统能合理合法高效的运行,公众会更乐于接受,但目前离大家的期望还有一些差距,"Porter说。

Evison表示,使用面部识别系统时,应该有更多的考虑。他更期待这套系统能更有效地应对足球暴力,以及摇滚音乐会期间的团伙抢劫。

但专家警告称,南威尔士警方和其他机构使用的系统并未受到太多监管,而且对具体运作模式缺乏透明度。关于他们的准确度也存在疑问。

"这些数据表明实时人脸识别不仅对公民自由构成威胁,而且会成为极其不准确的执法工具。"公民权利组织Big Brother Watch负责人Silkie Carlo说。

该组织计划在本月晚些时候针对英国议会展开一项反对人脸识别技术的宣传活动。"南威尔士的统计显示,这项技术错误识别无辜群众的比例高得惊人,但真正能够支持警方的情况却很少见。"Carlo说。

编译来源:https://ift.tt/2IhxKXS

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2wcRc32
RSS Feed

RSS5

IFTTT

新工科产学研联盟深度学习师资培训班正式启动,百度PaddlePaddle助力青年教师开展相关课程教学

为贯彻落实《国务院办公厅关于深化高等学校创新创业教育改革的实施意见》,深化产教融合、产学合作、协同育人工作,5月5日,由教育部、工业和信息化部指导,信息技术新工科产学研联盟人工智能协同育人工作委员会、教师培训工作委员会联合主办,百度、北京航空航天大学联合承办的"新工科产学研联盟深度学习师资培训班"正式开讲。教育部高教司理工处处长吴爱华,北航党委副书记程基伟,联盟副理事长、北航计算机学院吕卫锋教授,百度AI技术生态部总经理喻友平,百度校园品牌部总监李轩涯等出席了启动仪式。

新工科产学研联盟深度学习师资培训班嘉宾、学员合影

本次培训属于教育部高等教育司公布的2018年首批重点产学合作协同育人项目,致力于打造深度学习"国家队",为国内高校输送深度学习教育人才。在启动仪式上,吴爱华处长发表了讲话,他提到:"2017年,为主动应对新一轮科技革命和产业变革挑战,支撑服务国家重大战略实施,教育部启动'新工科'建设,面向未来发展和当前产业急需加快布局工科人才培养。新工科统筹考虑'新的工科专业、工科的新要求',更加注重产业需求导向、跨界交叉融合以及支撑引领,改造升级传统工科专业,发展新兴工科专业,主动布局未来战略必争领域人才培养。" 

吴爱华处长发表讲话

教育部新工科建设也对师资队伍提出了新的要求。2018年,新工科建设将实施"十百万"计划:面向人工智能、大数据、云计算、区块链、智能制造、机器人、集成电路、网络空间安全等新兴领域推出10种新兴领域专业课程体系,建设100门新工科课程资源库与在线开放课程,培训至少1万名工科教师。针对本次深度学习师资培训班,吴爱华处长指出:"本次培训是2018年新工科联盟的首个师资培训,我们通过校企合作,加强了课程培训的内容,落实到教师教学能力的提升。此次培训为校企合作模式提供了新的思路,树立了产学研融合典范。"

此前,教育部印发了《高等学校人工智能创新行动计划》,要求全面提升高校人工智能领域人才培养、科学研究、社会服务、文化传承创新、国际交流合作的能力,推动人工智能学科建设、人才培养、理论创新、技术突破和应用示范全方位发展,为我国构筑人工智能发展先发优势和建设教育强国、科技强国、智能社会提供战略支撑,明确了我国人工智能人才培养的总体思路。高校,是人工智能人才的发源地,高校人工智能学科人才培养与学科建设,将直接决定着未来中国在人工智能领域的竞争力。对此,程基伟副书记在现场表示,"高校人工智能学科建设亟待完善,本次深度学习师资培训班就是要把学界最优秀的老师和业界最前沿的科技联系起来,促进产学研融合,完善校企合作模式,在政府部门的支持下,通过学校和企业的力量推动人工智能人才培养与学科建设。"

程基伟副书记代表北航发言

"我们人工智能协同育人工委会将在联盟的指导下助力高校实现这些目标",作为百度公司代表,喻友平在现场介绍,"除了一系列的师资培训计划,我们还将在教材编写、在线课程设置、人工智能赛事等方面推进产学研融合与协同育人的工作,百度也会提供包括百度云资源、深度学习课程套装等支持。"

百度AI技术生态部总经理喻友平介绍培训初衷

作为国内唯一的深度学习开源平台,百度PaddlePaddle平台将为培训提供技术支持。PaddlePaddle是一个并行分布式的深度学习框架,兼备易用性、高效性、灵活性、可拓展性,是最适合中国开发者的深度学习框架,在应对大规模数据训练需求上表现出色。在本次师资培训中,参训教师可以深入浅出地了解深度学习行业趋势、深度学习框架原理和模型、并从经典网络的原理到高校自然基金深度学习应用、个性化推荐系统等工业实战、科技前沿的案例进行系统的学习。除此之外,教师们还能结合产业应用在课堂进行上机实验和案例实操,得到深度学习理论知识和实践能力的全方位提升,同时百度也将助力青年教师在高校中开展基于PaddlePaddle平台的深度学习相关课程的教学工作。

现场参与培训教师

据悉,本次参训的教师将获得 2018(第一批)教育部产学合作协同育人项目优先支持,获得信息技术新工科产学研联盟师资培训认证证书,并成为信息技术新工科产学研联盟人工智能协同育人工委会第一批种子成员,优先参与工委会后续举办的其他活动。未来,工委会也将与百度及各大高校保持密切联系,定期开设相关培训课程,并寻求进一步参与高校人工智能学科建设的契机,推动产学研融合不断深化。

]]> 原文: https://ift.tt/2IfZZ9r
RSS Feed

机器知心

IFTTT

Waymo无人车在亚利桑那州卷入交通事故,自动驾驶的安全性问题再次摆上台面

当地时间 5 月 4 日下午,一辆 Waymo 的自动驾驶小型货车在亚利桑那州的钱德勒市发生车祸。

这一事故的出现让人们不得不再次把自动驾驶技术的安全性问题重新摆上桌面,要知道,Uber 在 7 周前撞死行人的事件已经让这项技术的声誉受到一定程度的损伤。

钱德勒市警方报告,目前事故仅造成人员轻伤。

根据一份警方声明,一辆本田轿车向东行驶,在经过一个交叉路口时,为了避免撞上一辆向北行驶的汽车,突然转向Waymo 的克莱斯勒 Pacifica 小型货车所处的西行车道。本田撞上了 Waymo 汽车的同时,也撞伤了车上的女性安全驾驶员。

警方表示,事故发生时车辆正处于自动驾驶模式,没有超过 45 英里的限速。 Waymo 没有立即回复记者的置评请求。

当地新闻台的照片显示,Waymo 汽车被撞到了人行道上,前面的左保险杠和车轮受到严重损坏。本田的整个正面和前车门已被撞毁,其安全气囊似乎已经展开。

Waymo 车辆的摄像头视频将有助于确认当时的具体状况,但根据初步证据,警方表示责任不在于 Waymo。

「这辆车在错误的时间出现在了错误的地点,」钱德勒市警察局发言人 Seth Tyler 说道,「 Waymo 和车上的司机不会被传唤,因为他们没有做错任何事。」

不过,现在下定论还为时尚早。

当 Uber 的自动驾驶车辆在坦佩撞死行人时,警察也曾告诉记者,车祸可能是不可避免的。但一周后公布的视频则显示了相反的情况:Uber 的安全驾驶员在事故发生之前并没有看路。有自动驾驶领域专家表示,Uber 的自动驾驶技术本应该发现到行人,而且有足够的时间来踩刹车或者转向避开行人。

在 Uber 的事故发生之后,Waymo 公司 CEO John Krafcik 曾表示他团队的技术会做得更好。

「我们非常有信心 Waymo 的汽车可以处理这种情况,」他在接受媒体采访时表示,「我们知道会有很多各种各样的情况出现。这也是我们在设计系统的时候所需要考虑周全的。」

今年二月,Waymo 宣布,自 2009 年谷歌开启自动驾驶计划以来,其汽车已经在公共道路上行驶了 500 万英里。

事故报告(在加州开发自动驾驶技术的公司必须公开)显示,Waymo 汽车已经卷入了 30 起小型撞车事故,但仅有一起事故是 Waymo 造成的:

2016 年,一辆处于自动驾驶模式的雷克萨斯 SUV 改变了车道,行驶到公共汽车车道上。 这辆 SUV 受到轻微损坏,没有人受伤。

相比之下,人类驾驶员的行驶数据很难确定,但是弗吉尼亚理工大学交通研究所的研究人员估计,人类驾驶的车辆每行驶百万英里会发生 4.2 次事故。 这样算来,行驶超过 500 万英里约发生 21 次撞车事故,这与 Waymo 的记录大致相当。

事实上,Waymo 在钱德勒市的测试一直是在没有安全驾驶员的情况下展开的,并计划在今年的某个时候推出无人驾驶出租车服务。

同其他自动驾驶汽车公司一样, Waymo 喜欢亚利桑那州,因为这里阳光明媚,天气对传感器十分,而且对新兴自动驾驶技术的监管策略较为宽松。 (不过,在三月发生了事故后,州长 Doug Ducey 叫停了 Uber 的测试。)与此同时,Waymo 在北加州和亚特兰大也在进行测试。

不过,即便 Waymo 的小型货车在这起事故中无需承担责任,公司也不会对这个时机发生摩擦感到高兴。

在 Uber 和特斯拉接连出事之后,那些令人不安的问题又重新摆上了台面:

人们怎么知道这些自动驾驶系统已经可以开始应用了? 这些自动驾驶车辆真的应该在公共街道上展开测试吗? 让一个人类监督员坐在方向盘后是否称得上是足够的后备力量? 这些车不是应该让每个人都更安全的吗?

「事故现场的照片把整个故事简化,看上去就像一场可怕的意外。」康奈尔大学人工智能专家 Bart Selman 表示, 「其实许多错误人类驾驶员也在犯。而这些是我们已经习惯了的,甚至不会去报道的。」

事实上,在 2016 年,亚利桑那州每天平均有近 350 起撞车事故和 2 起死亡发生。 这也是自动驾驶技术的推广者喋喋不休地谈论每年有近 4 万人在美国道路上死亡的事实,而且人为错误导致了超过 90% 的车祸。理论上看,机器不会喝醉、不会分心、也不会昏昏欲睡,无疑可以大幅度削弱这些让人胆战心惊的数据。

但不可否认的是,这需要时间,技术的升级、测试、部署不可避免。

也许,在马路上死亡的人数永远不会为零,要接近这个水平也需要几十年的时间。想要实现这个目标,人们将不得不继续工作,还要准备好再次回答那些令人不快的问题。

]]> 原文: https://ift.tt/2FM0zq2
RSS Feed

机器知心

IFTTT

机器创作不可避免,用AI打造新《格林童话》的Botnik还想守住文化

流行两百多年的《格林童话》有了一个新版本。

这次,人工智能成为格林兄弟的模仿者,创作了一个名为《公主和狐狸》的「孪生」故事。

上个月,它的音频版本对外发布,其创造者 Botnik,是一家使用机器学习和预测算法来写作的公司。

不过,利用 AI 技术生成童话故事的做法也算不上新鲜事。早在 20 世纪 30 年代,佐治亚理工学院人工智能教授 Mark Riedl 就已经写过这样的故事。此外,加州大学圣克鲁兹分校的人工智能研究员 Issac Karth 也表示已经完成了对格林兄弟语言模仿的程序实现。

但《公主和狐狸》这篇故事脱颖而出的原因在于,它很好地模仿了格林童话和其他民间故事的风格和模式,在某些程度上还保留了格林兄弟身处的那个年代人们对性别所持有的固有偏见。

而且《公主与狐狸》也并不是完全由人工智能撰写而成,Botnik 首席执行官 Jamie Brew 说,这是人类与机器合作的一次创作实验。

他解释说,文本是由两个具有预测文本功能的键盘生成。旁白键盘构建故事的整体结构,而对话键盘模拟了格林童话的叙事风格。人类可以从人工智能生成的各种可能性中进行选择。

「人类作者在写每个句子时都会得到一系列的建议」,而这些「建议」出现的原因被解释为「基于源文本中的单词模式,算法为语句分配了不同的可能性」。

除了《格林童话》,Botnik 也对其他作品也采取了类似的方法,包括摇滚乐队 Radiohead 的歌曲、哈利波特、诗歌等。

「无论你如何对作品进行划分,人类的参与都是我们写作的内核,这一点无可替代。」Brew 说道。

高颜值的公主总是等待勇敢王子的拯救

这仍然是一个非常传统的故事,所以遵循了许多童话故事中的固有套路——一个会说话的狐狸帮助地位卑贱的磨坊主儿子解救了一位美丽的公主,让她免于嫁给自己不爱的可怕的王子。

故事的开头是这样的:

很久很久以前,有一匹带着金色马鞍的金马,它的头上别着一朵美丽的紫色小花。这匹马会把花带到村庄去。有个公主看见花是如此美丽,不由得跳起舞来。公主对他的父亲(面包和奶酪的国王)说:「这实在是太棒了!」

在这个故事中,公主的自我价值很大程度上取决于她的外表,她曾跳了一段形意舞来模仿那个把花带到村庄的金马。

故事的其他部分则不断提醒读者,公主是善良、美好、快乐的,当然最重要的是,她是美丽的。

虽然她曾拒绝按照父亲的意愿行事,但是公主反抗精神的唯一标志仅限此,其他时候公主的行为都是在舞蹈、微笑或哭泣。而与她的母亲(这个故事中仅有的另一个女性角色)相比,公主还是令人羡慕的:王后完全不懂得反抗。

故事中还有五位男性角色:两个王子(其中一者是伪装起来的)、一位国王、一只狐狸以及那匹漂亮的马。

尽管这篇故事里有几处奇怪的过渡和轻微的逻辑问题。不过,整个故事看起来非常有格林童话的风格,这种不协调反倒为整个故事增添了一些超现实的魅力。

机器开始创作了,我们需要保卫文化吗

加利福尼亚大学圣克鲁兹分校的 AI 研究员 Kate Compton 表示:「人工智能语料库训练的系统会习得语料库数据的偏见,这是一个很大的问题。」

不过,人类也参与了《公主和狐狸》的创作,所以故事的偏见不能简单地归咎于机器。

Compton 认为,在这种情况下,部分偏见来自于「作者所受到的文化熏陶,这让作者选择了一个带有类似性质的想法并将其转化为故事。」

有趣的是,这个故事中对于性别的看法其实是一种创作者喜闻乐见的结果。

「在第一次试验时,作者大多倾向于选取一些令人惊讶的元素和故事走向。」Brew 说。故事的第一个版本实际上是磨坊主的女儿拯救了好几位公主。而为了保持格林童话的腔调和美感,这些元素和部分荒谬的细节都是被重新编辑过的。

「任何用人造数据进行训练的系统都有可能造成人为的偏见。」Riedl 说道。

但他也指出:「我们经常认为偏见不是好事,但是要记住,所有数据和所有故事都有带有偏见——如果完全没有任何偏见,那也不会有任何故事。」

Riedl 认为,基于人工智能的叙事目标不一定是要消除所有的偏见,而是决定如何、是否更新人工智能的价值参照系,从而使它产生的故事符合当前的价值观。

「我们的偏见、想法和刻板印象确实会随着时间而改变,而我们未必能及时应用我们的想法」,他说。

如此看来,Botnik 团队的研究人员可以看作是文化的新守门人:他们必须决定是保留文化的某个特有面貌(如格林美学),还是摆脱不再有意义的刻板印象和模式,或者决定彻底发起进攻。

「这是一把双刃剑」,Riedl 说道——不过,如果能握在正确的讲故事的人手中,这把剑仍然是充满魔力的。

文章来源:https://ift.tt/2FbvdbZ

]]> 原文: https://ift.tt/2jwcMqj
RSS Feed

机器知心

IFTTT

LangChain 彻底重写:从开源副业到独角兽,一次“核心迁移”干到 12.5 亿估值 -InfoQ 每周精要No.899期

「每周精要」 NO. 899 2025/10/25 头条 HEADLINE LangChain 彻底重写:从开源副业到独角兽,一次"核心迁移"干到 12.5 亿估值 精选 SELECTED 1000 行代码手搓 OpenAI gpt-oss 推理引...