2018年10月27日星期六

ServiceComb成为Apache顶级项目;Node.js 11 发布;谁需要采购自动化测试工具 - InfoQ每周精要560期

 中文站「每周精要」
NO.560
2018/10/28
Node.js 11 发布,Node 10正式进入LTS
前端
Node基金会正式发布Node.js 11,同时宣布,到10月30 日,Node.js 10.x将成为LTS(Long Term Support版本,也就是长期支持版本。
Ubuntu 18.10正式发布,引入全新Yaru主题,性能有所提升
DevOps
Ubuntu 18.10 版本有哪些新功能?
谷歌"好奇心"强化学习新突破!改变奖励机制,让智能体不再兜圈子
机器学习
探索强化学习新方法!
Sharding-Sphere成长记——写在分布式数据库代理端里程碑版本3.0.0发布之际
运维
在历经八个月的紧张开发与精心打磨之后,Sharding-Sphere社区为程序员献礼,将Sharding-Sphere 3.0.0正式版于10月24日程序员节发布。
微服务开源项目ServiceComb毕业成为Apache顶级项目
架构
全球最大的开源软件基金会Apache软件基金会(以下简称Apache)于北京时间10月24日宣布Apache ServiceComb 毕业成为Apache 顶级项目。
GitHub发布改进开发工作流的新工具
语言开发
在旧金山举行的GitHub Universe大会上,GitHub发布了多个新工具,帮助开发者使他们的工作流更加有效,包括Actions、"建议修改"和针对.NET及Java的安全警告等。
分布式敏捷框架指南
《分布式敏捷框架》为希望使用敏捷方法来交付客户价值的分布式组织和团队提供了一个框架。
Firmament :大规模集群任务调度
架构
常见的调度系统往往兼顾了准确度却牺牲了性能,容器调度的复杂性使得在准确和效率之间找到平衡点很难,尤其是在交互式调度的场景下,可取的解决方案更是捉襟见肘。本篇文章就以此为背景,介绍大规模调度场景下分布式任务调度的难点、解决策略及现有的一些方案。
下一代的微服务架构基础是ServiceMesh?
DevOps 架构
一篇文章看懂,到底什么是ServiceMesh?
Vim中一些默认不启用但非常有用的命令
运维
了解这些命令,使用Vim更高效。
谁需要采购自动化测试工具
DevOps
这个看似寻常的问题,我在过去十五年中遇到太多次,以至于我已经很清楚,这个问题背后隐藏着一个怎样深不见底的坑。
三种系统监控工具对比:top vs Htop vs Glances
运维
本文介绍了top、Htop、Glances三个实用工具,以及一种用于监控分布式系统的简单解决方案。
你知道CSS实现水平垂直居中的第10种方式吗?
这是一道面试必考题,很多面试官都喜欢问这个问题,我就被问过好几次了。
基于Vue+Electron构建桌面应用程序实践
前端
试试用Electron构建桌面应用程序吧。
每个Web开发者都应该知道的SOLID原则
前端
Robert C. Martin制定了五项指导原则,使开发人员很容易创建出可读性强且可维护的程序。这五项原则被称为 S.O.L.I.D 原则。
比拼Kafka,大数据分析新秀Pulsar到底好在哪
大数据
为什么Pulsar能够取代Kafka拿下InfoWorld大奖?
如何用Python将数据预处理速度提升2至6倍?
大数据 语言开发
让你的数据预处理嗷嗷快!
AI一周热闻:马蜂窝被曝评论造假,估值从175亿缩水至20亿元;特斯拉下架"全自动驾驶"选项
AI
每周新闻准时报!
专访Apache之父、Hyperledger执行董事:在开源领域低调耕耘,打造区块链默认操作系统
区块链 开源
为开源注入了大量心血,也是链圈发展的关键人物。
用可替代区块链的DAG实现智能合约
区块链
本文将讨论DAG和区块链这两种账本结构,在加密货币和智能合约两个场景下的不同,以及如何基于DAG来实现智能合约。
那个躲过狗狗币的男人
区块链
一代传奇,狗狗币之父。

技术大会  CONFERENCE
CNUTCon:《英雄联盟》开发商:保证玩家最佳体验,这些一个都不能少!
RIOT Games的在线服务运行环境十分复杂,那么如何利用容器达到高效运维?如何高效高能地利用多种云平台来达到产品更好更快发布?AIOps在游戏运维场景中有哪些应用?如何实现容器的全球同步?
ArchSummit:美团外卖2000万订单背后的知识图谱
知识图谱是当前人工智能的热门方向,尤其是在垂直领域的应用中已经取得了很多技术突破。来这里学习如何从0打造知识图谱,如何利用文本、图像等多领域技术完成知识图谱中的信息抽取。
AICon:亚马逊,从研究到落地,大规模AI/CV落地应用的趋势和挑战
我们将从一个比较大的维度简要介绍下AI应用的核心要素,大致的产业链格局,AI+的具体落地案例以及技术和产业的一些发展趋势。

极客时间App  GEEK TIME APP
Java核心技术36讲,限时优惠价¥49,原价¥68
作者为前Oracle首席工程师杨晓峰,目前已有2.6w+订阅!专栏共五大模块,重点围绕"术"与"道",为你讲解 Java 核心知识点,让你搞定Java面试,顺利提升 Java 技能。
程序员捅了马蜂窝怎么办?
批量爬虫企业数据,违法吗?开源代码的版权,到底怎么看?转正申请不被批,劳动合同你看懂了吗?无故被裁员,工资社保跟谁要?租房碰上黑中介,维权从哪儿入手?每天8分钟,轻松掌握程序员一生必知的法律常识。

活动推荐  POPULAR EVENTS
极光开发者大会 | 11.17 深圳,为您奉上技术干货。
现场不仅有移动开发、人工智能、商业智能等干货,更有价值8999极光游大奖、Bose耳机、罗技机械键盘等等。走起吧!
福利时间!华为云多项服务免费赠送
InfoQ联合华为云为用户提供福利啦!填写问卷即可获赠一折券,如果你愿意参与测试,我们更将免费提供服务!名额有限,还不快来。
身为技术人,"永葆青春"应该掌握哪些硬核知识?
11月3日武汉,AWS资深架构师将围绕Serverless、微服务、AI等互联网尖端热点技术领域,基于实例深度剖析前沿技术的实践和落地,亲身传授"青春永驻"的秘籍!
一流技术管理团队是怎样将钱花在"刀刃"上的?
11月3日成都,ChinaMSP资深云计算架构师将基于实例深度揭秘,面对灵活复杂的云计费模型,面对云上潜伏的多重挑战,一起来看大Boss如何以一敌百。
感谢您订阅每周精要。InfoQ中文站每周日针对会员发送每周内容精要邮件。
别人转发给你的邮件?现在注册获取您自己的 InfoQ每周精要邮件吧
InfoQ微博:@InfoQ
InfoQ微信:infoqchina
InfoQ手机客户端:极客时间

2018年10月20日星期六

Chrome 70正式版发布, 三种系统监控工具对比,JavaScript私有属性要来了 - 每周精要559期

 中文站「每周精要」
感谢您订阅每周精要第 559 期,本期内容截止于2018-10-21。
技术新闻   TECH NEWS
微软加入开放创新网络,旨在保护Linux和开源
微软副总裁兼首席知识产权法律顾问Erich Andersen宣布,微软将加入开放创新网络(OIN)。
比特大陆大转型!链圈币圈人走茶凉,AI才是救命草
比特大陆召开媒体沟通会,会上又发布了一款全新的AI芯片和多款AI终端产品,并发布了另外一款此前只有零星报道,但没有具体介绍的云端AI芯片的信息。
没有他就没有个人电脑!微软二号人物去世
10月15日,微软联合创始人保罗·艾伦 去世,享年65岁。
Amazon全新轻量级服务器端Swift框架:Smoke
Amazon Smoke框架是使用Swift语言编写的全新开源轻量级服务器端框架,用于构建类REST或类RPC的服务。
JavaScript私有属性要来了,但实现方式惹争议
TC39在GitHub上通过了一条EMCAScript语法特性的草案,即类私有属性修饰符"#",不过,该特性之前在社区的调研中遭遇了大量反对。
Spotify开源其Cassandra编排工具cstar
Spotify最近开源了其Cassandra编排工具cstar。Cstar是一个命令行工具,用于在Cassandra集群中的所有主机上运行脚本。
架构设计   ARCHITECTURE DESIGN
Polylith:一款新的软件架构
Polylith是一种软件体系结构,利用许多构件来组合系统,所有构件就像工作在一个地方一样。
使用反应式领域驱动设计来解决不确定性
Vaughn Vernon撰写了几本关于DDD和反应式消息传递模式的书,并发现分布式系统的本质意味着你必须处理不确定性。
Uber开源Marmaray:基于Hadoop的通用数据摄取和分散框架
Marmaray这个名字源于土耳其的一条连接欧洲和亚洲的隧道,在Uber内部,Marmaray被设想为根据客户偏好将数据从任何来源连接到任何接收器的管道。
运维 & DevOps   OPERATIONS & DEVOPS
三种系统监控工具对比:top vs Htop vs Glances
本文介绍了top、Htop、Glances三个实用工具,以及一种用于监控分布式系统的简单解决方案。
恕我直言,对Helm大家还是要三思而后用
本文将说明不相信那些大肆宣传的原因。
号称能支持8位明星并发出轨的微博系统又挂了
能支持明星并发出轨,但支持不了明星宣布结婚的消息。
大前端   THE FRONT END
Chrome 70正式版发布:Windows端将支持PWA
Chrome 70正式版发布,Windows、Linux、Mac和iOS平台都可开始使用,但 Android 平台还需等些时日。
浏览器页面渲染机制,你真的弄懂了吗?
本文的目的是用非常简单的术语解释浏览器如何将HTML、CSS和JavaScript转换为我们可以与之交互的网站。
2018年,最常见的26个JavaScript面试题和答案
FullStack.Cafe汇编了最常见的JavaScript面试问题和答案,希望能够帮助读者找到下一份梦想中的工作。
人工智能   ARTIFICIAL INTELLIGENCE
人人恐惧AI寒冬,他却希望泡沫再破裂一次
没有银弹,没有奇迹。都是扎扎实实的工程,多年细节的打磨才能解决一点小事。也从来没有一个所谓的伟大的想法,能跳过工程的考验就成功的。工程才是做好 AI 的钥匙。
AI一周热闻:科大讯飞回应以"AI之名搞房地产";MIT宣布10亿美元成立全新计算与AI学院
AI一周热闻简单报。
Google大脑最新研究成果:使用强化学习实现动态系统的韧性计算
本文为AI前线第52篇论文导读。
区块链   BLOCKCHAIN
联盟链战国:五大巨头横向对比
本文选择了 Hyperledger Fabric、FISCO BCOS、微软的 Coco、企业以太坊联盟(EEA)及 R3 的 Corda 这五个具有一定影响力的联盟链,拟从设计理念、生态、效率、扩展性、节点管理与权限管理、智能合约、部署与运维友好性、隐私保护、公链结合或演化能力九个方面进行比对,以供各位开发者、爱好者参考。
腾讯十年老兵:区块链本质上是一个异地多活的分布式数据库
本文主要有四个部分的内容:从分布式数据库角度看区块链;腾讯云区块链服务 TBaaS 技术介绍;智能合约开发及示例;快速部署及运营配套。
Gartner分析师:认为区块链幻灭是too young too naive!
本文阐述了区块链的未来、企业采用在可扩展性的八大障碍,并研究了可扩展性的意义以及在区块链中实现可扩展性需要采取哪些措施。
技术大会   CONFERENCE
CNUTCon:自动化运维可不只是说说而已!
现如今,随着云计算和分布式的落地和发展,越来越多的服务器都转到云上,微服务架构的落地也让现在的IT系统架构越来越复杂。我们的服务、应用所面对的规模也越来越大,这样的需求需要强大的运维管控系统在后面支撑......
ArchSummit:天猫如何应对前端带来的"极限挑战"
数据库的性能直接决定了整个系统的稳定性,面对双十一的压力,阿里巴巴高级技术专家舒文在天猫营销体系建设、推进跨终端体系、NodeJS在天猫的落地这几个层面的终级秘诀究竟是什么呢?
AICon:百度,知识图谱让搜索推荐技术更加智能
知识是人工智能进一步发展的阶梯,人工智能技术应用于搜索,对用户需求深入洞察,让用户体验更加丰富便捷,搜索也在与用户的互动中不断进步,变得越来越智能。
活动推荐   POPULAR EVENTS
数据智能 应用赋能——AWS专场
此次分享会阵容强大,我们邀请了来自流利说、AWS 等知名企业的资深嘉宾,结合自身经验分享,理论与实践相结合,内容涵盖 AI、大数据、移动开发等方向。
极客时间:程序员普遍都缺乏数据结构与算法的知识
算法,先于计算机存在于世,比编程语言本身更为重要。语言只是工具,算法才是灵魂。30000+程序员都在学习的《数据结构与算法之美》极客时间专栏,原价¥99,限时优惠¥79,立省20元。
InfoQ中文站每周日针对会员发送每周内容精要邮件,
别人转发给你的邮件?现在注册获取您自己的 InfoQ每周精要邮件吧
InfoQ微博:@InfoQ
InfoQ微信:infoqchina
InfoQ手机客户端:极客时间

2018年10月16日星期二

GluonCV 0.3: 超越经典

GluonCV 0.3版本加入5个算法和38个预训练模型,并改进了28个已有模型。在ResNet,MobileNet,Yolo-V3,Faster-RCNN和DeepLab-V3等模型上全面超越目前最好结果。


半年前我们开始了 GluonCV 项目,希望提供一个可靠的可以重复各个论文结果的深度学习计算机视觉库。过去几个月里小伙伴们挖掘了大量论文和实现中的隐藏细节,并对模型训练的各个细节进行了大量的实验。我们兴奋地发现,我们不仅仅能重复结果,而且能超越它们。

现在,我们高兴地宣布 GluonCV 的新的0.3版。在这个版本里我们加入了5个新算法和38个新训练好的模型。并且对28个0.2版的模型进行了大的改进。下面表格对比了其中的7个模型:

值得一提的是,我们大幅提升了 ResNet 系列模型精度。我们训练得到的 ResNet-50 比论文中 ResNet-152 的精度要高将近一个点(top-1 acc),但计算上便宜三倍。我们还将 YOLOv3 的精度(mAP)提升了4个点,它跟使用 ResNet-50 的 Faster RCNN 精度持平,但计算速度和内存效率均提升了10倍。

同时,我们对 Model Zoo 页面进行了改版。现在我们可以交互地比较各个模型的预测精度和性能。

此外,我们还改进了模型部署能力。所有模型都可以脱离 Python 运行(就是可以 hybridize )。

下面我们具体介绍0.3版本的改进。

研究和刷分

GluonCV 绝对是刷榜实战利器,用默认的参数你可以轻松排上各种公开数据集的排行榜。同时模块化的设计让你能很快地实现各种新的想法,投稿截止的压力不再沉重。 0.3 还提供了一些准备专有数据集的教程,小伙伴们能以此为基础在新的数据上快速准备环境。在接下来的时间里,我们会继续补充各种教程,帮助大家更得心应手地使用 GluonCV。

猛击下图查看图像分类任务中各个预训练模型的准确率:

猛击下图查看目标检测任务中各个预训练模型的准确率:

0.3版本介绍

新模型:YOLOv3

YOLOv3 是 YOLOv1 之后性能提升最明显的版本,我们在复现论文的基础上加入了一些改动,把 YOLOv3 在 COCO 上的 mAP 从论文中的 33% 刷到了 37% (分辨率 608 ),相当于达到 Faster-RCNN + ResNet50 的准确度的同时,速度至少快了 10 倍!

新模型: Mask-RCNN

Mask-RCNN 是基于 Faster-RCNN 系列的多任务输出模型,在目标检测的基础上增加了对每个物体做语义分割预测的功能,我们提供了基于 ResNet-50 的预训练模型,得到了 38.3% 的目标检测 mAP 和 33.1% 的语义分割 mAP,效果略好于 Detectron 的等价模型。

新模型:DeepLabV3

DeepLabV3 是基于 FCN 的端对端模型,利用多尺度的上下文信息提高语义分割的精度,在 Pascal VOC 和 ADE20K 数据集上都有出色的表现,我们复现的模型在 VOC 数据集上超越原文精度,达到了 86.7 mIoU 的高精度表现。

性能优化:Faster-RCNN

Faster-RCNN 优化的亮点是我们成功基于普通的 ResNet-101 ,在不加 FPN 的情况下刷到了 COCO 上 40.1% 的 mAP ,超过了 Detectron 里 ResNet-101 + FPN 的 39.6% 的 mAP 。基于 ResNet-50 的模型也达到了 37% 的高分,同样是市面上最好的开源 Faster-RCNN 实现,接下来版本中我们还会加入 FPN 的支持。关于刷分用到的黑科技,敬请期待我们的新论文。

性能优化:图像识别

你可曾想过,在 ImageNet 上能让 ResNet-50 超过 79% ,让 ResNet-101 超过 80% 吗?我们最近通过微调模型结构与加入训练过程上的优化,在基本不增加计算量和模型复杂度的前提下把ResNet模型的精度提高到了目前最好的成绩。训练过程上的优化不只对 ResNet 起效,我们也将 MobileNet , Darknet53 , Inception V3 提高到了比原文更好的精度。同时,这些更好的模型在目标检测和语义分割等其他任务上也达到了更好的效果,证明了这样的结果并不是对 ImageNet 的过拟合。

详细信息请参考 GluonCV 的Model Zoo页面,我们也会在新论文中讨论相关的细节,敬请期待。

新应用:GAN

0.3 版新增了热门的 GAN 的应用模型,@husonchen 贡献了 WGAN 的模型和训练脚本,比如说下图就是用 GAN 直接生成的卧室图片。

新应用:行人重识别

行人重识别是安全领域相当重要的应用,在 0.3 版本中@xiaolai-sqlai贡献了行人重识别训练模块,在 market1501 数据集上可以取得 93.1% 的最好结果。

性能优化:语义分割

在语义分割方面,随着跨卡的 SyncBatchNorm 加入 MXNet ,我们提供了完整到基于 SyncBN 的训练代码,完美复现 SOTA 算法。另外我们还加入了 CityScapes 数据集,并且提供了 PSPNet 的预训练模型。 Pascal VOC 上的实验复现非常繁琐,为此我们提供了一个详细的教程,一步一步讲解如何复现实验。使用 GluonCV 不仅可以一键复现最好的结果,还可以了解详细过程中的原理。

新功能:部署

有了训练好的模型不知道怎么部署? GluonCV 也没有忘记这些小伙伴,我们提供了一键导出函数,以及用 C++ 预测的样例代码,让你的模型更快地上线实战。如果上述的预训练模型已经足以满足需求,你甚至可以跳过训练步骤直接投入应用。

下一步

喜欢这一版的话不要忘了点赞收藏加星,同时欢迎关注MXNet公众号:apache-mxnet,以及MXNet博客

https://ift.tt/2IZXZzR (二维码自动识别)



via gluon - 知乎专栏 https://ift.tt/2OqEhTU
RSS Feed

RSS8


Unsubscribe from these notifications or sign in to manage your Email Applets.

IFTTT

[ECCV18-行为识别论文笔记] 多纤维网络

行为识别/视频分类 是视频理解领域的重要方向。之前该方向的深度学习方法大致可以分为两个大类:一类是双流网络,即以rgb图像和光流图像作为2D网络两个分支的输入,再在网络的某处进行融合,典型的如TSN;另一类则是将多帧RGB图像看做是3D输入,然后使用3D卷积网络进行处理,典型的如C3D,I3D,ARTNet等(当然也可以将光流作为3D网络的输入从而进一步提高效果的)。双流类方法的问题主要在于要提取光流,耗时比较多,在实际的场景中很难应用起来。所以近两年的论文更多集中在3D网络的研究上,3D类方法此前的问题主要有两方面,一是3D卷积核的计算开销比较大,二是在效果上还是距离双流类方法还是有一定的距离。

ECCV-2018上,新加坡国立大学,FAIR 和 360AI 实验室合作发表了"Multi-Fiber Networks for Video Recognition"[1], 代码见PyTorch-MFNet. 这篇论文主要针对3D网络的第一个问题进行了研究,具体而言,这篇论文的目的是要在保持网络效果的同时(主要对标I3D-RGBmodel),大幅度降低网络的FLOPs,从而提高网络的效率,使3D网络能够获得更多的应用场景。这篇文章提出的网络结构有点像不带channel shuffle 模块的ShuffleNet,其核心思想还是利用Group Conv来降低网络的计算开销。之前似乎没啥参考 mobile类模型思路来做video classification的工作,而计算量对于3D类网络又是比较重要的核心的瓶颈,所以这篇工作还是很有参考价值的。下面开始介绍文章内容,如有不足烦请指正。

Motivation

这篇文章的核心motivation就是认为目前的sota的3D网络(比如I3D以及R(2+1)D-34网络)的计算量FLOPs都太高了。常用的2D 卷积网络如resnet-152或是vgg-16网络大概是10+ 的GFLOPs,而刚刚提到的两种3D卷积网络则达到了100+ GFLOPs。作者认为,当计算量相近的时候,由于3D网络模型能额外的学习到时空信息,clip-based 的模型(即指3D网络)应该要能比frame-based的模型(即指2D网络)有更好的效果。所以,这篇文章的目标就是在保持现有sota的3D模型的效果的同时,大大提高其网络效率。

多纤维网络

在方法部分,作者首先介绍了多纤维模块(Multi-Fiber Unit)的原理,然后在2D网络上实验了多纤维结构的有效性,最后将其推广到了3D网络上去。

多纤维模块

这张图介绍了从resnet到多纤维模块的变化过程。(a) 中的结构即是一个简单的残差模块;(b) 中的则为Multi-Path类型的bottleneck模块,比如ResNeXt就采用了该结构。在该结构中,前后均为一个1x1的卷积进行降维和升维,中间则将通道进行分组,分别用几个3x3卷积核进行处理。这样的处理可以大大降低中间层的计算量,但是1x1卷积层依旧有很大的计算量。所以这篇文章提出进行更加彻底的分组,即将整个残差模块按照通道切片成多个平行且独立的分支(称为fiber,纤维),如(c)所示。c中的结构在输入和输出通道数量一致的情况下,可以将理论计算量降低到N分之一,此处N为分支或者说是纤维的数量。这种更加彻底分组的加速思路和去年的ShuffleNet其实也有些像,区别在于ShuffleNet中还提出了channel shuffle的模块,且在中间层采用了depth-wise conv。

如(c)所示的结构虽然效率提高了很多,但通道间缺乏信息交换,可能会损害效果。所以该文进一步提出了一个Multiplexer模块用来以残差连接的形式结合纤维之间的信息。该模块实际上是一个两层的1x1卷积,第一个卷积会将通道数量降低到k分之一,第二个卷积再升维,因此该模块的计算量是一层1x1卷积的k/2分之一。不过,在文章中好像没看到作者具体设置的k值。

多纤维结构有效性的验证

接下来,作者通过在ImageNet-1k数据集上的图片分类实验来验证所提出的多纤维结构的有效性。这里主要有两种形式,一是基于ResNet-18和MobileNet-v2的baseline,将其中的模块替换为多纤维模块(这里具体的实现细节不是很确定);二是重新设计了一个2D MF-Net,具体网络结构可以见论文。实验结果如下所示。

通过这个表格里面的实验结果可以看出。多纤维结构在MobileNet-v2和ResNet-18上可以在少量降低计算量和参数量的情况下,提高一定的效果,表明了多纤维模块的有效性。而MF-Net也在参数和计算量较低的情况下达到了不错的效果。最后一栏实验则表明了Multiplexer模块大概会占据30%的计算量,但对效果的提升也是比较明显的。

3D-多纤维网络

在确认了提出的多纤维模块的有效性后,本文就将多纤维结构推广到了3D网络上,并提出了3D MF-Net。3D MF-Net的模块结构和网络结构如下图所示:

可以看出,3D和2D的多纤维模块结构基本一致,只是将卷积的维度升到了三维。为了降低计算量,两层卷积只有一层进行了时序上的卷积。

实验内容

在实验部分,本文主要做了trained from scratch以及fine tuned两类实验,分别对应Kinetics以及 UCF101,HMDB51数据集。

视频分类-Trained from Scratch

在Kinetics数据集上,MF-Net以比之前3D模型低非常多的FLOPs达到了更好的效果。

视频分类-Fine-tuned Models

在这部分实验中,先将模型在大数据集(Kinetics)上训练,再在小数据集( UCF-101, HMDB51)上进行finetune。从实验结果可以看出,MF-Net以较小的计算量达到或超过了目前sota的效果。题图则更加可视化的展现了计算量和效果的关系图,可以看出MF-Net较好的占据了左上角的位置,即以较小的计算量达到sota的效果。

论文小结

这篇文章主要是进一步优化了Multi-Path模块的结构,并将其用于了3D卷积网络,从而大大提高3D卷积网络的效率。在效率大大提高后,其实也更有利于我们继续将网络做的更复杂更有效,像之前的I3D的效率实在太差了,很难进一步增加复杂度(当然另外一方面也给大家提供了很多优化空间和写论文空间...)。一方面通过引入网络加速技巧对模型速度进行优化,一方面通过增加网络对时序建模的能力来对模型效果进行提高 应该是未来3D网络研究更平衡的一种发展道路吧。

本文投稿于AI科技评论公众号, 未经许可请勿转载。

参考文献

[1]Chen Y, Kalantidis Y, Li J, et al. Multi-Fiber Networks for Video Recognition[C]//Proceedings of the European Conference on Computer Vision (ECCV). 2018: 352-367.

[2] Xie S, Girshick R, Dollár P, et al. Aggregated residual transformations for deep neural networks[C]//Computer Vision and Pattern Recognition (CVPR), 2017 IEEE Conference on. IEEE, 2017: 5987-5995.

[3] Carreira J, Zisserman A. Quo vadis, action recognition? a new model and the kinetics dataset[C]//Computer Vision and Pattern Recognition (CVPR), 2017 IEEE Conference on. IEEE, 2017: 4724-4733.



via Video Analysis 论文笔记 - 知乎专栏 https://ift.tt/2pWYWQP
RSS Feed

RSS


Unsubscribe from these notifications or sign in to manage your Email Applets.

IFTTT

JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧!- InfoQ 每周精要848期

「每周精要」 NO. 848 2024/09/21 头条 HEADLINE JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧! 精选 SELECTED C++ 发布革命性提案 "借鉴"Rust...