作者 | 陈大鑫
近日,BMVC 2020最佳论文奖、最佳论文奖亚军、最佳学生论文奖、最佳学生论文奖亚军、最佳工业论文奖等五项大奖出炉。
其中最佳论文奖四位作者当中包含一作在内有三位是加利福尼亚大学戴维斯分校以及英伟达公司的国人/华人学生。
最佳学生论文奖以及最佳学生论文奖亚军也是有国人/华人学生的存在,其中最佳学生论文奖亚军由来自大连理工大学、香港城市大学、鹏城实验室的三位同学获得。
英国机器视觉会议(BMVC)是英国机器视觉协会(BMVA)的年度机器视觉、图像处理和模式识别会议。它是在英国举行的有关计算机视觉和相关领域的主要国际会议之一。随着知名度和质量的不断提高,它已成为视觉大会中享有盛誉的会议。
2018年的时候,AI科技评论有幸采访到当年九月在英国纽卡斯尔召开的 BMVC的「总指挥」--英国东安格利亚大学计算机学院教授邵岭。
作为当时会议的大会主席,邵岭教授认为,BMVC 已经有三十年历史,它其实是一场被低估的国际会议。
邵岭教授对AI科技评论表示,「虽然它是一个国际会议,但名字里有个 British,所以很多人会误解它只是一个 local 的会议,间接影响了它的投稿和参与者数量。」
邵岭教授继续说道:
BMVC 其实已经有三十年的历史了,被公认为是继 ICCV/CVPR/ECCV 三大视觉顶会之后,排名第四的计算机视觉会议,很多知名教授(比如牛津大学的Andrew Zisserman)在 BMVC 上发表过很多文章。BMVC 这几年知名度下降主要有以下三个原因:第一,虽然它是一个国际会议,但名字里有个 British,所以很多人会误解它只是一个地区性会议,间接影响了投稿论文和参与者数量。第二,很多国家的人,包括中国人去英国都需要另外办理签证,不像欧洲很多其他国家,只需要办理一个申根签证便可访问,这也影响了 BMVC 的规模。第三,现在国内都会参照 CCF 的分类来选择会议,可能有部分 CCF 委员对 BMVC 并不了解,把它排在了 C 类,这绝对是不准确的,事实上它应该被归为 B 类会议。为了提升 BMVC 知名度,每一年的组织者都会尽力把会议办到最好,邀请世界知名的学者做 keynote speakers。同时,我们也会严格把关审稿过程,尽量使审稿公平公正,以提升录用文章的质量。此外,我们也会联系工业界赞助会议的一些奖项,提高大家投稿 BMVC 的积极性。每一届 BMVC 也会组织一个 IJCV(International Journal of Computer Vision) 的 special issue,邀请最好的文章的作者,将其会议文章扩展后投到这个特刊。当然,我们也希望 CCF 在下一次对会议分类时,能更为准确地把 BMVC 分为 B 类,给予参与者更好的参考依据。
以下是今年BMVC 2020 五项大奖获奖的具体详情。
最佳论文奖
论文链接:https://ift.tt/2FvUKD5
代码链接:https://ift.tt/32mAGun
论文作者单位:加利福尼亚大学戴维斯分校、英伟达
论文摘要:
混叠(Aliasing)是指高频信号在采样后退化为完全不同的信号的现象。在深度学习的背景下,这是一个不容忽视的问题,因为下采样层被广泛地应用于深层网络结构中,以减少参数和计算量。标准的解决方案是在下采样前应用低通滤波器(filter),例如高斯模糊。然而,在整个内容中应用相同的过滤器可能是次优的,因为特征映射的频率可以在空间位置和特征通道之间变化。
为了解决这一问题,我们提出了一种自适应的内容感知低通滤波层,它可以为输入特征映射的每个空间位置和信道组预测单独的滤波器权重。我们研究了该方法在多个任务(包括ImageNet分类、COCO实例分割和Cityscapes语义分割)中的有效性和通用性。定性和定量结果表明,该方法能有效地适应不同的特征频率,以避免混叠,同时保留有用的识别信息。
最佳论文奖亚军
《Key-Nets: Optical Transformation Convolutional Networks for Privacy Preserving Vision Sensors》
论文链接:https://ift.tt/3hzCKER
论文作者:
现代相机的设计并不是以计算机视觉或机器学习作为目标应用。因此,我们需要一种新的视觉传感器,通过设计这种传感器来保护隐私、防止泄露隐私信息,体它只用于收集目标机器学习任务所需的信息。在本文中,我们介绍了一种密钥网络( key-nets),它是一种卷积网络,并与一个定制的视觉传感器配对,该传感器应用光学/模拟变换,使得密钥网络可以对转换后的图像进行精确的加密推断,但图像不能被人或任何其他密钥网络解释。
我们给出了适用于密钥网络的光学变换的五个充分条件,并证明了广义随机矩阵(generalized stochastic matrices)如尺度、偏差和分像素 shuffling等满足这些条件。我们通过展示在没有密钥网络的情况下,对于一个直接在光学变换图像上进行微调以用于人脸识别和目标检测的网络来说,这是一种高效/隐私权衡。最后,我们证明了密钥网络相当于使用希尔密码的同态加密,其内存和运行时间的上限与用户指定的隐私参数成二次方关系。因此,密钥网络是第一个实用、高效、保密的基于光学同态加密的视觉传感器。
最佳学生论文奖
获奖论文:《Video Region Annotation with Sparse Bounding Boxes》
论文链接:https://ift.tt/2H3UCLB
论文作者:
视频分析已经朝着更详细的解释性(例如分割)方向取得了令人欣慰的进展。然而,这些任务在空间和时间上越来越依赖于密集的注释训练数据。由于这种注释是劳动式密集型的,因此很少存在具有详细区域边界的密集注释视频数据。我们工作的目的就是为了解决这个难题,通过学习如何从目标区域的稀疏注释边界框中自动生成视频的所有帧的区域边界。我们用一个体图卷积网络(Volumetric Graph Convolutional Network--VGCN)来实现这一点,该网络学习使用周围外观和运动的时空体积迭代地找到区域边界上的关键点。VGCN的全局优化使其比现有的解决方案具有更强的泛化能力。我使用两个最新数据集(一个真实数据集和一个合成数据集)的实验结果,包括消融研究,证明了我们方法的有效性和优越性。
最佳学生论文奖亚军
获奖论文:《Weakly-supervised Salient Instance Detection》
论文链接:https://ift.tt/3mmij1K
论文作者单位:大连理工大学、香港城市大学、鹏城实验室
我们注意到,子实体化信息提供了对显著项数量的即时判断,这自然与检测显著实例有关,并且可能有助于在分组同一实例的不同部分的同时,分离同一类的实例。受此启发,我们提出使用类和子实体化标签作为SID问题的弱监督。并提出了一种新的具有三个分支的弱监督网络:
1、利用类一致性信息来定位候选目标的显著性检测分支;
2、利用类差异信息来划定目标边界的边界检测分支;
3、质心检测分支,利用子实体化信息检测显著实例质心。
这些互补信息被进一步融合以产生显著的实例地图,我们进行了大量的实验,证明了该方法与根据相关任务精心设计的baseline方法相比具有良好的性能提升。
最佳工业论文奖
《A CNN Based Approach for the Near-Field Photometric Stereo Problem》
论文链接:https://ift.tt/2ZE4jGK
论文作者:
论文摘要:
在不同光源下使用几幅图像重建对象的3D形状是一项非常具有挑战性的任务,尤其是在考虑诸如光传播和衰减、透视图几何形状和镜面光反射之类的现实假设时。解决光照体视系统( Photometric Stereo)问题的许多工作通常会弱化大多数上述假设。特别是它们通常会忽略镜面反射和全局照明效果。在这项工作中,我们提出了第一种基于CNN的方法,该方法能够处理光照体视系统中的这些现实假设。我们利用深度神经网络的最新进展来实现远场光照体视系统,并使它们适应近场设置。我们通过采用迭代过程进行形状估计来实现此目的,该过程有两个主要步骤:
1、我们每个像素地训练CNN,以根据反射率样本预测表面法线。
2、我们通过积分法线场来计算深度,以迭代地估计光的方向和衰减,该深度用于补偿输入图像以计算下一次迭代的反射率样本。
据我们所知,这是第一个能够从高镜面物体准确预测3D形状的近场框架。在合成和实际实验中,我们的方法都优于竞争性的最新近场光照体视系统方法。
[赠书福利]
在AI科技评论9月11日推文“《柏拉图与技术呆子》:探讨人类与技术的创造性伙伴关系”留言区留言,谈一谈你对本书的相关看法、期待等。
AI 科技评论将会在留言区选出5名读者,每人送出《柏拉图与技术呆子》一本。
活动规则:
1. 在留言区留言,留言点赞最高且留言质量较高的前 5 位读者将获得赠书。获得赠书的读者请联系 AI 科技评论客服(aitechreview)。
2. 留言内容和留言质量会有筛选,例如“选我上去”等内容将不会被筛选,亦不会中奖。
3. 本活动时间为2020年9月11日 - 2020年9月18日(23:00),活动推送内仅允许中奖一次。
EMNLP 9月15日就要出录用结果了!点击阅读原文加入“EMNLP”小组!
没有评论:
发表评论