2018年6月28日星期四

谷歌的AI能为黑白视频上色,没有人告诉它哪里是汽车,哪里是人脸 | 附论文

五色栗 发自 凹非寺 量子位 报道 | 公众号 QbitAI

谷歌培育了一只AI,是一只自动给视频上色的AI。

从彩色视频里,截取某一帧作参考。再把所有帧都变成黑白,AI仅仅依靠参考帧的颜色,便可以还原整段视频的色彩了。

把影像从灰暗变到新鲜,只用了下面这一张图。

并且,没有人告诉AI,哪里是人,哪里是柜子。

走到哪,都认识你

这是一个自我监督 (Self-Supervised) 的物体追踪模型。

所以,研究人员喂给神经网络的是,大量的无标记视频数据。

模型要学会预测,黑白视频中,物体的颜色。

最关键的步骤,就是物体跟踪

比如,AI看到了一辆汽车,没有人告诉它那是汽车。

但在黑白的图像里,它还是要准确找到这辆车所在的区域,把参考帧里相应区域的红色填过去。

虽然,模型没有用参考标准标记 (Ground Truth Labels) 训练过。但从结果上看,神经网络依然学成了人类喜闻乐见的样子。

面包上的奶油,即便涂好的样子不同了,AI也依然记得。

姿势也可以追踪

另外,研究人员发现,这个模型还可以用来追踪人类的姿势。

对于主角是人类的视频,神经网络只有了解他们的一举一动,才能更顺畅地为人类上色。

毕竟,他们动作比较多,还喜欢给自己加戏。你看——

你让我坐下?

我就不坐下。

我很厉害吧。

再不鼓掌我…

只要输入一帧带有骨架的图。

AI就可以推断出,视频里其他帧的姿势了。

那么,追踪功夫姿势的话,一定会更燃吧。

然而,并没有,可能只会更佛系,因为——

这是太极的上色效果。

注意,二者清晰度不同,不是AI的问题,是微信动图只支持2MB以内,的后果。

论文传送门:https://ift.tt/2KfYk5A

欢迎大家关注我们的专栏:量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



via 量子位 - 知乎专栏 https://ift.tt/2Iypm2m
RSS Feed

RSS5

IFTTT

没有评论:

发表评论

JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧!- InfoQ 每周精要848期

「每周精要」 NO. 848 2024/09/21 头条 HEADLINE JavaScript 之父联手近万名开发者集体讨伐 Oracle:给 JavaScript 一条活路吧! 精选 SELECTED C++ 发布革命性提案 "借鉴"Rust...