AI 人工智能新闻资讯: 谷歌的AI能为黑白视频上色，没有人告诉它哪里是汽车，哪里是人脸

2018年6月28日星期四

谷歌的AI能为黑白视频上色，没有人告诉它哪里是汽车，哪里是人脸 | 附论文

五色栗发自凹非寺量子位报道 | 公众号 QbitAI

谷歌培育了一只AI，是一只自动给视频上色的AI。

从彩色视频里，截取某一帧作参考。再把所有帧都变成黑白，AI仅仅依靠参考帧的颜色，便可以还原整段视频的色彩了。

把影像从灰暗变到新鲜，只用了下面这一张图。

并且，没有人告诉AI，哪里是人，哪里是柜子。

走到哪，都认识你

这是一个自我监督 (Self-Supervised) 的物体追踪模型。

所以，研究人员喂给神经网络的是，大量的无标记视频数据。

模型要学会预测，黑白视频中，物体的颜色。

最关键的步骤，就是物体跟踪。

比如，AI看到了一辆汽车，没有人告诉它那是汽车。

但在黑白的图像里，它还是要准确找到这辆车所在的区域，把参考帧里相应区域的红色填过去。

虽然，模型没有用参考标准标记 (Ground Truth Labels) 训练过。但从结果上看，神经网络依然学成了人类喜闻乐见的样子。

面包上的奶油，即便涂好的样子不同了，AI也依然记得。

姿势也可以追踪

另外，研究人员发现，这个模型还可以用来追踪人类的姿势。

对于主角是人类的视频，神经网络只有了解他们的一举一动，才能更顺畅地为人类上色。

毕竟，他们动作比较多，还喜欢给自己加戏。你看——

你让我坐下？

我就不坐下。

我很厉害吧。

再不鼓掌我…

只要输入一帧带有骨架的图。

AI就可以推断出，视频里其他帧的姿势了。

那么，追踪功夫姿势的话，一定会更燃吧。

然而，并没有，可能只会更佛系，因为——

这是太极的上色效果。

注意，二者清晰度不同，不是AI的问题，是微信动图只支持2MB以内，的后果。

论文传送门：https://ift.tt/2KfYk5A

— 完 —

欢迎大家关注我们的专栏：量子位 - 知乎专栏

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复"招聘"两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

via 量子位 - 知乎专栏 https://ift.tt/2Iypm2m

RSS5

AI 人工智能新闻资讯

2018年6月28日星期四

谷歌的AI能为黑白视频上色，没有人告诉它哪里是汽车，哪里是人脸 | 附论文

走到哪，都认识你

姿势也可以追踪

RSS5

没有评论:

发表评论

GPT-5.6三档模型全面围剿Claude Fable5，ChatGPT Work上位 -InfoQ每周精要No.930

标签

标签