怎么用ai时间轴做动图(网易北航搞了个奇怪研究:多数人类看不懂的立体图,AI可以看懂)

Posted

篇首语:黄金的宝藏比不上知识的宝藏。本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么用ai时间轴做动图(网易北航搞了个奇怪研究:多数人类看不懂的立体图,AI可以看懂)相关的知识,希望对你有一定的参考价值。

怎么用ai时间轴做动图(网易北航搞了个奇怪研究:多数人类看不懂的立体图,AI可以看懂)

杨净 发自 凹非寺
量子位 报道 | 公众号 QbitAI

小时候,有没有玩过一个叫做立体图游戏。

就是那种给你一张二维图,让你看图背后有啥东西。

比如,像这张图。

这其实是一张六角星。

在比如这张。

其实是一个女人在画口红。

好吧!真·眼睛看瞎还看不出是什么东西。

现在,这样一个人都看不懂的图,AI可以看懂了。

来自密歇根大学、网易伏羲AI实验室、北航的团队共同研发了一款AI项目——Neural Magic Eye,就专门从2D图像中识别3D物体来。

还可以是动图的那种。

AI是如何做到的?先来一睹为快吧。

自动立体图的生成原理

简单来说,通过训练一个深度卷积神经网络(CNN),以自监督学习的方式对大型3D对象数据集进行充分训练,就可以让AI很好的是识别出2D纹理当中的3D立体图。

训练AI之前,先得了解一下自动立体图的生成原理。

自动立体图其实与普通立体图差不多,只是它们是在没有3D眼镜的情况下观看的。

3D眼镜从略微不同的角度向左眼和右眼呈现同一物体的二维图像,使我们能够通过双目差异重建原始物体。

当以适当的视线观看时,自动立体图也是如此,双眼差异存在于重复2D图案的相邻部分。重复图案之间的距离决定了立体影像的远近。

按照这样的原理,给定一个3D图像和一个条纹图案,就可以生产自动立体图了。

首先,将条纹平铺到充满整个输出图像。然后,扫描输出图像中的每一个像素,并根据所需的距离按照水平轴移动。

判断出重复2D图案之间的距离,正是此次AI训练的关键。

AI是如何做到的?

简单概述,本次训练方法主要包括三个基本模块。

1、图形渲染器GR,从三维物体模型中渲染深度图像。

给定一组3D物体模型(如3D网格),引入一个图形渲染器GR。

2、自动立体生成器GA

对深度进行编码并合成自动立体图。

3、解码网络,恢复深度

近年来,深度CNN被广泛应用于像素预测任务中,本文则是将网络被训练为学习从像素到差距的映射。但在这种情况下,大多数图像区域将失去空间对应关系。

为了解决这个问题,本文提出了“差异卷积”的方法。

基本思想是计算出每一个特征图中的特征向量与其水平邻域,并将其值保存到相应的特征通道中。

就像这样。

为了加快计算速度,可先将特征图沿其水平轴进行圆周移动,然后用其输入进行元素减法。

与标准卷积层相比,差异卷积不会引入任何额外的参数。

本次解码网络结合了两种流行的网络架构,resnet18和unet。在这两种网络的输入端插入了一个差异卷积层和ReLU层,在差异卷积层中,研究团队将最大移位距离设置为输入图像高度的1/4。

随后,研究人员在ShapeNetCore训练解码网络——一个大型3D形状数据集,涵盖了55个常见的对象类别,其中有超过50000个独特的3D模型,并随机将数据集拆分为一个训练集(90%)和一个测试集(10%)。

此外,团队还在线收集了718张2D纹理图 (585张用于训练,133张用于测试),用于自动立体图的生成。

在解码精度的定量比较中,本文提供的方法展现出了很好的结果。

北航校友又一新作

本次项目来自密歇根大学、网易伏羲AI实验室、北航共同完成。

其中第一作者是邹征夏,目前在密歇根大学做博士后研究,他曾于2013年和2018年分别获得北航学士和博士学位。

研究方向是计算机视觉及其在遥感,自动驾驶汽车和视频游戏中的应用。

在北航学习期间,他曾获北航优秀博士论文奖,北航十佳博士研究生、北京市优秀毕业生,师从史振威教授。

前不久,他打造的SkyAR,打造电影级别的「天空之城」,在AI圈儿里引起了不小的轰动。

还有美术生都膜拜的AI,分分钟将照片变成艺术画。

One More Thing

最后,分享一个小Tips。

连AI都可以识别出立体图,咱们人可不能输!

首先,放松眼睛肌肉。

然后,让左眼看到左上方的点、右眼看到右上方的点。

最后,慢慢调整视角。

当你能在图像的顶部看到三个点后,再慢慢地调整眼睛焦距,你将会看到图像里面的3D物体

来试试手吧!

So,这张图是啥?(手动狗头)

论文地址:
https://arxiv.org/pdf/2012.15692.pdf

项目地址:
https://jiupinjia.github.io/neuralmagiceye/

GitHub网址:
https://github.com/jiupinjia/neural-magic-eye

参考链接:
http://www-personal.umich.edu/~zzhengxi/
https://levir.buaa.edu.cn/news_events_cn.htm

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

相关参考

无人机飞行(北航团队创世界纪录:扑翼式无人机单次充电飞行时间最长)

...飞行器创造了一项世界纪录:扑翼式无人机单次充电飞行时间最长——飞行器续航时间为1小时31分04秒98。北航获得的吉尼斯世界纪录证书。本文图片来自北航。扑翼飞行(如鸟类般扇动翅膀飞翔)是生物的飞行方式,人类对其...

海口办公椅(送给程序猿最好的礼物——网易多功能人体工学椅)

...坐了一下之后表示羡慕不已。由于疫情原因,他也大多数时间被安排了在家办公,相比家里的普通座椅,用人体工学椅来办公舒适度肯定要提升不少。我夸下海口:这么喜欢啊,改明儿哥送你一把。一眨眼几个月过去了,想着最...

海口办公椅(送给程序猿最好的礼物——网易多功能人体工学椅)

...坐了一下之后表示羡慕不已。由于疫情原因,他也大多数时间被安排了在家办公,相比家里的普通座椅,用人体工学椅来办公舒适度肯定要提升不少。我夸下海口:这么喜欢啊,改明儿哥送你一把。一眨眼几个月过去了,想着最...

思维导图模板空白框架(4个思维导图、流程图新增功能,动图演示一看就会)

...反映作图越来越顺手,作图效率确实又提高了不少,以下做动图演示,望周知!1、新增思维导图仅删除当前主题功能使用场景:思维导图作为一个强大的梳理思路的工具,灵活又自由,可正可逆自如调整hin有必要,新增思维导...

水冷氩弧焊枪头怎么装视频(透视、穿墙老被封?这次有人用AI搞出了个“职业代练”)

差友们玩游戏中遇到最烦的事是什么?网卡,挂机,队友抢资源送人头,还是无缘无故被喷?但要是跟“遇见挂逼”比起来,上面这些可能都不算个啥了。自打我会玩游戏以来,就没见过哪个FPS游戏没挂逼的。像什么锁头、透视...

润科通用工资待遇(北航飞行器设计硕士,毕业收到6个录用通知,年薪均在20万以上)

...技术水平高,又是大热门专业,不少企业会伸出橄榄枝,北航一位硕士就是如此,当下不知该选哪一个。北航飞行器设计硕士,毕业收到6个录用通知,年薪均在20万以上北京航空航天大学,享誉国内外,第四轮

润科通用工资待遇(北航飞行器设计硕士,毕业收到6个录用通知,年薪均在20万以上)

...技术水平高,又是大热门专业,不少企业会伸出橄榄枝,北航一位硕士就是如此,当下不知该选哪一个。北航飞行器设计硕士,毕业收到6个录用通知,年薪均在20万以上北京航空航天大学,享誉国内外,第四轮

校园局域网管理软件(ChatGPT在教育界引担忧网易有道科大讯飞等宣布入局)

...多家涉教育业务的企业宣布布局ChatGPT相关业务。2月9日,网易有道方面对此向南都记者表示,其AI技术团队已投入到相关技术在AI口语老师、中文作文批改等教育场景的落地研发中,将尽快推出相关的demo版

把塑料放入水中是沉还是浮(塑料瓶释放出的化学物质超乎想象)

(小尘4x/图)水在塑料瓶里放置一段时间后为什么会有一种奇怪的味道?哥本哈根大学的研究人员找到了引发这种奇怪味道的原因,他们在储存自来水的可重复使用的塑料瓶中发现了数百种化学物质。虽然这项研究的毒物学评估...

新款多功能灯笔(有道发布词典笔X5、AI学习机 智能硬件产品矩阵再添两员)

南都讯记者李梓毅8月9日,网易有道2022智能硬件秋季新品发布会在京举办。发布会上,网易有道发布新一代旗舰级词典笔——有道词典笔X5、综合型智能学习终端——有道AI学习机两款新品,并展示了包括有道词典笔系列、有道AI...