宋朝名画“虎戴VR”，在外网火了

更新时间：2022-06-05 14:35:25作者：未知

宋朝名画“虎戴VR”，在外网火了

金磊 Alex 发自凹非寺
量子位 | 公众号 QbitAI

谁能想到，宋朝的老虎们，有一天能在国外被玩儿火了。

事情是这样的。

前不久谷歌不是出了个AI创作神器Imagen嘛。

只要你给一句话，它就能生成符合语意的图片。

然后脑洞大开的国外网友们，不按套路地给Imagen出了道题：

Imagen也没在怕的，“啪的一下”就给出了一幅力作——《虎戴VR》。

还别说，这幅《虎戴VR》还真是有点那味了。

不仅是画风上，VR头戴跟老虎以及整幅画作能够保持一致。

就连手柄、双虎嬉戏的感觉也都一步到位地画了出来。

然后还有两只老虎戴VR，手牵着手一起“恰恰恰”的：

甚至Imagen还别出心裁地设计了个“连线”版VR（可能在面对面看片吧）：

但毕竟在AI作画这事上，除了谷歌Imagen之外还有很多神器。

于是，一场《虎戴VR》作画大战就此拉开序幕。

（猜猜谁家的画更有“心有猛虎，细嗅蔷薇”的味道）

DALL-E也来请战

首先来应战的，定然是OpenAI家的DALL·E。

网友Jacob出于好奇，便用它做了几幅来做比较。

首先是满满“定妆照”风格的《虎戴VR》（很飒啊）：

不难看出，DALL·E的画作和Imagen在风格上还是有很大的区别。

Imagen的画作更趋于简约线条风，而DALL·E则更多了些许油画的元素。

不过在意境方面，DALL·E也是能够产出“双虎嬉戏”，甚至是拟人的画作：

二者相比之下，网友们给出了他们的评价：

大多数网友们对谷歌家的Imagen更买单。

而除了它俩之外，像AI绘画神器MidJourney也参与到了此次“大战”。

不过它的作品，就显得略有些诡异了……

DALL·E VS Imagen

那么，同样作为AI创作神器，最近大火的Imagen和DALL·E为何画风会截然不同呢？

Open AI的DALL·E和谷歌的Imagen，都可以直接通过文本描述生成类似超现实主义的图像，让机器也能拥有设计师般的创造力。

不过，二者的“创作”原理大相径庭。

DALL·E 2采用CLIP将文本特征映射到图像特征，然后指导一个GAN或扩散模型生成图像。

所谓CLIP，是一个在各种图像和文本上训练的神经网络，对生成的多张图片进行排序，挑选出更好的生成结果进行展示。

而谷歌的Imagen则使用纯语言模型只负责编码文本特征，把文本到图像转换的工作丢给了图像生成模型。

语言模型部分使用的是谷歌自己的T5-XXL编码器，将训练好的文本冻结。

图像生成部分则是一系列扩散模型，先生成低分辨率图像，再逐级超采样。

谷歌的T5-XXL有46亿个参数，而扩大文本编码器的规模，可以有效改善文本到图像的对应关系，和图像的保真度。

此外，Imagen还使用了另一种称为noise conditioning augmentation的扩散技术，帮助模型学习已添加的噪声量，从而提高图像的还原性。

对比来看，Imagen似乎比DALL·E更具有“写实”的特点：

目前，在Imagen官网上已涌现出各种新奇的图像。

有人给浣熊戴上了宇航员头盔。

泰迪熊在这里开始游蝶泳。

还有老鹰型的巧克力冰淇淋（嗯，还挺应景）。

截至目前，Imagen和DALL·E都还在调试阶段，尚未向公众开放。

One More Thing

这次《虎戴VR》AI作画大战中，也不乏有失败的作品。

例如有网友就给出了用DALL·E mini来生成的示例。

不难看出，在这版中的《虎戴VR》中，并没有任何VR的出现，而且老虎的面部基本上都是模糊不清。

据网友描述，他在生成的过程中，只是把“北宋”改成了“南宋”：

那么你觉得对于《虎戴VR》，哪家AI神器表现更出色呢？

https://twitter.com/hardmaru/status/1532757753797586944?s=21&t=MhwVN5VXH22zFK7DWQJnCg

本文标签：虎戴vr vr 谷歌编码器 ai

上一篇：iOS 16来了！苹果公布iOS 15关键数据：更新率近90% 快升级

下一篇：手下业务一季度收入超873亿美元，亚马逊“王牌”高管离职，年薪高达5600万美元

为您推荐

网易云音乐私人FM是什么意思网易云音乐是什么软件

1、私人FM其实就是私人电台，这个私人FM只要调教的好了就会推送用户喜欢的音乐。网易云音乐私人FM是根据用户听歌习惯，进行智能推荐歌曲的一个功能。该功能依赖于平台的智能推荐算法，算法越强大，推荐的歌曲也就越符合用户喜好。

2023-01-29 10:39

信息技术是什么关于信息技术的介绍

1、信息技术是指利用电子计算机和现代通讯手段实现获取信息、传递信息、储存信息、处理信息、显示信息、分配信息等的相关技术。 2、从广义上讲，凡是能扩展人类信息功能的技术，都是信息技术。随着微电子技术、计算机技术和通信技术

2023-01-29 03:39

wps通配符使用技巧 WPS中通配符怎么用

1、首先，我们使用键盘快捷键“ctrl+F”找到“查找与替换”的对话框，选择“替换（P)”选项。2、然后，点击下面的“高级搜索”，搜索（C）选择为“全部”并且同时打开下面的“使用通配符”选项。3、之后在查找内容栏里面输入

2023-01-27 10:39

理财和基金的区别关于理财和基金的区别介绍

1、购买门槛，银行理财一般的购买门槛要求较高，有的在5万元以上，有的在上百万元以上；而基金的认购起点多在1000元左右，有的没有门槛限制。 2、安全性的区别，银行理财和基金虽然安全性都比较高，但是由于基金同时受基金法和

2023-01-26 00:08

结构性存款和理财产品的区别关于结构性存款和理财产品的区别

1、本质的区别在于，结构性存款依旧是存款范围，而理财不属于存款的范围，也就是说理财是有本金亏损的风险在，而存款则一般不会有。2、结构性存款的门槛相对较高，一般五万元起投，也有部分银行推出一万起投的。而理财产品一般没有什么

2023-01-26 00:08

理财小知识介绍详解两个理财小知识

1、要分清理财和投资的区别：（1）投资追求的是投入于产出比，比如我们分析上市公司，经常用到ROE，其本质我们是在分析企业赚钱的能力，而理财侧重于财富的稳定增长。（2）投资的为了在最短时间内，让有限的资源产生最大的回报，而

2023-01-25 21:09