英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能AI终于学-齐鲁经济网

频道
搜索

微信微博 QQ空间 MORE

2岁的人类幼崽能做什么，AI居然会学。

直到现在，这个终于被科学家攻克了！

有网友评价:很爽这可能是我最近几个月看到的最好的项目了

它是如何工作的。

我们先来看几个例子。

当你上传3张不同角度的陶瓷猫照片时，你可能会得到以下4张新图像:两只在船上钓鱼的陶瓷猫，陶瓷猫书包，班克斯的艺术风格猫和陶瓷猫主题饭盒。

同样的例子是艺术品:

装甲:

碗:

AI不仅可以从图像中提取物体，还可以生成具有特定风格的新图像比如如下图，AI提取了输入图像的绘画风格，生成了一系列这种风格的新绘画

更神奇的是，它还可以将两组输入的图像进行组合，提取一组图像中的物体，然后提取另一组的图像风格，将两者组合生成一幅全新的图像。

除此之外，通过这个功能，你还可以启动一些经典的图像，给它们添加一些新元素。

那么，如此神奇的功能背后是什么原理呢。

虽然近两年来，大规模的文本—图像模型，如DALL，CLIP，GLIDE等，已经被证明有很强的自然语言推理能力

但有一点:如果用户提出一些具体的要求，比如生成一张新的包含我最喜欢的童年玩具的照片，或者把孩子的涂鸦变成一件艺术品，这些大规模的模型是很难做到的。

为了应对这一挑战，提出了一种固定的，预训练的文本图像模型和一小组描述概念的图像目标是从这个小集合中找到一个单词来嵌入和重建图像因为这种嵌入是通过优化过程发现的，所以称为文本倒置

具体来说，就是先把用户输入的图像中的物体或样式抽象出来，转换成伪词s此时，这个伪词可以被视为任何其他词

S在沙滩上的照片，挂在墙上的S的油画，画一个S2风格的S1。

值得注意的是，这项研究使用了小规模，有计划的数据集，因此在生成图像时可以有效避免刻板印象。

比如下图，当提示医生时，其他模型倾向于生成白人和男性的图像，而该模型生成的图像中增加了女性和其他种族的数量。

目前这个项目的代码和数据已经开源，有兴趣的伙伴可以关注一下。

参考链接:

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

责任编辑：白鸽

液化天然气槽罐车遭货车追尾发生泄漏多部门
福建省南平市消防救援支队13日透露，12日14时左右，该支队指挥中心接到报警，称...
180人星夜驰援！7小时筑起6公里“防疫
180人星夜驰援！7小时筑起6公里“防疫长城”题:180人星夜驰援！7小时筑起6...
疫情下7人管好5000人“居委干部不要怕
疫情下7人管好5000人“居委干部不要怕认错”题:疫情下7人管好5000人“居委...

实时推荐

开完冠道，再开锐界plus，立刻想换车了！

2023-12-08 08:07
南京鼓楼融合改革实验区建设成果汇报会举行

2023-12-08 07:53
售12.98万元，外观动感，比亚迪宋ProDM-i冠

2023-12-08 06:06
湖北加速数字体育发展构建现代体育产业体系

2023-12-08 04:18
试驾深蓝SL03，底盘，隔音都升级，20万以内舍它其

2023-12-08 03:54
丰田卡罗拉：大受欢迎的家用明星，值得考虑

2023-12-08 02:18
25吨泰国冻鸡副产品从关累港口岸入境

2023-12-08 00:19
打造车、芯跨产业交流高端平台！2023全球汽车芯片创

2023-12-08 00:03
你以为买mpv车主都是40岁大叔其实90后也喜欢超大

2023-12-07 22:32
呵护儿童青少年眼健康华厦眼科在全国持续开展“启明行动

2023-12-07 20:29
新一代梅赛德斯-奔驰CLA四门轿跑车上市

2023-12-07 20:28
同样是搭载弗迪混动，蓝电E5却比宋Pro更亲民，你选

2023-12-07 18:42
预售22.98万起传祺ES9闪耀南京车展

2023-12-07 16:48
国家数据局：平台企业在支持创造就业等方面持续加大投资

2023-12-07 16:10
起亚K8发布，造型相当特别，有机会翻红？

2023-12-07 15:30

热门图文