每日快播:Midjourney劲敌来了! 谷歌StyleDrop王牌“定制大师”引爆AI艺术圈
谷歌StyleDrop一出,瞬间在网上刷屏了。
(资料图)
给定梵高的星空,AI化身梵高大师,对这种抽象风格顶级理解后,做出无数幅类似的画作。
再来一张卡通风,想要绘制的物体呆萌了许多。
甚至,它还能精准把控细节,设计出原风格的logo。
StyleDrop的魅力在于,只需要一张图作为参考,无论多么复杂的艺术风格,都能解构再复刻。
网友纷纷表示,又是淘汰设计师的那种AI工具。
StyleDrop爆火研究便是来自谷歌研究团队最新出品。
现在,有了StyleDrop这样的工具,不但可以更可控地绘画,还可以完成之前难以想象的精细工作,比如绘制logo。
就连英伟达科学家将其称为「现象级」成果。
「定制」大师
论文作者介绍道,StyleDrop的灵感来源Eyedropper(吸色/取色工具)。
同样,StyleDrop同样希望大家可以快速、毫不费力地从单个/少数参考图像中「挑选」样式,以生成该样式的图像。
一只树懒能够有18种风格:
一只熊猫有24种风格:
小朋友画的水彩画,StyleDrop完美把控,甚至连纸张的褶皱都还原出来了。
不得不说,太强了。
还有StyleDrop参考不同风格对英文字母的设计:
同样是梵高风的字母。
还有线条画。线条画是对图像的高度抽象,对画面生成构成合理性要求非常高,过去的方法一直很难成功。
原图中奶酪阴影的笔触还原到每种图片的物体上。
参考安卓LOGO创作。
此外,研究人员还拓展了StyleDrop的能力,不仅能定制风格,结合DreamBooth,还能定制内容。
比如,还是梵高风,给小柯基生成类似风格的画作:
再来一个,下面这只柯基有种埃及金字塔上的「狮身人面像」的感觉。
如何工作?
StyleDrop基于Muse构建,由两个关键部分组成:
一个是生成视觉Transformer的参数有效微调,另一个是带反馈的迭代训练。
之后,研究人员再从两个微调模型中合成图像。
Muse是一种基于掩码生成图像Transformer最新的文本到图像的合成模型。它包含两个用于基础图像生成(256 × 256)和超分辨率(512 × 512或1024 × 1024)的合成模块。
每个模块都由一个文本编码器T,一个transformer G,一个采样器S,一个图像编码器E和解码器D组成。
T将文本提示t∈T映射到连续嵌入空间E。G处理文本嵌入e∈E以生成视觉token序列的对数l∈L。S通过迭代解码从对数中提取视觉token序列v∈V,该迭代解码运行几步的transformer推理,条件是文本嵌入e和从前面步骤解码的视觉token。
最后,D将离散token序列映射到像素空间I。总的来说,给定一个文本提示t,图像I的合成如下:
图2是一个简化了的Muse transformer层的架构,它进行了部分修改,为的是支持参数高效微调(PEFT)与适配器。
使用L层的transformer处理在文本嵌入e的条件下以绿色显示的视觉token序列。学习参数θ被用于构建适配器调优的权重。
为了训练θ,在许多情况下,研究人员可能只给出图片作为风格参考。
研究人员需要手动附加文本提示。他们提出了一个简单的、模板化的方法来构建文本提示,包括对内容的描述,后面跟着描述风格的短语。
例如,研究人员在表1中用「猫」描述一个对象,并附加「水彩画」作为风格描述。
在文本提示中包含内容和风格的描述至关重要,因为它有助于从风格中分离出内容,这是研究人员的主要目标。
图3则是带反馈的迭代训练。
当在单一风格参考图像(橙色框)上进行训练时,StyleDrop生成的一些图像可能会展示出从风格参考图像中提取出的内容(红色框,图像背景中含有与风格图像类似的房子)。
其他图像(蓝色框)则能更好地从内容中拆分出风格。对StyleDrop进行好样本(蓝色框)的迭代训练,结果在风格和文本保真度之间取得了更好的平衡(绿色框)。
这里研究人员还用到了两个方法:
-CLIP得分
该方法用于测量图像和文本的对齐程度。因此,它可以通过测量CLIP得分(即视觉和文本CLIP嵌入的余弦相似度)来评估生成图像的质量。
研究人员可以选择得分最高的CLIP图像。他们称这种方法为CLIP反馈的迭代训练(CF)。
在实验中,研究人员发现,使用CLIP得分来评估合成图像的质量是提高召回率(即文本保真度)的有效方式,而不会过多损失风格保真度。
然而从另一方面看,CLIP得分可能不能完全与人类的意图对齐,也无法捕捉到微妙的风格属性。
-HF
人工反馈(HF)是一种将用户意图直接注入到合成图像质量评估中的更直接的方式。
在强化学习的LLM微调中,HF已经证明了它的强大和有效。
HF可以用来补偿CLIP得分无法捕捉到微妙风格属性的问题。
目前,已有大量研究关注了文本到图像的扩散模型的个性化问题,以合成包含多种个人风格的图像。
研究人员展示了如何以简单的方式将DreamBooth和StyleDrop结合起来,从而使风格和内容都能实现个性化。
这是通过从两个修改后的生成分布中采样来完成的,分别由风格的θs和内容的θc指导,分别是在风格和内容参考图像上独立训练的适配器参数。
与现有的成品不同,该团队的方法不需要在多个概念上对可学习的参数进行联合训练,这就带来了更大的组合能力,因为预训练的适配器是分别在单个主题和风格上进行训练的。
研究人员的整体采样过程遵循等式(1)的迭代解码,每个解码步骤中采样对数的方式有所不同。
设t为文本提示,c为无风格描述符的文本提示,在步骤k计算对数如下:
其中:γ用于平衡StyleDrop和DreamBooth——如果γ为0,我们得到StyleDrop,如果为1,我们得到DreamBooth。
通过合理设置γ,我们就可以得到合适的图像。
实验设置
目前为止,还没有对文本-图像生成模型的风格调整进行广泛的研究。
因此,研究人员提出了一个全新实验方案:
-数据收集
研究者收集了几十张不同风格的图片,从水彩和油画,平面插图,3D渲到不同材质的雕塑。
-模型配置
研究人员使用适配器调优基于Muse的StyleDrop 。对于所有实验,使用Adam优化器更新1000步的适配器权重,学习速率为0.00003。除非另有说明,研究人员使用StyleDrop来表示第二轮模型,该模型在10多个带有人工反馈的合成图像上进行训练。
-评估
研究报告的定量评估基于CLIP,衡量风格一致性和文本对齐。此外,研究人员进行了用户偏好研究,以评估风格一致性和文本对齐。
如图,研究人员收集的18个不同风格的图片,StyleDrop处理的结果。
可以看到,StyleDrop能够捕捉各种样式的纹理、阴影和结构的细微差别,能够比以前更好地控制风格。
为了进行比较,研究人员还介绍了DreamBooth在Imagen上的结果,DreamBooth在Stable Diffusion上的LoRA实现和文本反演的结果。
具体结果如表所示,图像-文本对齐(Text)和视觉风格对齐(Style)的人类评分(上)和CLIP评分(下)的评价指标。
(a) DreamBooth,(b) StyleDrop,和 (c) DreamBooth + StyleDrop的定性比较:
这里,研究人员应用了上面提到的CLIP分数的两个指标——文本和风格得分。
对于文本得分,研究人员测量图像和文本嵌入之间的余弦相似度。对于风格得分,研究人员测量风格参考和合成图像嵌入之间的余弦相似度。
研究人员为190个文本提示生成总共1520个图像。虽然研究人员希望最终得分能高一些,但其实这些指标并不完美。
而迭代训练(IT)提高了文本得分,这符合研究人员的目标。
然而,作为权衡,它们在第一轮模型上的风格得分有所降低,因为它们是在合成图像上训练的,风格可能因选择偏见而偏移。
Imagen上的DreamBooth在风格得分上不及StyleDrop(HF的0.644对比0.694)。
研究人员注意到,Imagen上的DreamBooth的风格得分增加并不明显(0.569 → 0.644),而Muse上的StyleDrop的增加更加明显(0.556 →0.694)。
研究人员分析,Muse上的风格微调比Imagen上的更有效。
另外,在细粒度控制上, StyleDrop捕捉微妙的风格差异,如颜色偏移,层次,或锐角的把控。
网友热评
要是设计师有了StyleDrop,10倍速工作效率,已经起飞。
AI一天,人间10年,AIGC正在以光速发展,那种晃瞎人眼的光速!
工具只是顺应了潮流,该被淘汰的已经早被淘汰了。
对于制作Logo来说这个工具比Midjourney好用得多。
本文来源:新智元,原文标题:《Midjourney劲敌来了! 谷歌StyleDrop王牌「定制大师」引爆AI艺术圈》
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。标签:
- 每日快播:Midjourney劲敌来了! 谷歌StyleDrop王牌“定制大师”引爆AI艺术圈
- 波兰时间现在几点了啊_波兰时间现在几点
- 环球观速讯丨“70后”的他有望接掌湖北最大法人银行
- 【环球聚看点】88560万中标价!兰州市中铺子生活垃圾焚烧发电项目二期工程设计施工总承包中标公告
- 苹果供应商捷邦科技:公司具备向客户提供MR精密功能件能力
- 兰坪白族普米族自治县气象台发布高温橙色预警信号【Ⅱ级/严重】【2023-06-05】
- 失落车建兴,63亿卖掉美凯龙 速看
- 天天资讯:dscc:显示设备支出在2020-2026年将下调3%
- 当前热议!飞马国际6月5日盘中跌幅达5%
- 修路盘活撂荒地 团结共享获丰收 全球热资讯
- 人生不该被定义,西交利物浦大学张云路副教授讲述身边的可能性
- 北京塔里木石油酒店预订_北京塔里木石油酒店
- 推动人才供需 海口市工商联和海经贸签订合作备忘录
- 权威发布!学生购票有变化
- 全球聚焦:今日洛克王国莫迪技能
- 快资讯丨trapcode particular下载_trapcode particular注册码
- 证件的ems快吗(ems快吗) 当前速递
- 宜兴市三木建筑安装工程有限公司_环球讯息
- 环球动态:2021中国好声音11进8在线观看_2021中国好声音11进8
- guest账户是什么意思(guest是什么意思) 焦点关注
- 记者:加尔蒂将离开但穆帅不太可能接任 巴黎在谈B席交易
- 大肉怎么炒还嫩还好吃?|世界观热点
- *ST御银拟收购无锡微研51%股份 切入精密制造行业 最资讯
- 环球头条:中国星辰 | “出差”半年 神十五乘组科学实验创多个“首次”
- 帮助删除不良记录,一客户差点被骗24万元 环球要闻
- 浩云科技:公司现有算力资源存在不足,正在洽谈购买相关算力硬件资源
- 全球头条:安家庄村
- 中国星辰 | 神十五“像流星一样回到祖国怀抱”
- 挑大梁 走在前|对外开放活力更显 科创赛道动能更足——古都西安发展势头强劲
- 山水田园马鞍山村 当前速递
- 环球今热点:于大宝被推倒后出现短暂失忆 被紧急送医
- via s3g unichrome pro_via s3g-全球快资讯
- 公告(中缝)
- 一起玩哟论坛vsmaphack_一起玩哟
- 疯妖记手游2023最新礼包兑换码大全|独家
- 天天快消息!王冕传文言文阅读答案_王冕传
- 应用型本科高校有哪些_应用型本科是什么意思
- 【每日一图@湖南】来株洲渌口杨梅村吃蟠桃不,管饱的那种
- 环球今亮点!周杰为什么退出影坛(周杰为什么被封杀)
- 惠普电脑维修网点查询(惠普电脑维修) 世界快报
- 环球快消息!中国汽车和航空业:崛起的巨头
- 当当快递单号查询在线 当当快递单号查询 天天热推荐
- 北京首笔跨行“带押过户”完成 10多家银行已常态化办理
- 马斯克来了,外交部发声! 最新快讯
- 杨绛留给世人的忠告:当你老了,躺在病床上才明白,世上最亲的,只有两个人|每日资讯
- 比亚迪5月新能源销量翻倍
- 河钢集团:全球首例120万吨氢冶金示范工程一期成功
- 拉斐尔衣柜(关于拉斐尔衣柜的基本详情介绍)
- 火影忍者没有结果四对CP,美好开始悲剧结束,纲手注定终身孤独 今日快讯
- 焦点资讯:吉田直树:《最终幻想16》预告片无剧透 玩家大可放心
- 每日关注!中国星辰 | “带着我的梦想上天宫”,最新回信要来了
- 世界焦点!虹桥公园里,一场“无废”宣传活动吸引市民关注
- 观热点:打印机已暂停是什么原因_打印机已暂停
- 在家里生黄豆芽的方法_在家里怎样生黄豆芽
- 世界聚焦:省疾控中心发布健康风险提示: 高温潮湿季来临 这些疾病要当心
- 懒人找资源_懒人炸酱面
- 天天微资讯!美司法部结束对前副总统彭斯所涉机密文件的调查 不提出指控
- 宽带连接不上是什么原因造成_宽带连接不上是什么原因
- 通达电气:公司监事拟减持不超30万股公司股份_当前视讯
- 《三国志战棋版》首刀属性介绍
- 世界快资讯丨游戏id心形符号_游戏名字符号心形
- 什么是羽叶鬼针草?鬼针草对农作物有什么影响?
- 港股迎强劲反弹 恒指全日升733点
- 蜜饯果脯区别_蜜饯和果脯的区别 蜜饯和果脯有什么区别
- 水果甜度对照表图(水果甜度对照表) 讯息
- 大五座SUV超值定制!魏牌上新摩卡DHT-PHEV 观速讯
- 世界即时:农工党芝罘区基层委开展 “情暖‘六一’ 爱心助学”捐赠活动
- 微信怎么设密码别人开不了(微信怎么设密码) 天天快资讯
- 奥来德(688378.SH):对OLED大型蒸镀设备有进行相关的技术储备及布局
- 2023年法网:张之臻晋级男单32强再度创造历史
- 抱起来边走边干_抱起来日的感觉
- 谷歌Pixel 8注册信息曝光,仍使用传统无线充电协议
- 汽车水箱多久加一次水和防冻液_摩托车水箱加什么?|快看
- 天天时讯:青岛楼市新政:非限购区域首套房首付比例最低调整为20%
- 洋浦开展“检爱同行 共护花开”主题检察开放日活动
- ART021今年首展从“艺览北京”出发,54家展商共同激活艺术市场能量|全球播报
- 天天快播:美国这一重要数据,连降7个月!美媒:债务上限协议达成将带来流动性威胁
- 第三届“北京·国际范儿”短视频大赛启动_焦点速看
- 5系/E级/CT6接连换代,大后驱的豪华车你更看好谁?
- 新余市市场监管局持续开展山茶油专项整治-当前速看
- 世界讯息:2023年5月份中国仓储指数为51.3%
- 辅仁药业集团因销售劣药口服液遭罚,退市辅仁正面临投资者维权|每日快讯
- 今日看点 | 第七届世界无人机大会举行
- 联合石化与中远海能举办主题教育读书班暨党建共建联学 天天热资讯
- 云杰律师事务所相关内容简介介绍 今日热议
- 全球观天下!女的笔顺正确的写法_片字的笔顺正确的写法
- 每日精选:迈克生物(300463):6月1日北向资金增持69.44万股
- 世界快报:振华股份:公司近期钛白粉价格有下行趋势
- 【全球报资讯】各地全力以赴战“夏收”
- 每日热门:2023天津医科大学肿瘤医院博士等人员招聘第二次报名时间安排
- 每日焦点!子女房产过户给父母要交税吗
- 8岁摄影师拍李现是被人抱起来的上热搜 网友:小孩子的作品纯真、干净
- 党费计算公式怎么在excel中使用 党费计算公式-最新
- 【天天时快讯】武汉光谷与深圳南山区签署战略合作
- 淮安中学复读电话(淮安中学复读班是不是很不好) 世界最新
- 【速看料】罗体:阿莱格里得到尤文全力支持,至少将再执教1年
- AI,不只是概念!“吃肉”赛道已出现··· 全球头条
- 出门问问IPO,AI大模型的故事讲通了吗?
- 超性感?裸露部位一览无余,公共场所穿这样真会让人喷鼻血的 环球快资讯
- 阿里巴巴普惠体首发“生僻字字库” 可以免费商用 当前热点
广告
广告
- 各种花样打“功效宣传”擦边球 消炎止血又美白的牙膏真有效吗?
- 黑龙江讷河新增1例确诊4例无症状 病例详情公布
- 浙江宁波余姚奉化宁海三地开展核酸检测 结果均为阴性
- 浙江湖州南浔三处棋牌室经营者被行拘
- 那年今日 | 一张漫画涨知识之12月13日
- 在宁波乘火车跨省出行须持48小时内核酸阴性证明
- 浙江温州一地发现核酸弱阳性?复采复检结果均为阴性
- 浙江三门发现一名密接者:二次核酸检测结果均为阴性
- 贱卖的发电机 新买的制茶机——安徽水电供区改革两周年回访见闻
- 浙江杭州新增1例新冠肺炎确诊病例 为集中隔离人员
- 2022年研考在即,学硕缩招,专硕时代真的来了?
- 探访杭州核酸检测点:排队高峰多在夜间 医院24小时运转
- 浙江发挥零售药店“哨点”作用 织就疫情防控监测网
- 哈尔滨市本轮疫情首批1名确诊患者出院
- 宁波镇海第三轮全员核酸检测574181人 结果均为阴性
- 陕西新增本土确诊病例1例、境外输入无症状感染者2例
- 齐齐哈尔讷河一地调整为中风险地区
- 浙江新增新冠肺炎确诊病例75例 其中本土74例
- 内蒙古新增本土确诊病例5例 均在呼伦贝尔满洲里市
- 黑龙江无新增确诊病例 新增本土核酸检测初筛阳性人员5例










