Stable Diffusion团队放大招！新绘画模型直出AI海报，实现像素级图像生成

2023-04-29 16:04:28 来源：华尔街见闻

开源AI绘画扛把子，Stable Diffusion背后公司StabilityAI再放大招！

【资料图】

全新开源模型DeepFloyd IF，一下获星2千+并登上GitHub热门榜。

DeepFloyd IF不光图像质量是照片级的，还解决了文生图的两大难题：

准确绘制文字。（霓虹灯招牌上写着xxx）

以及准确理解空间关系。（一只猫照镜子看见狮子的倒影）

网友表示，这可是个大事，之前想让Midjourney v5在霓虹灯招牌上写个字AI都是瞎划拉两笔，对于镜子理解的也不对。

使用DeepFloyd IF，可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画，文字都会以合适的字体、风格、排版出现在合理的地方。

这意味着，AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloyd IF以非商用许可开源，不过团队解释这是暂时的，获得足够的用户反馈后将转向更宽松的协议。

有需求的小伙伴可以抓紧反馈起来了。

DeepFloyd IF仍然基于扩散模型，但与之前的Stable Diffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL，结合超分辨率模块中额外的注意力层，获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。‍‍

也就是扩散过程不再作用于表示图像编码的潜空间，而是直接作用于像素。

官方还提供了一组DeepFloyd IF与其他AI绘画模型的直观对比。

可以看出，使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字，AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源，谷歌的几个模型更是连个Demo都不给，DeepFloyd IF就成了更实际的选择。

具体生成图像上DeepFloyd IF与之前模型一致，语言模型理解文本后先生成64x64分辨率的小图，再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上，通过把指定图像缩小回64x64再使用新的提示词重新执行扩散，也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外，DeepFloyd IF的优势还在于，IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中，IF-4.3B取得了最好的FID分数，并达到SOTA（FID越低代表图像质量越高、多样性越好）。

谁是DeepFloyd

DeepFloyd AI Research是StabilityAI旗下的独立研发团队，深受摇滚乐队平克弗洛伊德影响，自称为一只“研发乐队”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

主要成员只有4人，从姓氏来看均为东欧背景。

这次除了开源代码外，团队在HuggingFace上还提供了DeepFloyd IF模型的在线试玩。

我们也试了试，很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多，不过既然开源了，相信在中文数据集上训练好的变体也不会太晚出现。

One More Thing

DeepFloyd IF并不是Stability AI昨晚在开源上的唯一动作

语言模型方面，他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna，基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

作者：关注前沿科技，来源：量子位，原文标题：《Stable Diffusion团队放大招！新绘画模型直出AI海报，实现像素级图像生成》。

风险提示及免责条款市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

Stable Diffusion团队放大招！新绘画模型直出AI海报，实现像素级图像生成

谁是DeepFloyd

One More Thing

上一篇:

赌王最后悔的大概就是没给何超云安排好后路吧 环球焦点

下一篇:

最后一页

Stable Diffusion团队放大招！新绘画模型直出AI海报，实现像素级图像生成

赌王最后悔的大概就是没给何超云安排好后路吧 环球焦点

道孚县气象台发布雷电黄色预警信号【III级/较重】【2023-04-29】_热点聚焦

新潮能源2023年一季度实现开门红 净利润同比增长20.55%-环球最新

全球观速讯丨告别“种牙贵”！单颗种植牙总费用平均价格有望控制在5000-7000元以内

河北青年管理干部学院为师生科普知识产权保护知识-天天头条

健康体检送到一线 贴心服务温暖职工

守得住传统 跟得上新潮

股票行情快报：联盛化学（301212）4月28日主力资金净买入46.43万元

世界百事通！小学生“倒数第一”试卷走红，答案叫人笑不活了，老师：你脚真臭

欧篮斗殴处罚结果：皇马和游击各罚5万欧元 亚布塞莱被禁赛5场-焦点热讯

荥经县多部门联合开展“五一”节前检查|天天视讯

营造无障碍环境 让你我生活更便捷

白酒股去年成绩出炉：茅五洋汾泸营收超2800亿，盈利破千亿 今日看点

【天天热闻】移动8元套餐怎么办理（一个人8元买只鸡9元卖掉）

浓墨重彩造句_浓墨重彩

【环球报资讯】宁远古城历史简介-宁远古城

2013年1月4日_2013年1月28日

美的集团：一季度净利同比增长12.04%

重庆大巴侧翻：20人受伤7人伤势较重_事故原因正进一步调查中

春耕农忙送化肥-世界快播

红宝丽：据了解，万华目前异丙醇胺处于中试阶段

拟上市公司早知道|海峡银行、江河纸业启动A股IPO辅导 快消息

房屋外墙突现大洞，竟是有人凿壁偷蜂蜜

环球速递！4月28日安徽国泰化工聚氯化铝报价平稳

快资讯：赤峰市三措施筑牢文化市场“防火墙”

世界快讯:23.2亿+3.3万㎡现房销售 招商竞得通州东小马6009地块

男子瘫痪20年不能活动，生计全靠一把“镜子”，网友瞧蒙|快看点

特斯拉律师出惊人言论：马斯克的自动驾驶言论可能是深度伪造的

焦点短讯！生态环境部：正制定生物多样性保护战略和行动计划

芭比宝贝的公主裙_芭比宝贝的睡衣晚会

4月28日西北地区地炼汽柴油报价下滑

文县天池镇白马村老田坝安置点基础设施巩固提升工程中标公示

苹果_关于苹果的简介

大连一女子花十万多元买金条 三个多月没拿到

估值320亿！欣旺达汽车电池又有新动作_环球新消息

中海企业：因项目暂未达到付款节点 故20亿绿色票据资金未使用

任家萱怀孕5月出席活动，情绪激动泪洒现场，烧伤13年疤痕仍明显

天天关注：英山实验小学社团学生美术作品展如期开展

中央网信办：重点治理恶意散布“民营企业卖国论”等十类网络乱象

各景区客流升温、广交会喜迎八方客……流动的中国生机勃勃 新资讯

“今日头条”一审败诉“今日油条”：商标保护界限在哪儿

亚洲资源(00899)4月28日起停牌 原因待公布-世界今日报

固态硬盘的缓存是什么意思 缓存是什么意思|焦点速讯

河南投资再引“源头活水” 4146个专项债券项目通过审核 天天亮点

数字中国建设峰会现场观察：AIGC加速产业化 算力网络进入实用阶段_速讯

馆校合作赋能成长 少年智创引领未来

天天微动态丨张组词_汉字张组词

多场景奶爸车问界M7,实力真的不是吹的!-世界速递

西安到壶口瀑布自驾多长时间(西安市到壶口瀑布多少公里自驾)

当前滚动:指头海兔螺

【世界时快讯】拥抱新经济！港交所迎来上市改革5周年

焦点热门:M-罗德里格斯谈自己的告别赛：梅西在邀请之列，希望他到时能参加

首批通过“精子机器人”制造的婴儿出生-当前热门

狗狗多动症的表现（多动症的表现）-热门

天天快资讯丨2023“一带一路”高校联盟论坛 在兰州大学举办

天天速读：多只迷你基金年内出彩，投资布局需辩证看待“清盘警报”

三七互娱: 关于第三期员工持股计划存续期展期的公告

数据复盘｜主力加仓非银金融、汽车等行业 龙虎榜机构抢筹福昕软件、杭可科技

热资讯！廖仲芳

古浪：科技添动力 培训进牛场_全球最新

擦亮三大名片，青浦泖甸村书写精彩美丽乡村答卷|世界热文

“创领共生”——赛默飞全面升级在华发展承诺|焦点资讯

水浒中晁盖为什么叫托塔天王的原因（水浒中晁盖为什么叫托塔天王） 世界热议

忆王孙·广庭云汉晚昭回-百事通

全球微速讯：河北邯郸线上线下多措并举促就业

玛丽奥特曼污_玛丽奥特曼 当前观察

环球聚焦：小米神机官宣5月9日发布：标准版搭载骁龙7+ Gen 2芯片

火星神童_火星神童_即时

全球快消息！王一博《长空之王》预售票房破亿 4月28日全国上映

广东台山：食品安全“两个责任”督导促学校食堂“华丽变身”_每日播报

快讯丨北京：2023年计划新开大型商业设施23个面积约240万平米_全球热闻

69元买个壳？当代中国少女，被花知晓迷晕了_聚焦

赌王最后悔的大概就是没给何超云安排好后路吧环球焦点

赌王最后悔的大概就是没给何超云安排好后路吧环球焦点

新潮能源2023年一季度实现开门红净利润同比增长20.55%-环球最新

健康体检送到一线贴心服务温暖职工

守得住传统跟得上新潮

欧篮斗殴处罚结果：皇马和游击各罚5万欧元亚布塞莱被禁赛5场-焦点热讯

营造无障碍环境让你我生活更便捷

白酒股去年成绩出炉：茅五洋汾泸营收超2800亿，盈利破千亿今日看点

拟上市公司早知道|海峡银行、江河纸业启动A股IPO辅导快消息

世界快讯:23.2亿+3.3万㎡现房销售招商竞得通州东小马6009地块

大连一女子花十万多元买金条三个多月没拿到

中海企业：因项目暂未达到付款节点故20亿绿色票据资金未使用

各景区客流升温、广交会喜迎八方客……流动的中国生机勃勃新资讯

亚洲资源(00899)4月28日起停牌原因待公布-世界今日报

固态硬盘的缓存是什么意思缓存是什么意思|焦点速讯

河南投资再引“源头活水” 4146个专项债券项目通过审核天天亮点

数字中国建设峰会现场观察：AIGC加速产业化算力网络进入实用阶段_速讯

馆校合作赋能成长少年智创引领未来

天天快资讯丨2023“一带一路”高校联盟论坛在兰州大学举办

数据复盘｜主力加仓非银金融、汽车等行业龙虎榜机构抢筹福昕软件、杭可科技

古浪：科技添动力培训进牛场_全球最新

水浒中晁盖为什么叫托塔天王的原因（水浒中晁盖为什么叫托塔天王）世界热议

玛丽奥特曼污_玛丽奥特曼当前观察

泛化是什么意思名词解释泛化是什么意思

艾迪药业：艾邦德?复邦德?上市发布会顺利召开填补我国抗艾新药领域空白

蔚蓝档案知世技能是什么蔚蓝档案知世技能介绍|焦点热闻

上期所原油期货夜盘收跌4.18%，报532.1元/桶：上期所原油期货夜盘收跌4.18%，报532.1元/桶。沪金收跌0.13%，沪银收涨0.07%。环球播资讯

关注过程还是结果？环球热文

【世界报资讯】中集车辆(01839)Q1业绩实现“开门红” 归母净利润4.79亿元同比增长285.25%

国家疾控局：“五一”出行时做好这两个方面准备全球播报

美了乡村富了乡亲！这些特色产业赋能乡村振兴世界快消息

银宝山新（002786）4月26日主力资金净买入22.50万元每日观察