梦晨发自凹非寺量子位 | 公众号 QbitAI

(资料图片)

开源AI绘画扛把子，Stable Diffusion背后公司 StabilityAI 再放大招！

全新开源模型 DeepFloyd IF ，一下获星2千+并登上GitHub热门榜。

DeepFloyd IF不光图像质量是 照片级 的，还解决了文生图的两大难题：

准确绘制文字 。（霓虹灯招牌上写着xxx）

以及 准确理解空间关系 。（一只猫照镜子看见狮子的倒影）

网友表示，这可是个大事，之前想让Midjourney v5在霓虹灯招牌上写个字AI都是瞎划拉两笔，对于镜子理解的也不对。

使用DeepFloyd IF，可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画，文字都会以合适的字体、风格、排版出现在合理的地方。

这意味着，AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloyd IF以非商用许可开源，不过团队解释这是暂时的，获得足够的用户反馈后将转向更宽松的协议。

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloyd IF仍然基于扩散模型，但与之前的Stable Diffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌 T5-XXL ，结合超分辨率模块中额外的注意力层，获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了 像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间，而是直接作用于像素。

官方还提供了一组DeepFloyd IF与其他AI绘画模型的直观对比。

可以看出，使用T5做文本理解的 谷歌Parti 和 英伟达eDiff-1 也都可以准确绘制文字，AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源，谷歌的几个模型更是连个Demo都不给，DeepFloyd IF就成了更实际的选择。

具体生成图像上 DeepFloyd IF 与之前模型一致，语言模型理解文本后先生成64x64分辨率的小图，再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上，通过把指定图像缩小回64x64再使用新的提示词重新执行扩散，也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外，DeepFloyd IF的优势还在于，IF-4.3B基础模型是目前扩散模型中 U-Net部分有效参数是最多的 。

在实验中，IF-4.3B取得了最好的FID分数，并达到SOTA（FID越低代表图像质量越高、多样性越好）。

是DeepFloyd

DeepFloyd AI Research是StabilityAI旗下的独立研发团队，深受摇滚乐队平克弗洛伊德影响，自称为一只“研发乐队”。

主要成员只有4人，从姓氏来看均为东欧背景。

这次除了开源代码外，团队在HuggingFace上还提供了DeepFloyd IF模型的在线试玩。

我们也试了试，很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多，不过既然开源了，相信在中文数据集上训练好的变体也不会太晚出现。

One More Thing

DeepFloyd IF并不是Stability AI昨晚在开源上的唯一动作

语言模型方面，他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna，基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

Deepfloyd IF在线试玩： https://huggingface.co/spaces/DeepFloyd/IF

代码： https://github.com/deep-floyd/IF

StableVicuna在线试玩： https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载： https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接： [1]https://deepfloyd.ai/deepfloyd-if [2]https://stability.ai/blog/deepfloyd-if-text-to-image-model [3]https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot [4]https://stable-diffusion-art.com/how-stable-diffusion-work/

推荐内容

播报：Stable Diffusion团队放大招！新绘画模型直出AI海报，像素级生成

2023-04-29
天天观焦点：中国军舰搭载第二批人员抵达沙特，包含272名中国公民

2023-04-29
郑源的歌曲大全_郑源沈丹丹环球关注

2023-04-29
优时颜快闪店开启科技感抗衰体验

2023-04-29
买SUV送MPV座椅！试驾魏牌蓝山DHT-PHEV-当前看点

2023-04-29
子比主题7.1破解版免授权，支持WordPress6.2

2023-04-29
环球最新：香港金管局：会继续与内地当局及金融业界合作进一步发展香港的离岸人民币市场

2023-04-29
云南省红河哈尼族彝族自治州河口瑶族自治县2023-04-29 15:42发布大风蓝色预警-当前短讯

2023-04-29
酒鬼酒年度净利首破10亿，策略调整致一季度业绩承压

2023-04-29
香港金管局：继续与内地当局及金融业界合作，进一步发展香港的离岸人民币市场

2023-04-29
错峰夜间游，扑面烟火气！“五一”京城夜游地图请收好

2023-04-29
环球最资讯丨海南省文昌市发布雷雨大风橙色预警

2023-04-29
二甲基硅油商品报价动态（2023-04-29）-焦点滚动

2023-04-29
环球资讯：腰椎疼痛是什么原因特别是躺在床的时候（腰椎疼痛是什么原因）

2023-04-29
50个产业园 40个产业集群 200个产业强镇！农业国字号名单公布

2023-04-29
天天微资讯！vivo X Fold2 | X Flip开售，惊喜不断，让人爱上折叠屏

2023-04-29
瓦窑堡念pu还是bao_瓦窑堡

2023-04-29
天天速看：青年音乐剧演员孙博病逝，曾出演多部三宝音乐剧

2023-04-29
焦点热议:罕见！林依晨老公爆带美模回家，林依晨6声明呛：只有黄金鼠

2023-04-29
超预期，新机遇

2023-04-29
环球热点！拂了一身还满mp3（拂了一身还满）

2023-04-29
告别五福一安！iPhone 15支持27W快充

2023-04-29
中国针纺服装名城南昌青山湖区上演《华服霓裳》走秀_环球今热点

2023-04-29
环球快播：职工创新方法，攻克“悬挑泳池”施工技术难题

2023-04-29
户县机场老马家烧烤_户县机场

2023-04-29
槙岛圣护死在哪里_槙岛圣护

2023-04-29
湖人大胜淘汰灰熊，来看赛后哈姆、老詹、浓眉、里弗斯说了什么？天天短讯

2023-04-29
欢迎回家！首架接返343名从苏丹撤离中国公民临时航班抵京_世界短讯

2023-04-29
2023上海车展：奥迪S4 Avant正式首发亮相_今日看点

2023-04-29
天天通讯！马德里网球公开赛：阿尔卡拉斯三盘涉险过关

2023-04-29
子曰君子食无求饱居无求安敏于事而慎于言的意思（子曰君子食无求饱居无求安敏于事而慎于言）-当前滚动

2023-04-29
公司事件点评报告：业绩超预期，冲刺200亿大关_焦点速看

2023-04-29
从AWE看箭牌家居式智能化：何以成就全球智慧家居大家

2023-04-29
怡口净水荣获2023德国iF及红点设计双项国际大奖

2023-04-29
AWE智能卫浴齐争辉，箭牌展现“人文卫浴”新高度

2023-04-29
全球即时：能否会师？马刺旧将朗尼-沃克&德里克-怀特代表湖凯均晋级下一轮

2023-04-29
世界快播：蒜蓉生菜的做法步骤_蒜蓉生菜

2023-04-29
多面空心球商品报价动态（2023-04-29）今日聚焦

2023-04-29
你看，你看，贾跃亭的脸悄悄地在改变天天热议

2023-04-29
3d、快八、排列3第23108期晒票：如果无能为力，那就顺其自然

2023-04-29
“五一”去哪儿，来北京八大处公园品高山白茶

2023-04-29
【世界热闻】相声演员李建华去世，搭档蔡明悼念世间再无“马大姐夫”

2023-04-29
【全球聚看点】“突破与振兴——大型全息红色经典传唱音乐会”举行

2023-04-29
焦点滚动:海贼王：七武海被五老星废除的原因曝光，原来是因为和平主义者

2023-04-29
焦点信息:市场监管总局开展2023年涉企违规收费整治工作

2023-04-29
环球微速讯：节日管控“不打烊”，金水区执法局建筑垃圾整治不停歇

2023-04-29
实时：深圳地铁8号线二期全线轨通

2023-04-29
红坛添囍，品馥郁深情酒鬼酒X湖南卫视《中国婚礼——好事成双季》即将首播！

2023-04-29
青青子衿悠悠我心什么意思_青青子吟悠悠我心

2023-04-29
每日热文：生态环境部：5月上半月全国大部空气质量以良至轻度污染为主

2023-04-29
工信部官员：加强顶层设计加快元宇宙产业创新发展

2023-04-29
业务规模继续提升兰州银行一季度营收、净利润增逾一成

2023-04-29
环球关注：调查显示近四分之三的美国华裔曾遭受种族歧视

2023-04-29
当兵的要求学历是多少女生（当兵的要求学历）_天天观察

2023-04-29
福州郊区，央企保利拿块地盖别墅，度假房如何

2023-04-29
字节跳动为何执着于“种草”？-全球播资讯

2023-04-29
孟慧圆我们的歌_孟慧圆-世界即时看

2023-04-29
郎溪县：建强党建指导员队伍激活非公党建“红色内能”

2023-04-29
安全鞋_关于安全鞋的介绍

2023-04-29
煮罗非鱼是冷水下锅吗煮罗非鱼是不是冷水下锅

2023-04-29
买回来的铁树怎么种植买回来的铁树如何种植-世界热门

2023-04-29
2023年一季度福建省GDP出炉_天天热点

2023-04-29
包拯的后代现在在哪里_包拯的后代世界简讯

2023-04-29
SYNC+智联系统2.0升级，全新林肯冒险家为旅行带来更多乐趣

2023-04-29
滴滴退市后发布年报：2022年营收下降19% 净亏损收窄52% 全球今头条

2023-04-29
每日资讯：广州二孩及以上家庭公积金首套贷款最高限额拟上浮30％

2023-04-29
西南证券：给予科锐国际买入评级世界新消息

2023-04-29
世界滚动:猴头菇饼干真的养胃么_猴头菇饼干

2023-04-29
增资加码分享中国发展红利

2023-04-29
构建区校教师数字素养提升联动模式

2023-04-29
【聚看点】肤革充盈的意思（充盈的意思）

2023-04-29
群英荟“翠”！莲花街道打造深圳首条咖啡风情特色街区-世界看热讯

2023-04-29
攀岩世界杯韩国首尔站：中国队收获一银一铜

2023-04-29
天天新资讯：利好湖人！灰熊最强射手缺战，系列赛在场净胜39分

2023-04-29
清河吧最新招聘信息_清河吧每日焦点

2023-04-29
全球速读：“五一”假期南昌地铁全线网运营时间延长至23:30

2023-04-29
环球微资讯！relaxed是什么意思_relaxed与

2023-04-29
环球微资讯！高频振荡呼吸机_关于高频振荡呼吸机简述

2023-04-29
关注：多彩活动庆“五一” 山西景区盛装迎客来

2023-04-29
中国气象局：“五一”假期全国大部地区适宜旅游出行

2023-04-29
第十三届中国舞蹈“荷花奖”古典舞评奖在沈阳圆满落幕

2023-04-29
文旅业提前进入市场消费“夏天” 围绕特色旅游IP打造活动

2023-04-29
“五一”假期临近各地全力确保旅客安全出行-世界实时

2023-04-29
圆明园门票史上首次被抢光提醒五一游都要“悠着点”

2023-04-29
“五一”假期，让“绿色消费”引领新风尚

2023-04-29
环球速讯：线上购物和餐饮物流持续旺盛餐饮领域物流需求增长约13%

2023-04-29
世界要闻：股票行情快报：佳缘科技（301117）4月28日主力资金净买入298.82万元

2023-04-29
天天即时：太湖水位近10年同期最低——再次提前！引江水为太湖“解渴”

2023-04-29
世界即时：股票行情快报：炜冈科技（001256）4月28日主力资金净卖出90.80万元

2023-04-29
焦点播报:曝青木认为在曼联复出已无望！拿8万周薪家中待业，承认咎由自取

2023-04-29
动态：国海证券给予深圳机场增持评级，2023年一季报点评：业务恢复领先，1Q同比减亏

2023-04-29
国有六大行一季度日赚近40亿：3家净利增速不足1％，净息差下行压力犹在_速看

2023-04-29
天天简讯:prep是什么词性_prep

2023-04-29
环球热消息：华为终于放下高端架子，P系列手机跌幅已超1400，这次真良心

2023-04-29
长沙住房“商转公”新政发布 5月15日起全面实行世界速读

2023-04-29
政府警示、学校停课：亚洲多地四月最高气温创历史新高新资讯

2023-04-29
“五一”假期旅游市场将迎高峰预计旅游人次达24000万人次

2023-04-29
全球热议:“四驾马车”快速扩张，老百姓2023年一季度营收、扣非净利润同比增长均超30%

2023-04-29
全球看热讯：北方导航：4月28日融资买入969.06万元，融资融券余额7.85亿元

2023-04-29
“多网合一”助力社区治理焦点速讯

2023-04-29