您的当前位置:首页 > 知识 > “再生”达利+机器人瓦力,文字生成图片的AI升级版来了 正文
时间:2025-07-08 04:34:50 来源:网络整理 编辑:知识
澎湃新闻记者 邵文这是一张AI系统DALL-E 2根据文字描述“戴着贝雷帽和穿黑色高领毛衣的柴犬”Shiba Inu dog wearing a beret and black turtleneck)
原标题:“再生”达利+瓦力,再生文字生成图片的达利AI升级版来了!
澎湃新闻记者 邵文
这是机器一张AI系统DALL-E 2根据文字描述“戴着贝雷帽和穿黑色高领毛衣的柴犬”(Shiba Inu dog wearing a beret and black turtleneck)生成的图像。
时隔一年,人瓦DALL-E的力文升级版来了!
当地时间4月6日,字生人工智能研究机构OpenAI发布DALL-E 2(文本到图像生成程序)。成图DALL-E 2具有更高分辨率和更低延迟,升级精确度改善了71.7%,再生写实度改善了88.8%,达利解析度更是机器原本的4倍,还可结合概念、人瓦属性及风格打造更生动的力文图像,如以莫奈(Claude Monet)的字生风格画出草原上的狐狸。
同时新增两大功能:更细颗粒度的成图文字局部修改图像,以及生成原图的多重风格变体。
前者比如这样!
在原图的2区域增加一个火烈鸟游泳圈
上下分别为在原图的1区域和2区域增加一个小狗
DALL-E 2在更细的层面上应用DALL-E的文本到图像的能力。用户可以从现有的图片开始,选择一个区域,并告诉模型如何来修改它。模型可以填充(或删除)物体,同时考虑到阴影方向、反射与质地等细节。
后者比如这样!
以同一张图像为基准,建立不同风格或编排的版本。
生成的图片是1024 x 1024像素,比原始模型提供的256 x 256像素有了飞跃
DALL-E的名称来自于艺术家萨尔瓦多·达利(Salvador Dalí)和《机器人总动员》的主角WALL-E,第一版于2021年1月首次亮相。DALL-E奠基在具备1750亿个参数的GPT-3模型上,但它仅使用120亿个参数,利用一个文字与图像配对的资料集,以文字叙述来产生图像。
萨尔瓦多·达利(Salvador Dalí)
《机器人总动员》的主角 机器人WALL-E(瓦力)
OpenAI研究科学家Prafulla Dhariwal表示:“DALL-E 1只是从语言中采用了GPT-3方法,并将其应用于生成图像:我们将图像压缩成一系列单词,然后学会预测接下来的内容”。
但是单词匹配并不一定能捕捉到人类认可的重点,而且预测过程限制了图像的真实性。于是用CLIP(OpenAI去年发布的计算机视觉系统)来观察图像,并以人类的方式总结它们的内容。
DALL-E系统根据文字“牛油果型的扶手椅”自动创作的部分图像
CLIP是原版DALL·E功能实现的基础,DALL-E 2则结合了CLIP和扩散模型两种技术的优点。DALL·E图像生成的“扩散”(diffusion)过程可以理解为从“一堆点”出发,用越来越多的细节把图像填充完整。扩散模型的特点在于,在牺牲多样性的前提下,能大大提升生成图像的逼真度。
DALL-E 2根据“Teddy bears mixing sparkling chemicals as mad scientists, steampunk.”描述生成的图像
为避免生成的图片被滥用,目前OpenAI已经实施了一些内置的保护措施。
该模型在已剔除不良数据的数据集上进行训练,将由经过OpenAI审查的合作伙伴进行测试,用户被禁止上传或生成“非G级”和“可能造成伤害”的图像,以及任何涉及仇恨符号、裸体、猥亵手势,或“与正在发生的重大地缘政治事件有关的重大阴谋或事件”的图像。
该模型也无法根据姓名生成任何可识别的人脸,即使要求的是“”之类的内容。同时,DALL·E 2 在生成的图片上都标有水印,以表明该作品是 AI 生成的。理想情况下这些措施可以限制其产生不良内容的能力。
与之前一样,该工具并未直接向公众发布。但研究人员可以提交申请预览该系统,OpenAI希望以后将DALL·E 2纳入该组织的API工具集中,使其可用于第三方应用程序。
Dhariwal说道,“我们希望分阶段进行这个过程,以从获得的反馈中不断评估如何安全地发布这项技术。”
责任编辑:李跃群
18部门:建立实施数据安全管理认证制度 提升企业数据安全和个人信息保护能力2025-07-08 04:22
陈才东兴业银行香港分行行长任职资格获批2025-07-08 04:09
两城发放中国首批自动驾驶全无人商业运营牌照,百度独家获批2025-07-08 04:05
接力贷重出江湖2025-07-08 03:51
英媒:越来越孤立于世界的不是中国,而是美国2025-07-08 03:48
山西:4起煤矿事故批复结案 对77名责任人追责问责2025-07-08 03:23
大摩“大空头”:美股只看到通胀见顶对加息的影响,低估了风险2025-07-08 03:09
顾客超市买金锣火腿生蛆获10倍赔偿2025-07-08 03:01
Mysteel解读:连粕4100-4200点关口盘旋 豆粕现货价格凸显压力2025-07-08 02:58
最新规划!佛山全域纳入广州都市圈!深圳都市圈含金量升级2025-07-08 02:15
全球最贵药物再易主!美国FDA批准血友病基因疗法 一针350万美元2025-07-08 04:30
美联储加息预期再度升温 股指重回振荡区间2025-07-08 04:19
韩媒:55名泰国游客在济州岛脱团失踪2025-07-08 04:19
中国大豆产业协会会长杨宝龙:大豆系列期权的上市将与期货合力搭建起大豆产业完整的风险管理工具体系2025-07-08 03:50
美国11月Markit服务业、制造业PMI初值均不及预期 经济存在进一步陷入衰退可能2025-07-08 03:43
国联证券子公司卷入龙力生物造假案,遭投资者联合起诉索赔2025-07-08 03:32
新东方在线跌超9%,泡泡玛特、奈雪、阿里巴巴、知乎、蔚来跌超4%2025-07-08 03:04
美国国会山里藏着众多“股神”2025-07-08 02:40
花旗上调港股评级,华尔街集体呼吁“买入中国”!2025-07-08 02:39
大摩:维持电能实业与大市同步评级 目标价上调至53港元2025-07-08 02:24