足球下赌注app体育官方全站app-综合赛事平台-足球下赌注官方全站app就拿最浅显的给图像换心绪来说-足球下赌注app体育官方全站app-综合赛事平台
新闻中心
你的位置:足球下赌注app体育官方全站app-综合赛事平台 > 新闻中心 > 足球下赌注官方全站app就拿最浅显的给图像换心绪来说-足球下赌注app体育官方全站app-综合赛事平台
足球下赌注官方全站app就拿最浅显的给图像换心绪来说-足球下赌注app体育官方全站app-综合赛事平台
发布日期:2025-04-13 11:40    点击次数:56

足球下赌注官方全站app就拿最浅显的给图像换心绪来说-足球下赌注app体育官方全站app-综合赛事平台

有一说一,前几天就也曾立冬了,眼瞅着又快到年底了当今。

搁往年的情况,到了年底这才到各大厂商纷纷发力的时候,年关快要嘛,总得搞出点啥新东西,给寰球涨涨眼界。

 固然说最近对于 AI 的新音问不是好多,然而东说念主家这段时刻确定也没闲着,这不,一个多月前,也即是 925 那天咱们才跟寰球说了豆包的视频生成,这两天,豆包又又又上新了新功能。

浅显来说,这回豆包维持 “ 一句话编订修改图片 ” 了。

固然文生图也曾搞了两三年,但这回,我敢说真算是国产 AI 文生图里的新冲突了。

可能不少差友还合计, AI 生图不是也曾挺锋利的了嘛,如何还不成修改图片?

践诺上,咱们这几年也测了不少文生图大模子了,维持图片精确修改的还真莫得,目下作念的最佳的真即是豆包。

 就比如说 ChatGPT-4o ,你让他画个打篮球的东说念主还可以,然而你要念念改换一下,把环境换成沙滩,不好趣味趣味,整张图都变了。

不啻 OpenAI 的不行,谷歌的 Gemini 也一样。

原本说让它把图中的鸡变成鳄鱼,终端不仅没变成,还把布景给全改了,两次的篮球也完全不一样。

拿 AI 我方生的图搞都这样,更别说土产货上传的相片了。

就拿最浅显的给图像换心绪来说,即使在豆包昔日的版块里,这种成果也不睬念念。

比如咱们径直把 925 活动里,给脖子哥拍的相片传上去,然后告诉豆包,你给我把脖子哥抱着的小白狗换成小黄。

终端即是,整张图都变了,立场大变就算了,构图也不一样。

然而当今,这回用上这个上新了的豆包,一样的相片一样的教导词,你再望望:

滑动稽察AI成果

固然有极少点小舛错,但要跟前边的一比,是不是险峻立判!

 不但保留了脖子哥的算作,心绪,小狗的体式也跟上传的图差未几,说换成黄色就换黄色,极少不蒙眬。

再来试试图像摒除,成果也可以。

Prompt: 帮我生成图片:摒除白色小狗

发现没,这个文生图变得智能了,它能识别出相片里的内容,你念念修改啥他就只改啥,那儿差异改那儿, so eazy! 

况兼不仅能作念到识别,修改心绪,摒除物品这些基本功能,你念念整点复杂的也一样可以。

比如更换图片的布景。

咱们把差评硬件部视频里,米罗的相片传上去,然后叫豆包把咱们的拍摄间布景改成上海陆家嘴。

Prompt: 帮我生成图片:布景换成陆家嘴

哎嘿!还真就换成了,纸张的折痕还都极少没变。

 你以致可以分得清布景里,哪个是 “ 开瓶器 ” 环球金融中心;哪个是 “ 打针器 ” 金茂大厦;哪个是 “ 打蛋器 ” 上海中心大厦,陆家嘴三件套安排的清走漏楚。不知说念的荒谬第一眼看去,还真以为咱们公司搬到浦东了。

除了这些现实中存在的场景,科幻作品中念念象的东西,这回豆包也大略生成。

咱们让豆包把米罗改变成战锤 40K 立场,终端亦然相当的 amazing 啊,固然换了个东说念主种,然而五官还算蒙眬能看出米罗的影子,如果戴上面盔,真就跟星际战士一样了。

Prompt: 帮我生成图片:穿戴换成战锤40K装甲,手拿激光炮

更勤恳的是,固然东说念主物的着装和立场变了,但图片前边的桌子,跟布景的墙壁、窗帘、挂画可都是极少没动。

就这个成果,你要不跟别东说念主说,谁知说念这到底是 AI 生成如故 PS ,一眼望去是真分不清。

 不外,在东说念主物测试中咱们还发现,如果你拿AI 生成的图进行修改,成果比用相片还要强上不少。

你比如就说,咱们先生成一张屏幕前诸君彦祖的日系写照,然后告诉豆包,把彦祖的衬衣换换心绪。

Prompt: 帮我生成图片:穿戴心绪换成棕色

你瞅瞅,脸部的细节,头发的细节,以致背后墙砖上的纹理,迢遥的电线杆子,都极少没动,说换装就换装,那叫一个干净利落。

 天然了,用东说念主像演示如故为了测试它在东说念主脸细节上的主理本事,毕竟东说念主脸这玩意,一但生成的不好,就会产生恐怖空闲谷效应,一眼盯果然事。

戴珍珠耳饰的青娥都见过吧,天下名画,咱们让豆包给你把东说念主脸换成猫脸版块,来望望它对跨物种的面部和会作念的咋样。

Prompt: 帮我生成图片:把东说念主脸换成猫

终端举座瞅下来,发扬如故相当可以。不但保留了头饰、穿戴纹理的细节,小猫耳朵这块也贬责的很好,没穿模,径直能拿去当微信头像用了。

除了相片东说念主像这些,物品啥的表面上会更容易,然而咱们还得测,譬如说汽车。

咱们把一张巨匠 CC 的相片传上去,让它给换成飞驰。

Prompt: 帮我生成图片:车头换成飞驰

终端也还行,前脸一套都改成了飞驰 C260 ,如故现金的,其他的像车身心绪,周围的环境,也都没变。

但遇上了多东说念主物,复杂场景的情况下,豆包又会发扬成啥样呢?

 就像刘华强买瓜这段,咱今天就把这个换成刘华强买炸鸡和棉花。

终端成果还怪好嘞,瓜街市穿戴上的图案都一模一样,扫数的西瓜都改掉了,特奢睿。

Prompt: 帮我生成图片:把西瓜换成棉花和炸鸡

还有一个重心是,如果同期给豆包不同的修改条目,它能不成沿途完成。

就比如,西纪行里的唐三藏,我念念给改成战地版唐三葬,给的教导一句话里有三个指示,同期要完成戴墨镜,拿机枪,换布景,三样任务。

滑动稽察AI成果

Emmm ,终端如故沿途都完成了,成果也可以。墨镜一戴谁也不爱,身处战场手拿机枪,一干二净贫铀弹,一息三千六百转,杀生为护生,斩业非斩东说念主,主打一个物理超度。

概述来看的话,不啻相片、视频截图,包括在制作梗图心绪包这一块,豆包都大略手到拿来,即便细节上还能发现可以普及的处所,但话又说转头,不怕东说念主比东说念主,生怕货比货嘛。

 就目下来说,比起昔日的文生图模子,如实是高的不知说念那儿去了。

看到这可能有差友就要问了,世超鸽鸽,为啥豆包此次顷刻间就跟换了个姆妈生的一样,比之前奢睿了这样多?

该说不说,这内部如实有门说念。

这样说吧,咱们昔日用的文生图模子,基本用的都是 Diffusion 期间,是先把图片一步步变糊,然后反向分析如何从糊到走漏,从而产生新的图像。

 但问题是,在这个进程中,模子生成图像是基于全局信息的,要念念局部修改,不好趣味趣味,举座王人备要重来,是以每次生成的都不一样,也没法在细节上再调遣。

咱们这两年也测了不少文生图模子,咋说呢,东西是没问题,可以生成,但都没法一模一样的,准确回话出念念象中阿谁样貌,就比如这种:

而那些 AI 艺术家们,搞出来的都是底下这种,细节拉满,跟电影截图似的。而那些 AI 艺术家们,搞出来的都是底下这种,细节拉满,跟电影截图似的。

是不是嗅觉跟东说念主家用的都不是一个软件?

图源:Mac Baconai , “Al 的异星 cult 幻念念之城 ” 

可要竣事东说念主家这种成果,教导词弄的就得巨复杂,还要微调很久很久,以致他们还编纂了专门的教导词辞典。大伙如果没训练过这个,践诺上就很难作念好图,更别说把我方的相片传上去编订了。

如果能像画画一样,那儿差异改那儿,缓缓成型就好了。

而豆包此次更新的,恰是这个标的。为了竣事图片编订的成果,豆包此次的文生图遴选的是 SeedEdit 模子。

比拟仅仅通过笔墨生成,这玩意更微操,它会把图片的贯通和生成和会到一个调理的大模子框架里,从而在生成和编订图像的时候,可以事无巨细的参考咱传上去的图像,完事儿为止的就相对精确,况兼出来的图片也更天然。

 打个譬如,如果说昔日的文生图模子是冷凌弃泼墨画匠, SeedEdit 就更像画笔小巧,有创造力的画家。践诺咱们上面用下来,可以说成果如实相当可以。

践诺上, SeedEdit 这样的期间,目下行业内也刚运转用,能集成在 AI 助手里的,豆包其实是第一家。

而像 AI 编订图片这种标的,当今早就也曾是是图片编订行业的标配,各式修图软件、裁剪软件以致手机相册里都在作念。

 然而先不说成果,起码当今其实大遍及产物都如故要手动涂抹修改,或者我方在上面 P 图,加配饰,不知说念大伙如何合计,我归正每次 P 布景,摒除东说念主物,都得花不少功夫。。。

至于 AI 径直出的图嘛,咱上面也说了,跟抽卡似的,很难一次就有理念念的图,还没法再二次修改。

这也即是为啥咱开始就说,由 AI 径直为止的编订修改图片,会是一个期间冲突了。

换句话说,这个期间不仅改变的是 AI 文生图,其他的相片修改、视频裁剪啥的,基本王人备能用获取。

到时候,径直跟语音助手说一声给我出图!AI 就帮你往你念念的标的调遣,好意思好意思当甲方,念念念念都爽。

职守编订:若风

著作内容举报足球下赌注官方全站app

]article_adlist-->   声明:新浪网独家稿件,未经授权袭击转载。 -->