开云(中国)kaiyun网页版登录入口

开云体育(中国)官方网站若是立场标签不够精确-开云(中国)kaiyun网页版登录入口

AI 生图新冲破!一个模子同期汲取文本和图像输入。

新模子 FLUX.1 Kontext 使用流匹配架构(Flow Matching),不再是文本编码器和扩散模子各干各的,与此前期间皆不同。

最来自之前很火的 Black Forest Labs,官方泄露这一次能作念到真的的凹凸文生成和裁剪。

在裁剪才能上,有东谈主在知名的奥特曼纷扰照上 P 了一个小绿龙。

在生成才能上,有网友测试的猩猩打羽毛球细节也很丰富。

具体来说 FLUX.1 Kontext 有 4 个特色:

变装一致性:可跨场景保留元素

局部裁剪:只针对特定部分而不影响其余部分

立场参考:以现存立场生成新场景

交互速率:以最小蔓延进行迭代

此次提供两种模子,专科版 FLUX.1 Kontext [ pro ] 更合适快速迭代,可基于之前的裁剪

最高配版 FLUX.1 Kontext [ max ] ,在革职请示、翰墨排版和一致性有所擢升。

同期推出官方试玩平台 Flux Playground,两种型号皆不错采取

此外敞开权再版 FLUX.1 Kontext [ dev ] 提供内测。

请示词手段

第三方平台 Replicate 对 FLUX.1 Kontext 作念了详备测试,论断是比 OpenAI 的 4o 遵循更好,还更低廉,图像也不会偏黄。

测试解释中还针对不同功能给了请示词手段。

图像裁剪

当裁剪东谈主物时,不管蜕变大小,东谈主物的身份特征皆会保留。

关于立场迁徙任务,也能保留东谈主物的基本特征。

关于更复杂的更动,举例添加东谈主物或更动配景,需要分几步形色每项修改,惟有每次蜕变不太复杂就不错获取好的遵循。

立场迁徙

立场迁徙任务至少具体到"印象派画图"或"水彩素描",带上具体的派别艺术家遵循更好,如"文艺回话"或" 20 世纪 60 年代的波普艺术"。

若是立场标签不够精确,那就形色一下关节特征,举例"昭彰的笔触、安祥的脸色质感和丰富的色调深度"。若是思保留某些元素,也需要明确施展,如"保执原始构图"。

总之,形色的越具体遵循越好。

文本裁剪

维持往图上新增文本、删除文本,致使定位到已有文本修改。

处理文本时的一些手段:

使用易读的字体,过于艺术化的字体推崇欠安

明确施展要保留哪些本色。若是保留字体神志很进攻,请务必说起

尽可能匹配裁剪前后的文本长度。长度的大幅变化可能会改变布局

此外凭据网友测试,FLUX.1 Kontext 还不错删除文本,如把电影海报上的字全去掉。

变装一致性

在连气儿裁剪时,领先要明确东谈主物,然后施展哪些方面发生了变化,不管是场景、行为照旧立场。

若是思让并吞个东谈主物赓续存在,需要施展哪些方面需要保留:面部、样子、衣饰或其他任何进攻方面。

在裁剪配景和场景的同期保执变装的一致性需要详备形色,以保执东谈主物处于换取的位置、比例或姿势。

节略的请示偶然会留住太多朦胧的处所,如"把他挪到沙滩上",就不如:

将配景换成海滩,同期保执东谈主物位置不变,保执换取的主体位置、拍摄角度、取景和视角。只需替换东谈主物周围的环境即可。

其他手段

终末,Repilicate 还对使用 FLUX.1 Kontext 的请示词手段作念了一个追忆:

使用昭彰、详备的话语。准细则名颜色,精确形色视觉元素,并选拔告成的算作动词。幸免使用"使其更好"之类的朦胧词语。

将复杂的裁剪领悟成更小的尺度。按规章进行操作,更容易搞定较大的变更。

明确哪些部分应该保留。使用"同期保执换取的面部特征"或"保管原始构图"等短语来保护关节元素。

使用形色性短语,举例"留着玄色短发的女东谈主"或"红色汽车"。幸免使用代词。

裁剪文本时使用引号,举例,"将‘ x ’替换为‘ y ’"

明如实现构图 :裁剪场景时,明确施展是否要保留录像机角度或取景框等本色。

严慎选拔动词 :"修订"之类的词语泄露着透澈的修订。若是思要更精确的实现,不错使用更具体的操作,举例"换穿着"或"替换配景"。

One More Thing

终末再来看一下文生图鸿沟的方法,在 AritificialAnalysis 的名次榜上,GPT-4o、字节的 Seedream 3.0 和 Recraft V3 排名前三。

Black Forest Labs 的上一代爆款居品 FLUX.1 照旧相对靠后。

不错期待一下 FLUX.1 Kontex 的投票驱散。

在线试玩

https://playground.bfl.ai/image/generate

参考衔尾:

[ 1 ] https://x.com/bfl_ml/status/1928143010811748863

[ 2 ] https://replicate.com/blog/flux-kontext

[ 3 ] https://huggingface.co/spaces/ArtificialAnalysis/Text-to-Image-Leaderboard

—  完  —

� �  量子位 AI 主题辩论正在征鸠合!接待参与专题365 行 AI 落地决议,一千零一个 AI 期骗,或与咱们共享你在寻找的 AI 居品,或发现的AI 新动向。

� � 也接待你加入量子位逐日 AI 交流群,全部来畅聊 AI 吧~

一键激情 � � 点亮星标

科技前沿进展逐日见

一键三连「点赞」「转发」「防卫心」

接待在评述区留住你的思法!开云体育(中国)官方网站