开云体育(中国)官方网站若是立场标签不够精确-开云(中国)kaiyun网页版登录入口
AI 生图新冲破!一个模子同期汲取文本和图像输入。
新模子 FLUX.1 Kontext 使用流匹配架构(Flow Matching),不再是文本编码器和扩散模子各干各的,与此前期间皆不同。
最来自之前很火的 Black Forest Labs,官方泄露这一次能作念到真的的凹凸文生成和裁剪。
在裁剪才能上,有东谈主在知名的奥特曼纷扰照上 P 了一个小绿龙。
在生成才能上,有网友测试的猩猩打羽毛球细节也很丰富。
具体来说 FLUX.1 Kontext 有 4 个特色:
变装一致性:可跨场景保留元素
局部裁剪:只针对特定部分而不影响其余部分
立场参考:以现存立场生成新场景
交互速率:以最小蔓延进行迭代
此次提供两种模子,专科版 FLUX.1 Kontext [ pro ] 更合适快速迭代,可基于之前的裁剪
最高配版 FLUX.1 Kontext [ max ] ,在革职请示、翰墨排版和一致性有所擢升。
同期推出官方试玩平台 Flux Playground,两种型号皆不错采取
此外敞开权再版 FLUX.1 Kontext [ dev ] 提供内测。
请示词手段
第三方平台 Replicate 对 FLUX.1 Kontext 作念了详备测试,论断是比 OpenAI 的 4o 遵循更好,还更低廉,图像也不会偏黄。
测试解释中还针对不同功能给了请示词手段。
图像裁剪
当裁剪东谈主物时,不管蜕变大小,东谈主物的身份特征皆会保留。
关于立场迁徙任务,也能保留东谈主物的基本特征。
关于更复杂的更动,举例添加东谈主物或更动配景,需要分几步形色每项修改,惟有每次蜕变不太复杂就不错获取好的遵循。
立场迁徙
立场迁徙任务至少具体到"印象派画图"或"水彩素描",带上具体的派别艺术家遵循更好,如"文艺回话"或" 20 世纪 60 年代的波普艺术"。
若是立场标签不够精确,那就形色一下关节特征,举例"昭彰的笔触、安祥的脸色质感和丰富的色调深度"。若是思保留某些元素,也需要明确施展,如"保执原始构图"。
总之,形色的越具体遵循越好。
文本裁剪
维持往图上新增文本、删除文本,致使定位到已有文本修改。
处理文本时的一些手段:
使用易读的字体,过于艺术化的字体推崇欠安
明确施展要保留哪些本色。若是保留字体神志很进攻,请务必说起
尽可能匹配裁剪前后的文本长度。长度的大幅变化可能会改变布局
此外凭据网友测试,FLUX.1 Kontext 还不错删除文本,如把电影海报上的字全去掉。
变装一致性
在连气儿裁剪时,领先要明确东谈主物,然后施展哪些方面发生了变化,不管是场景、行为照旧立场。
若是思让并吞个东谈主物赓续存在,需要施展哪些方面需要保留:面部、样子、衣饰或其他任何进攻方面。
在裁剪配景和场景的同期保执变装的一致性需要详备形色,以保执东谈主物处于换取的位置、比例或姿势。
节略的请示偶然会留住太多朦胧的处所,如"把他挪到沙滩上",就不如:
将配景换成海滩,同期保执东谈主物位置不变,保执换取的主体位置、拍摄角度、取景和视角。只需替换东谈主物周围的环境即可。
其他手段
终末,Repilicate 还对使用 FLUX.1 Kontext 的请示词手段作念了一个追忆:
使用昭彰、详备的话语。准细则名颜色,精确形色视觉元素,并选拔告成的算作动词。幸免使用"使其更好"之类的朦胧词语。
将复杂的裁剪领悟成更小的尺度。按规章进行操作,更容易搞定较大的变更。
明确哪些部分应该保留。使用"同期保执换取的面部特征"或"保管原始构图"等短语来保护关节元素。
使用形色性短语,举例"留着玄色短发的女东谈主"或"红色汽车"。幸免使用代词。
裁剪文本时使用引号,举例,"将‘ x ’替换为‘ y ’"
明如实现构图 :裁剪场景时,明确施展是否要保留录像机角度或取景框等本色。
严慎选拔动词 :"修订"之类的词语泄露着透澈的修订。若是思要更精确的实现,不错使用更具体的操作,举例"换穿着"或"替换配景"。
One More Thing
终末再来看一下文生图鸿沟的方法,在 AritificialAnalysis 的名次榜上,GPT-4o、字节的 Seedream 3.0 和 Recraft V3 排名前三。
Black Forest Labs 的上一代爆款居品 FLUX.1 照旧相对靠后。
不错期待一下 FLUX.1 Kontex 的投票驱散。
在线试玩
https://playground.bfl.ai/image/generate
参考衔尾:
[ 1 ] https://x.com/bfl_ml/status/1928143010811748863
[ 2 ] https://replicate.com/blog/flux-kontext
[ 3 ] https://huggingface.co/spaces/ArtificialAnalysis/Text-to-Image-Leaderboard
— 完 —
� � 量子位 AI 主题辩论正在征鸠合!接待参与专题365 行 AI 落地决议,一千零一个 AI 期骗,或与咱们共享你在寻找的 AI 居品,或发现的AI 新动向。
� � 也接待你加入量子位逐日 AI 交流群,全部来畅聊 AI 吧~
一键激情 � � 点亮星标
科技前沿进展逐日见
一键三连「点赞」「转发」「防卫心」
接待在评述区留住你的思法!开云体育(中国)官方网站