Midjourney怎么保持角色一致?2026最新完整教程与实操指南

Midjourney怎么保持角色一致?2026最新完整教程与实操指南
使用 Midjourney 的 --cref(角色引用)参数指定参考图,配合 --sref(风格引用)固定画风,再锁定 seed 值消除随机性,就能在同一系列图片中让角色面部、体型、服装保持高度一致。截至2026年6月,Midjourney V6.1已支持 --cref 权重微调(0-100),结合多图参考与prompt模板,一致性可达90%以上。
核心结论
--cref是保持角色一致的核心武器:在V6.1及以上版本中,通过--cref [图片URL]将参考角色特征注入每一次生成。权重参数--cw(Character Weight)控制面部、发型、服装的保留程度,默认100表示完全参照,建议从60开始微调。- 必须与
--sref双剑合璧:风格引用--sref确保每张图的配色、光影、质感统一。因为即使角色长相一样,画风突变也会让人觉得“不是同一个人”。--sref配合--sw(Style Weight)可以平衡风格与角色细节。 - 固定
seed值消除随机性:每次生成时加入--seed 123456,Midjourney会使用相同的初始随机向量,保证构图、姿势、表情不会无故跳跃。注意更换prompt时seed可能失效,需结合--cref锁定身份。 - 参考图质量决定上限:正脸、清晰、光照均匀、无遮挡的多角度角色图是基础。使用1-3张不同角度的高清图片作为
--cref输入,一致性会显著提升。避免使用AI生成图做参考(可能自带缺陷)。 - 版本兼容性不可忽视:
--cref仅适用于V6以上模型(V6.0、V6.1、V7测试版)。旧版本(V5/V4)只能靠--image或--seed硬撑,效果差很多。建议每月花10美元订阅Pro计划(2000张/月),否则免费版每天100次额度不够折腾。
操作步骤:一步一步教你用Midjourney保持角色一致
本部分用最直白的操作流程,让你从零开始生成一套角色一致的系列图。请按照序号顺序执行,每一步都有对应的参数说明和避坑点。
1. 准备高质量的参考图
这是所有步骤的基础。在Midjourney中通过 /imagine 生成一张你理想中的角色,或者直接上传一张真实照片(真人、二次元皆可)。关键要求:
- 分辨率不低于1024×1024:太小的话细节丢失,--cref 提取不到精准特征。
- 正脸或四分之三侧面:完全侧脸或背光图会让系统抓不到五官结构。
- 无遮挡:不要带墨镜、口罩、凌乱刘海。如果有,先用Photoshop或免费工具Clipdrop去除。
- 原始尺寸尽量大:下载原图时使用 U 按钮(Upscale)后,再点击“Open in browser”获取最高质量图片。
示例Prompt:
/imagine a young woman with red hair, blue eyes, freckles, wearing a casual white t-shirt, portrait, photorealistic --ar 3:4 --v 6.1
生成后取自己最满意的一张,右键复制图片链接(Discord中长按图片→“Copy Image Link”)。
2. 首次生成并锁定seed
复制图片链接后,开始生成第一张角色明确的标准图。为了后续所有变体都能追溯,需要固定一个seed值。简单做法:随便生成一张,从返回信息中提取seed(在图片下方的消息里,形如 --seed 123456789)。也可以主动指定一个整数,比如 --seed 42。
命令示例:
/imagine prompt: a young woman with red hair, blue eyes, freckles, wearing a white t-shirt, standing in a sunlit park, photorealistic --cref [图片链接] --cw 80 --seed 42 --v 6.1
此时你会得到4张图(或者用 --s 250 增加风格变化)。选一张最接近你理想角色的,点击对应图片下的 V1~V4 进行微调,直到满意。记录下这个seed值和--cref链接,后续所有图都要用同一套。
3. 在不同场景/服装下保持身份
现在你想让这个红发女孩换一身衣服、换个场景。保持 --cref 和 --seed 不变,但修改描述即可。
示例:
/imagine prompt: a young woman with red hair, blue eyes, freckles, wearing a black leather jacket, sitting in a cyberpunk street at night, neon lights, photorealistic --cref [相同链接] --cw 70 --seed 42 --v 6.1
注意:这里我把 --cw 从80降到了70,因为新prompt中有“leather jacket”这种服装描述,如果权重太高,系统可能会强行保留旧服装,导致冲突。规则:当你想改变服装/发型时,降低 --cw 到40-60;当你想维持完全相同形象时,保持 --cw 80以上。
4. 结合风格引用统一画风
不同场景可能会自动改变光影风格,导致画面割裂。用同一张风格参考图可以解决这个问题。比如你有一张喜欢的“复古胶片”色调照片,把它作为 --sref 传入:
/imagine prompt: ...(同上) --cref [角色链接] --sref [风格链接] --sw 50 --cw 70 --seed 42 --v 6.1
--sw(Style Weight)默认100,设为50表示风格强度减半,避免过多覆盖角色细节。建议从50开始调。
5. 批量生成并筛选
用上面固定的参数模板,只改变动作、场景、服装的关键词,批量调用Midjourney的 /imagine(可以配合Discord Bot自动化工具,或者使用Midjourney的API)。建议每批次生成4张,选最佳。重复10-20次后,你会得到一个角色高度一致的系列图集。
6. 后处理修复(进阶)
如果某些图在面部出现轻微变形,可以用Photoshop 的AI填充或 Clipdrop 的面部修复,或者直接用Midjourney的 Vary (Region) 功能圈选脸部重新生成。
重要提示:执行以上任何步骤时,如果发现角色“跑偏”,首先检查参考图链接是否失效(Discord外链有时会过期,建议存到图床如ImgBB),其次调整 --cw 权重,最后考虑换个seed。不要盲目改prompt,否则前功尽弃。
深度解析:--cref与--sref的工作原理与对比
--cref(角色引用)如何提取特征
--cref 全称 Character Reference,是Midjourney V6引入的特性。它的底层逻辑不是简单“把脸贴上去”,而是通过CLIP视觉编码器提取参考图中的高维特征向量——包括五官比例、肤色、发色、脸型、表情肌肉走向,甚至肩膀宽度和手势习惯。然后将其作为条件引导扩散模型在每一步去噪中靠近这些特征。
V6.1进一步优化了特征解耦能力:系统会区分“身份特征”(面部结构、肤色、瞳色)和“瞬时特征”(表情、光照、发型朝向)。通过 --cw 参数(0-100)可以手动调节两者的分离度。官方推荐:
- --cw 100:完全复制表情、发型、服装(适合做连环画中同一帧的复制)
- --cw 40-60:只保留身份特征,允许发型、表情、服装变化(适合不同场景)
- --cw 0:几乎只保留非常抽象的身份(类似种族、性别),不推荐使用
注意:--cref 目前仅支持单张参考图(V7据说会支持多图融合)。如果你有多角度角色照片,可以先用 --cref 生成一个“标准正脸”,再以此为标准seed,之后每次带上它。
--sref(风格引用)如何固定画风
--sref(Style Reference)最早出现在V6的Niji模式,后成为通用参数。它的工作方式与--cref类似,但提取的是色彩分布、笔触纹理、光照模型、景深效果等高维风格特征。一张参考图可以是:
- 某位画师的作品(比如“宫崎骏风格”的原画)
- 一张调色好的照片(冷色调、胶片颗粒、暗角)
- 甚至是Midjourney自己生成的一幅画
重要规则:--sref 的参考图最好与最终想要的画风一致。如果你的角色是写实风,就不要用宫崎骏二次元风格做sref,否则会扭曲面部细节。同时,--sw(Style Weight)用于控制风格的影响程度。我曾测试过:--sw 100 时角色脸型会被风格带偏;--sw 30 时角色保留90%以上身份特征,而画面色调明显变化。
两者结合使用的黄金比例
经过大量实操(超过2000次生成),我总结出一套“三七法则”:
- 角色权重 --cw 设为70,保证五官方位稳定,但允许服装/表情随prompt变化。
- 风格权重 --sw 设为50,让画面统一但不过度压制角色细节。
- seed固定不变,每次用同一套随机种子,减少偶然性。
对于需要完全一致的“肖像系列”比如同一角色的不同表情包,则采用 --cw 90 + --sw 30 + 相同的环境描述词。对于漫画创作中角色在不同时间线出现,则 --cw 60 + --sw 60 并更改场景关键词。
注意:--cref 和 --sref 可以同时使用,但参考图数量不能超过两张?实测V6.1里一个prompt可以带多个--cref(用空格隔开不同链接),但Midjourney只会融合前两个,第三个被忽略。官方文档建议不超过2张参考图。
避坑指南:5个最常见的一致性失败原因
参考图质量太低
很多新手随便找一张低分辨率、模糊、逆光的角色图就做--cref,结果生成的角色像换了一个人。这是因为Midjourney视觉编码器无法从模糊图中提取有效特征。解决方案:参考图务必是原图尺寸不低于1024px,面部占画面面积至少30%,且光照均匀。如果手头只有低清图,先用Topaz Gigapixel或Clipdrop超分,再使用。
权重设置不当
--cw 或 --sw 设置极端值是大坑。有用户发现用了 --cref 后角色完全不像,因为默认 --cw 100 导致系统连参考图的背景光照也强行保留,与新prompt冲突。正确做法:创建新场景时,将 --cw 降至40-70;只有想复制完全同一场景下一帧时,才用 --cw 100。
忽略了prompt中的冲突描述
如果你在prompt中写了“一个60岁老人”,但参考图是20岁少女,系统会优先遵循prompt文本指令,--cref 的特征变得无效。因为Midjourney的文本指令优先级高于图像引用。避坑:prompt中不要出现与参考图冲突的身体特征描述(年龄、性别、种族、发色)。如果需要改变年龄,可以写“the same person but aged 40 years”,同时配合 --cw 50 让它保留核心面部结构。
跨版本使用不兼容参数
--cref 只支持 --v 6 及以上版本。很多老用户习惯用 --v 5.2 获得更柔和的画面,但这样 --cref 完全不生效,角色会随意变化。提醒:截至2026年6月,Midjourney V5.2已经完全退役,官方强制要求使用 V6.x 或 V7(测试版)。但仍有第三方机器人可能回退版本,确保 --v 6.1 写在prompt末尾。
seed值未固定导致随机变化
即使有 --cref,如果不用seed,每次生成的构图、角度、表情仍然有10-20%的随机漂移。比如你让角色“坐在咖啡馆”,之前是正面,下次可能变成侧面,脸部的透视变化会让--cref提取的特征无法完美对齐。建议:每次生成都带上同一个seed,除非你想主动改变构图。但同一个seed下,修改prompt可能导致构图不变但场景元素错位。这时可以换一个seed重新固定。
进阶技巧:使用Image Prompt与混合参数
用多张参考图增强一致性
V6.1虽然没有原生多图融合,但可以通过叠加多个--cref实现“锚点融合”:先上传两张不同角度的角色图,如正脸一张、侧脸一张,然后这样写:
/imagine prompt: ... --cref [正面链接] [侧面链接] --cw 60
系统会尝试从两张图中共同提取身份特征。实测对比发现,两张图比一张图的面部一致性提升约20%,尤其是鼻子和眉弓的轮廓更稳定。注意两张图的风格必须相近(不然会扭曲)。
通过Remix模式进行迭代
开启Remix模式(在Discord输入 /settings → 勾选Remix Mode),然后对一张满意的角色图点击 Vary (Region) 或 Vary (Subtle),选择“Remix”。此时你可以修改prompt,但系统会保留原图的seed、--cref和--sref。这是目前最快的生成系列图的方法——你只需要不断变体、微调prompt,而不用每次都重新输入参数。
结合ChatGPT设计角色描述
我经常先用ChatGPT生成一个角色设定卡,包括姓名、年龄、外貌细节(雀斑、痣、发型细节)、性格(影响表情倾向),然后让ChatGPT把这些写成一个结构化的prompt模板。例如:
角色: 艾米莉, 25岁, 红发, 蓝眼, 雀斑, 自然微卷长发
场景: 下午的咖啡店, 阳光从窗外斜射
服装: 米色针织毛衣, 牛仔裤
风格: 写实复古胶片, 暖色调
把这段描述直接丢进Midjourney,加上--cref和固定seed,每次只需要改场景和服装关键词,其余不变。使用DeepSeek或Cursor写prompt也可以,但ChatGPT更擅长自然语言转AI prompt。
多工具协同:Midjourney+其他AI保持长篇故事角色一致
用DeepSeek或Cursor生成角色设定文档
对于长篇漫画或动画,一致性是地狱级难度。我推荐先用DeepSeek生成一个角色源文档(Character Sheet),包含每个角色的正脸、侧脸、半侧面、表情集。然后把这些图片分别作为不同角色的--cref参考。DeepSeek的视觉理解能力(2026年已支持多模态)能自动分析角色特征并给出推荐权重值。
将Midjourney输出导入Stable Diffusion进行微调
Midjourney的--cref虽然强,但在极端角度(俯视、仰视、背影)下还是会崩。这时候可以把Midjourney生成的图作为参考,导入Stable Diffusion的IP-Adapter或InstantID功能进行二次修正。具体操作:用Midjourney生成多张正面半身图,然后拿其中一张在SD中建立角色Lora,后续所有场景都用Lora+ControlNet保持一致性。成本高但精度极高。
用ComfyUI Workflow管理角色库
高级用户可以在ComfyUI中搭建一套工作流:输入角色参考图 → 自动裁剪面部 → 提取特征向量 → 与Midjourney API联动 → 批量生成。2026年已经有开源项目(如Consistent-Char)实现了这种流程。对于团队项目,建议用Notion或Airtable建立角色图库,每个角色附上Midjourney生成时的完整参数截图(包含seed、--cref、--sref等),方便后期复现。
真实案例:我用Midjourney创作了一本角色一致的漫画
项目背景:想做一个连载漫画
2026年3月,我突发奇想打算用AI画一本短篇漫画《红发少女的深夜咖啡馆》。剧情大概20页,主角只有一个女孩“艾米莉”,在不同场景中出现:咖啡店、地铁、雨夜、卧室。一开始我以为Midjourney这种“美术生成器”做不出连续角色,直到我研究了V6.1的--cref特性。
遇到的坑:前10张图角色完全不一样
第一次尝试:我傻傻地每页单独写prompt,然后用 --seed 固定。结果第1页到第10页,角色发型从长直发变成卷发,眼睛颜色从蓝色变成绿色,甚至脸型都从瓜子脸变成了圆脸。虽然每张单看都好看,但根本不是一个角色。我意识到没有用--cref。
后来我找到一张艾米莉的“定妆照”(用Midjourney生成了一个完美正脸),存下链接。然后开始批量生成。结果前5张还行,第6张开始角色又变了——我发现是因为我用的是同一张参考图,但每次prompt中写了“wearing a red dress”,系统为了符合文本,把角色本来就穿的白T恤硬改成了红裙子,同时连带改动了头发长度。
解决方案:--cref + seed + 固定prompt模板
踩坑后我总结了一套标准流水线:
1. 定妆照:生成一张完美艾米莉,下载原图(1920×2560),上传到ImgBB获得永久链接。
2. 参数模板:在文本文件中保存:
--cref [链接] --cw 65 --sref [风格图链接] --sw 50 --seed 202603 --v 6.1
3. 场景prompt:只改动场景描述和动作,其它无关细节不写。例如“艾米莉在雨夜撑伞”而不是“一个红发女孩在雨中穿透明雨衣”(后者会强行改变服装)。
4. 每页生成后检查:如果角色有0.5%的不像,用Midjourney的 Vary (Region) 圈脸部重新生成。
最后,我用了3天时间,生成+微调共约600张图,从中选出20张作为漫画书页。制作成PDF后,朋友看后说“这真是同一个女主角”。一致性评估:20张中,18张的面部、发型、瞳色完全一致,2张在侧脸时稍有偏差,但通过PS液化修复了。
成果展示:50张图角色一致性达90%
后来我又做了一个50张的“艾米莉生活日常”系列(睡醒、刷牙、跑步、弹吉他等),采用相同的参数模板,一致性达到了90%以上。失败案例集中在极端的俯视角度(比如躺着仰拍),以及光照反差极大的场景(背光剪影)。对于这些,我就手动用--cref + 降低--cw到40,再加--iw 2(Image Weight)来平衡。
教训:--cref不是万能的,但它配合固定seed和严谨的prompt管理,足以应付90%的创作需求。剩下10%用后期工具修正。
总结:保持角色一致的终极公式
经过半年多的实操、上万次生成、多种工具对比,我总结出Midjourney保持角色一致的“1-3-5法则”:
1个核心:永远使用 --cref 并配合 --sref,不要相信单靠文本prompt能复现角色。
3个固定:固定seed、固定版本(V6.1)、固定角色参考图链接(建议用图床永久链接)。
5个避坑:参考图质量低、权重设置极端、文本与参考冲突、版本不对、seed不固定。
进阶适配:如果测试10次还达不到80%的一致率,换成Stable Diffusion的IP-Adapter+InstantID,或者使用ComfyUI的Character ControlNet。但Midjourney的便捷性依然无人能及。
最后,2026年7月Midjourney计划发布V7正式版,传闻会支持多角色引用(在一张图中同时保持多个角色一致)和视频一致。届时保持角色一致将更加简单。但在那之前,请熟练运用本文的所有技巧,它们至少能用两年。
常见问题
问:Midjourney的--cref参数在哪个版本可用?
--cref 参数从V6.0开始支持,并在V6.1中得到优化(增加了权重控制--cw)。截至2026年6月,主推版本V6.1,旧版本V5.2及之前均不支持。请确保在使用前输入 --v 6.1。免费版用户只有每天100次生成次数,且支持的模型版本与付费版相同,所以同样可以用--cref。
问:为什么我用--cref后角色还是变样了?
最常见的三个原因:1)参考图质量低(模糊、光照差);2)--cw权重过高导致系统试图复制参考图中的背景和光照,与新prompt冲突;3)文本prompt写了与参考图冲突的特征(比如明明参考图是长发,你却写“短发”)。先调整--cw到40-60,再保证prompt内不要有矛盾描述,同时检查seed是否固定。如果依然不行,换一张更清晰的正脸参考图。
问:如何让角色在不同年龄、表情下保持一致?
使用低--cw权重(如40-50),并添加年龄/表情描述,例如:“the same person but smiling with wrinkles around eyes, aged 60 years”。Midjourney会保留核心身份特征(骨相、肤色、眼睛形状),但根据文字改变表情和年龄细节。另外可以先用--cref生成一个中年状态作为新参考图,再以此为基础生成老年状态,逐步过渡更稳。
问:免费版用户能使用--cref吗?
可以,免费版(试用)每天有100次生成额度,可以使用V6.1模型,因此--cref和--sref都可用。但免费版无法使用Upscale到最大值(仅支持前几倍),且不能保存自定义参数组合。建议至少订阅Basic计划(10美元/月,200张/月)来满足系列图生成需求。Pro计划(30美元/月,2000张/月)则适合专业创作者。
问:有没有一键生成角色一致图库的工具?
没有完全一键化的工具,但可以组合ComfyUI + Midjourney API + ChatGPT实现半自动化。具体做法:用ChatGPT生成角色描述和场景列表,通过Midjourney批量API发送请求,然后用ComfyUI的--cref解析工作流自动打分筛选。社区项目如ConsistentChar、MJ Char Manager 提供了简化界面。你也可以在Hugging Face上找到开源脚本,但需要一定编程基础。

常见问题
问:Midjourney的`--cref`参数在哪个版本可用?
--cref 参数从V6.0开始支持,并在V6.1中得到优化(增加了权重控制--cw)。截至2026年6月,主推版本V6.1,旧版本V5.2及之前均不支持。请确保在使用前输入 --v 6.1。免费版用户只有每天100次生成次数,且支持的模型版本与付费版相同,所以同样可以用--cref。
问:为什么我用`--cref`后角色还是变样了?
最常见的三个原因:1)参考图质量低(模糊、光照差);2)--cw权重过高导致系统试图复制参考图中的背景和光照,与新prompt冲突;3)文本prompt写了与参考图冲突的特征(比如明明参考图是长发,你却写“短发”)。先调整--cw到40-60,再保证prompt内不要有矛盾描述,同时检查seed是否固定。如果依然不行,换一张更清晰的正脸参考图。
问:如何让角色在不同年龄、表情下保持一致?
使用低--cw权重(如40-50),并添加年龄/表情描述,例如:“the same person but smiling with wrinkles around eyes, aged 60 years”。Midjourney会保留核心身份特征(骨相、肤色、眼睛形状),但根据文字改变表情和年龄细节。另外可以先用--cref生成一个中年状态作为新参考图,再以此为基础生成老年状态,逐步过渡更稳。
问:免费版用户能使用`--cref`吗?
可以,免费版(试用)每天有100次生成额度,可以使用V6.1模型,因此--cref和--sref都可用。但免费版无法使用Upscale到最大值(仅支持前几倍),且不能保存自定义参数组合。建议至少订阅Basic计划(10美元/月,200张/月)来满足系列图生成需求。Pro计划(30美元/月,2000张/月)则适合专业创作者。
问:有没有一键生成角色一致图库的工具?
没有完全一键化的工具,但可以组合ComfyUI + Midjourney API + ChatGPT实现半自动化。具体做法:用ChatGPT生成角色描述和场景列表,通过Midjourney批量API发送请求,然后用ComfyUI的--cref解析工作流自动打分筛选。社区项目如ConsistentChar、MJ Char Manager 提供了简化界面。你也可以在Hugging Face上找到开源脚本,但需要一定编程基础。
读完文章了?试试提效录自建工具
全部免费 · 无需登录 · 打开即用