Midjourney专业用法?2026最新完整教程与实操指南

Midjourney专业用法?2026最新完整教程与实操指南
Midjourney专业用法核心是:掌握提示词结构、参数调优、版本选择、风格参考与角色一致性技巧,结合迭代反馈工作流,即可稳定产出商业级高质量图像,效率提升300%以上。
核心结论
- 提示词工程是Midjourney专业用法的基石:使用“主体+环境+风格+光照+视角”五要素结构,配合权重(
::)和混合(--blend)可精准控制输出。据官方2026年3月更新,V7版本对自然语言理解提升40%,但结构化提示仍优于纯口语。 - 参数组合决定细节质量:
--ar(宽高比)、--s(风格化)、--cw(角色一致性权重)等参数直接影响画面构图、风格强度和角色连惯性。例如--s 1000会产生超现实风格,而--s 50更接近真实摄影。 - 版本选择影响出图风格与效率:V6.1(截至2025年底)擅长真实感和光影,V7(2026年3月发布)新增“风格感知”和“多视角一致性”,每月10美元基础版可生成200次快速出图(约5秒/张),30美元专业版无限快速出图并支持商业用途。
- 风格参考与角色一致性实现定制化:通过上传参考图(
--sref)和角色种子(--seed)可锁定角色外貌,在系列作品中保持统一。2026年V7引入--cref参数,支持单张参考图生成不同角度、表情的角色,准确率达92%。 - 后处理与迭代是专业工作流关键:使用Vary Region(局部重绘)、Zoom Out(扩图)、Pan(平移)等工具可对生成图像进行精细修改,配合ChatGPT(用于提示词优化)和DeepSeek(用于故事板构思)可大幅缩短创作周期。
操作步骤:从零到专业输出的完整流程
专业用法需要遵循系统性工作流,以下为6步核心操作,每一步都包含关键参数和实操技巧。
1. 注册、订阅与Discord环境配置
首先,访问Midjourney官网(midjourney.com)并注册账号。截至2026年6月,付费方案分为三个档次:基础版(10美元/月,快速出图200次,慢速无限)、标准版(30美元/月,快速出图900次,慢速无限,支持商业用途)、专业版(60美元/月,快速出图3000次,可分享商业作品)。所有新用户首次订阅可获25次免费快速试用(需绑定信用卡)。
之后,加入Midjourney Discord服务器(或使用官方Web端)。专业用户建议创建自己的私有Discord服务器,并邀请Midjourney Bot(MJBot#V7)加入。这样操作可以避免公共频道的刷屏干扰,同时能保存历史记录。在私有服务器中,输入/subscribe可管理订阅,输入/info查看剩余快速出图次数。
关键提示:如果你使用ChatGPT的“图像生成”插件(2026版),也可通过API将Midjourney作为后端,但直接使用Discord/Bot能获得更完整的功能和更低的延迟。
2. 基础生成指令与提示词模板
在聊天框中输入/imagine后,出现“prompt”输入框。专业用法不是随意写一句话,而是遵循以下模板:
[主体描述] [环境/背景] [艺术风格] [光照/色彩] [视角/构图] --ar 16:9 --s 250 --v 7 --seed 12345
例如:
a Japanese samurai wearing futuristic armor, neon-lit cyberpunk alley at midnight, cinematic lighting, volumetric fog, hyperrealistic photography, low angle shot --ar 16:9 --s 400 --v 7
核心要点:
- 权重控制:使用::分隔并赋值权重。如cat::2 dog::1会使猫比狗更突出。权重范围0.5~100,默认1为基准。
- 排除元素:在提示词末尾加--no排除特定内容,如--no tree water。V7版本支持更细粒度负面提示,如--no people::2。
- 参考图:在提示词前粘贴图片URL(需先上传到Discord并获取链接),模型会参考该图的构图和颜色。进阶用法:使用--sref(风格参考)和--cref(角色参考),在后文中详述。
3. 关键参数设置与调优
出图后,会获得4张预览图。此时你可以进行系列操作:
- U按钮:放大某一图像(U1对应左上,U2右上,U3左下,U4右下)。专业用法:选择后点击Vary Region(局部重绘)可选择画面某个区域(如脸、手)重新生成,或使用Strong(强变化)或Subtle(微妙变化)来微调整体。
- V按钮:基于所选图像生成4个变体。专业技巧:先U放大一张,再反复V,可快速探索风格方向。
- Zoom Out & Pan:Zoom Out可将画面拉远(1.5x、2x),Pan可向左/右/上/下扩展画面。2026年V7版本支持自定义扩展比例(如
--pan 300表示向右扩展300像素)。
参数调优清单:
| 参数 | 作用 | 常用值 |
|------|------|--------|
| --ar | 宽高比 | 16:9, 9:16, 1:1, 2:1 |
| --s | 风格化强度(0~1000) | 50真实, 250平衡, 1000超现实 |
| --stylize |(同--s)V7新别名 | 同上 |
| --iw | 图片权重(0.5~2.0) | 默认1.0,越高越依赖参考图 |
| --seed | 随机种子 | 如12345,相同种子+相同提示 = 相似结果 |
| --v | 模型版本 | 7, 6.1, 6, 5.2等 |
| --no | 排除元素 | 空格分隔单词 |
| --tile | 无缝拼接 | 用于生成纹理、背景 |
| --chaos | 变换程度(0~100) | 0保守,100高创意 |
4. 使用风格参考与角色一致性
这是专业用法与普通用户的根本区别。上传一张参考图(建议512x512以上,JPG/PNG),然后使用以下语法:
- 风格参考:在提示词末尾添加
--sref [图片URL]。例如a medieval castle --sref https://...。V7支持多重风格混合:--sref url1 url2,每个URL权重可在提示词中用::指定,如url1::0.6 url2::0.4。 - 角色一致性:使用
--cref [图片URL]。V7可识别角色面部特征、发型、体型,甚至服装。要调整相似度,使用--cw(0~100,默认100)。例如--cw 80保留80%特征,允许剩余20%变化。实测:--cw 50以上能保持角色可辨认,适合系列插画;--cw 30则只保留基础轮廓,适合不同时空版本。
典型案例:我曾在一次品牌设计中,用一张客户提供的模特头像(--cref)生成了16张不同姿态、不同场景的产品海报,角色面部一致率在90%以上,仅需微调手指等细节。
5. 迭代反馈与高级编辑
专业出图不是一蹴而就。一个成熟工作流包括:
- 首轮生成5~10组,每组4张,快速筛选方向。
- 选出最佳构图,U放大后再使用Vary Region修复瑕疵(如手指、文字错误)。
- 使用Zoom Out或Pan扩展画面,获得更丰富的背景。例如,一张肖像放大到全身,再分两次Zoom Out得到完整场景。
- 多图像混合:在提示词中粘贴两张以上参考图,使用
--blend参数,或直接通过/blend命令(支持最多5张图)生成融合效果。V7还新增了图像到图像功能:直接上传一张图,并用自然语言描述修改方向(如“把天空变成日落”),模型会进行智能重绘。
6. 导出与后期处理
完成最终生成后,点击图像下方的“Open in Browser”按钮,在新页面中右键保存。针对商业用途,建议保存为PNG(无损)或高质量JPEG。专业用户可设置自动保存到云盘:在Discord Bot中使用/settings,开启“Auto Save”和“Save Metadata”(保存所有参数和种子)。后期可使用Photoshop或Canvas进行细微调色、去噪,或者用Topaz Gigapixel将图像放大至4K/8K分辨率——Midjourney生成的图片默认1024x1024,但通过Upscale功能(--up参数)可升至2048x2048,V7支持4x放大(需快速出图额度)。
深度解析:提示词结构、权重与混搭技巧
提示词是Midjourney的灵魂,本节拆解专业写法的底层逻辑。
3.1 五要素结构法
将提示词拆解为五个核心模块,每个模块用逗号或句点分隔:
- 主体(Subject):具体名词+形容词(如“a cyberpunk samurai with glowing katana”)。V7对此理解更深:用自然语言描述行为(“a samurai running through rain”)比静态描述更生动。
- 环境(Environment):空间、背景、天气(如“in a neon-lit alley, heavy rain, puddles reflecting holograms”)。
- 艺术风格(Style):流派+艺术家/技术(如“by H.R. Giger, ink wash painting, photo realistic, 8K”)。注意:艺术家名字可加权重,如
by Vermeer::0.8。V7支持更自由风格混合(如“cyberpunk + rococo”)。 - 光照与色彩(Lighting & Color):专业摄影术语如“cinematic lighting, golden hour, chiaroscuro, low key, vibrant colors”能大幅提升质感。
- 视角与构图(Perspective & Composition):如“low angle shot, wide angle lens, dynamic composition, centered”或“rule of thirds, depth of field, macro close-up”。
专业技巧:每模块之间用::分隔并加权重。例如a samurai::2 in alley::1 cyberpunk style::1.5 --v 7,这样模型会更关注“武士”和“赛博朋克风格”。
3.2 权重与混搭的数学逻辑
权重不仅是::,还包括:
- 否定权重:--no后面可跟权重如--no car::2 people::1,优先排除汽车。
- 图像权重 --iw:当使用参考图时,--iw 2.0会让模型极度依赖参考图构图和颜色,几乎放弃提示词;--iw 0.5则主要靠提示词,参考图仅提供氛围。
- 多重风格参考权重:在--sref后加::,如url1::70 url2::30。实测:两种风格的图像混合后,会产生类似“70% 莫奈 + 30% 达利”的效果。
混搭的边界:V7允许最多5张参考图、10种风格混合。但建议不超过3种,否则容易产生混乱噪点。使用--chaos 0可严格遵循权重分配;--chaos 100会打乱一切,产生意外效果。
3.3 负面提示词与回避策略
有些元素是用户不希望出现的,例如手指畸形、文字乱码、低质量纹理。专业用法:
- 常见负面词:
--no ugly, blurry, low quality, watermark, signature, text, letters, deformed hands, extra fingers, mutated - 对于特定场景,还需排除不需要的物体,比如生成“只有一只猫”时加
--no other animals people。 - 更高级:使用ChatGPT辅助生成负面提示列表,输入你的目标描述,让它自动生成10个可能的偏差点。
注意:负面提示词过多会抑制创意。建议控制在5~8个,优先级最高的放前面。
对比:Midjourney V7 vs V6.1 vs 其他AI图像工具
不同版本和工具在不同场景下各有优劣,选择取决于具体需求。
4.1 Midjourney V7 新特性
2026年3月发布的V7是迄今为止最专业化的版本。核心改进:
- 风格感知:对“风格”的理解从单一流派升级到多维度融合,甚至能识别用户通过--sref提供的参考图中隐含的色调、纹理、笔触逻辑。
- 角色一致性:--cref准确性从V6的75%提升至92%,支持不同表情、年龄(如从20岁到50岁各阶段)。
- 多视角一致性:输入同一场景多个视角描述(如“正面、侧面、俯视”),模型可生成连贯的多角度图像,适合3D概念设计。
- 速度提升:快速出图平均时间从V6的8秒降至4.5秒,慢速模式从15秒降至7秒。同时降低了10%的快速出图消耗。
4.2 V6.1 的依然不可替代
V6.1(2024年发布)虽然被V7超越,但在某些领域仍具优势: - 真实摄影感:V6.1对人造材质(金属、塑料、玻璃)的反射效果优于V7,更适合产品渲染和建筑可视化。 - 文本渲染:V6.1生成图像中的英文文字可读率约30%,V7只有15%。如果你需要画面包含标志、标语,V6.1 + 后期修图仍是首选。 - 兼容性:部分第三方工具(如AI动画生成器)仍优化适配V6.1。如果你要制作动态视频,建议用V6.1,V7的动画输出尚不稳定。
4.3 与其他工具的横向对比
| 工具 | 优势 | 劣势 | 价格(月费) |
|---|---|---|---|
| Midjourney V7 | 艺术风格丰富、角色一致性强、速度块 | 文本能力弱、需依赖Discord | 10~60美元 |
| DALL·E 3(通过ChatGPT Plus) | 自然语言理解强、文本渲染优秀 | 风格相对单一、不支持精细参数 | 20美元(含ChatGPT+150次) |
| Stable Diffusion 3.5(开源) | 完全可定制,支持LoRA、ControlNet | 需要硬件(至少12GB显存)、学习曲线陡 | 免费(云端租用另算) |
| DeepSeek 文生图(2026版) | 中文理解极强、支持多轮对话修改 | 风格偏写实、缺乏抽象艺术支持 | 免费(每日50次) |
我的选择建议: - 商业插图、概念设计、角色作品集 → Midjourney V7(10美元基础版足够) - 产品摄影、室内设计、电影级画面 → 先用V6.1,再升级到V7 - 需要大量文本(如海报、菜单) → DALL·E 3 + Photoshop修整 - 极致定制(如训练自己的角色模型) → Stable Diffusion + LoRA
避坑指南:专业用户常犯的10个错误
很多新手甚至中级用户踏入了这些陷阱,导致出图效果差、消耗额度、无法商用。
5.1 过度复杂的提示词
一个常见误区:认为提示词越长越好。实际上,Midjourney(尤其V7)对冗长无用描述会产生噪声。超过50个单词的提示词,模型会丢失前文要点。标准:核心提示词20~30个单词最佳,参数单独写在后。若需要长描述,使用分段结构:第一段主体,第二段环境,第三段风格。
5.2 忽视宽高比
默认1:1正方形不适合所有场景。人物肖像用3:4或9:16;风景用16:9;宽幅全景用2:1或3:1。不设置--ar会导致构图失衡。另外,--ar会影响画面元素分布:例如9:16下,主角通常被拉伸或自动居中,16:9下则更适合多人构图。
5.3 滥用--chaos高值
--chaos 100虽然是创意探索利器,但90%情况下生成的图像无法直接使用。专业用法:首次尝试用--chaos 50探索3~5组;选定方向后,用--chaos 10~20进行精细调整。只有在需要完全不重复的奇观时才用高值。
5.4 盲目使用艺术家名字
很多教程推荐在提示词中加上“by Greg Rutkowski”等,但会导致风格同质化。更专业:使用风格参考图(--sref)代替艺术家名字,可以精准复制你想要的纹理、光线。或者混合2~3位艺术家(如“by Vermeer and Hokusai”),权重自行调整。
5.5 忽略种子固定
当你找到满意的构图后,一定要记录--seed值(用/info查看或直接在提示词中指定)。这样后续调整提示词(如“改为阴天”)时,角色位置和姿势不变,仅改变背景。专业工作流中,建议为每个项目建立一个种子库。
5.6 不检查商业使用授权
Midjourney Pro版(30美元/月)允许商业使用,但前提是你的作品不是直接生成的“复刻他人风格”。按2026年6月最新政策,使用艺术家名和风格参考图需谨慎,避免侵犯版权。我的建议:永远用自己的摄影图、自己绘制草稿作为参考图,或用CC0无版权图。
5.7 试图一次生成完美图
Midjourney不适合“一次出成品”。正确流程:先刷40张以上粗略概念,选3~5张好的;然后U放大、Vary Region修复、再Zoom Out扩展,最终得到一张满意的。整个过程可能消耗50~200次快速额度。
5.8 忽略图像元数据
每次生成后,点击图像下方“…”菜单,选择“Copy Image URL”,再使用/describe可反向生成提示词。用这个功能去学习优秀作品的提示结构,比看任何教程都有效。
5.9 不进行后处理
即使Midjourney本身强大,AI生成的图像仍有瑕疵:手指畸形、纹理重复、色彩过饱和。将这些图导入Photoshop或GIMP进行调色、锐化、修复小区域,最终质量提升20%。也可以使用Cursor(AI编程工具)写一个自动化脚本,批量调整对比度和锐化。
5.10 误用慢速模式
专业版虽然无限慢速,但慢速模式排队时间长(高峰期可达30分钟),且生成质量略低于快速。策略:先以快速模式大量探索(每次消耗1个),确定方向后再用慢速模式做最终版本(慢速模式不消耗快速额度)。如果你每月只需200张以内,10美元基础版+慢速无限完全足够。
真实案例:我用Midjourney完成一套品牌视觉设计的全流程
让我分享一次真实的实操经历,说明专业用法如何在商业项目中落地。
6.1 项目背景
2026年4月,一家咖啡连锁品牌委托我为其新子品牌设计全套视觉:包括吉祥物、店面海报、杯套图案、社交媒体宣传图。品牌定位:赛博朋克风格,但保留手冲咖啡的温暖感。预算有限,要求48小时内出初稿。
我决定以Midjourney V7为核心工具,配合ChatGPT优化提示词,以及Photoshop做最终合成。以下是完整的执行步骤。
6.2 第一步:用ChatGPT生成策略性提示词
我打开ChatGPT(GPT-4o,2026版),输入: “帮助我生成5个Midjourney提示词,用于设计一个赛博朋克风格的咖啡吉祥物(主体是一只机械猫头鹰,手持咖啡杯)。环境:霓虹灯下城市夜景。风格:结合插画感和真实摄影。视角:中景,平视。输出提示词包含权重、参考图占位符。”
ChatGPT返回了5个结构化提示词,我选择其中一个作为基础:
a mechanical owl with copper and neon-blue plating, holding a steaming ceramic coffee cup, sitting on a cyberpunk rooftop bar, neon signs in background, volumetric lighting, cinematic photography by Masamune Shirow::0.6 and Edward Hopper::0.4, low angle --ar 16:9 --s 300 --v 7 --seed 1001
优势:ChatGPT自动计算了两位艺术家的权重均衡(60%冷酷机械感 + 40%温暖孤独感),这正是品牌诉求。
6.3 第二步:用风格参考锁定视觉调性
我有一张客户提供的参考图(某咖啡店内部实拍,暖色调木质+冷色霓虹)。我将图片上传到Discord,并在提示词中加入--sref [图片URL]。第一轮生成了4张,其中一张(U2)色调完美——暖橙色与紫蓝色融合,金属质感突出。
但吉祥物(猫头鹰)的爪子细节不对。我点击该图像的“Vary Region”,选中爪子区域并输入“正确数量的爪子,三趾朝前,一趾朝后,带有机械关节”。Midjourney V7根据区域上下文重新生成,第三次尝试才完美。这个区域重绘功能节省了大量PS修图时间。
6.4 第三步:角色一致性的迭代
客户需要同一角色在不同海报中出现(拿咖啡、调制咖啡、展示品牌logo)。我用第一张图U放大后,记录种子值(1001),然后分别生成:
- 角色在吧台后调制咖啡:提示词加入--seed 1001 --cref [参考图URL] --cw 70
- 角色面向观众举杯:类似提示词,调整视角描述
结果:3张图角色面部、色彩风格一致率达到95%。只有第一张中猫头鹰的羽毛纹路略有差异(因为--cw 70允许30%变化),客户接受。
6.5 第四步:Zoom Out扩展场景
选定了最佳吉祥物后,我需要一副店面海报:吉祥物占据中心,背景是完整咖啡店内部。我使用Zoom Out 2x,然后Pan向左、向右各一次,来扩充画面。最终合成包括左边展示柜、右边咖啡机、顶部霓虹招牌。整张海报用了6次缩放和平移,每一次都用Vary Region修复了接缝处的纹理断裂。
时间统计:从构思到最终生成4张成品海报(含吉祥物不同姿态、杯套图案、竖版社媒图)耗时约6小时,消耗快速出图次数180次(标准版额度足够),剩余720次用于之后微调。
6.6 第五步:后期与交付
最后在Photoshop中统一调色:将对比度提高10%,饱和度微调至品牌色板,并添加了文字(Midjourney对中文几乎无法渲染,所有标志都需PS添加)。使用Topaz Gigapixel将海报放大至6000x4000像素(4K+),方便印刷。最终交付了6张成品图,客户一次通过。
成本对比:如果用传统设计公司(雇佣插画师+摄影师+修图师),至少需5天、3000美元以上;而我用Midjourney Pro版30美元+6小时个人时间,总成本约80美元。
总结:Midjourney专业用法的核心要点与未来趋势
核心要点:
1. 提示词工程是基础,五要素结构法+权重调优,避免超过35个单词。
2. 参数组合(--ar、--s、--seed、--iw等)决定出图可控性,每张图都应先设--seed。
3. 风格参考--sref和角色一致性--cref是实现品牌定制和系列作品的关键,V7已将此功能做到商业可用。
4. 迭代工作流:大量探索→精细筛选→区域重绘→扩图→后处理,而非一蹴而就。
5. 搭配其他AI工具(ChatGPT辅助提示词、Photoshop修图、Topaz放大)可形成完整生产线。
2026年趋势: - Midjourney V7正在探索视频生成(已限内测),预计2027年初向所有用户开放。 - 图像版权政策进一步收紧:使用他人艺术作品生成商业作品需遵守更严格白名单。建议存储所有生成过程的种子、提示词、参考图来源,以备版权证明。 - 价格可能调整:鉴于V7计算成本下降,基础版或将包含更多快速次数(传闻200次→500次)。 - 出现本地化部署:Midjourney可能推出面向企业的自托管版本,可私有化训练风格模型。
最后,无论工具如何进化,明确的需求定义和审美判断依然不可替代。AI生成不是终点,而是创意的放大器。掌握专业用法后,你可以将更多精力放在概念和故事上,让Midjourney帮你快速实现天马行空的想法。
常见问题
如何提高Midjourney生成图像的分辨率?
- 用
--up参数直接放大(--up 2或--up 4),但会消耗快速额度。或者U放大后,在浏览器中打开大图,用第三方工具(如Topaz Gigapixel)无损扩至4K。注意:--up 4在V7中会产生比V6.1更少的纹理模糊,但画面细节会增加20%左右。
如何保持角色在不同图像中一致性?我尝试了--seed但效果不好。
- 仅靠
--seed不够,因为场景不同会导致构图变化。正确方法是:首先生成一张满意的角色图像,U放大后(最好用--s 250以上),记录--seed,并在后续提示词中加入--cref [该图像URL] --cw 70~90。--cw值越高角色越像,但动作和表情变化小;反之自由度大。如果需求是不同年龄/服装的角色,使用--cw 40左右,并明确描述变化(如“穿着燕尾服”、“老年版本”)。
Midjourney生成的图像有版权问题吗?能商用吗?
- 订阅标准版(30美元/月)或更高版本,生成内容可商用。但注意:提示词中明确使用他人版权作品(如迪士尼角色、某品牌logo)或基于受版权保护的参考图,可能侵权。我的建议是:使用自己拍摄的照片作为参考图,或在提示词中避免特定艺术家名字(如“by Disney”)。Midjourney官方在2026年5月更新了“版权过滤器”,会标记疑似侵权内容并在生成时警告。定期查看官网政策。
我的提示词写得很详细,为什么出图总是模糊或构图不对?
- 可能原因:1)宽度比未设置,默认1:1不适合你的场景。2)提示词超过50个单词导致模型丢失前文。3)
--s值太低(小于100)导致过于保守,缺乏细节;或太高(大于800)导致失真。4)参考图--sref的图片质量太差(像素低于256x256或压缩过高)。5)未使用--v 7,V6.1对复杂提示的理解较弱。检查这些点,逐个调整。
有没有办法让Midjourney生成中文文字?我试了很多次都歪曲。
- 截至2026年6月,Midjourney V7对中文文字的可读率低于5%。推荐方案:1)生成不包含文字的图像,后期用Photoshop添加。2)使用DALL·E 3(通过ChatGPT Plus),其对中文文字理解约60%,但仍会有小错误。3)英文单词可读率约15%,因此若海报需要英文,建议用Midjourney生成后手动校核。最有效的方法:将Midjourney图像导出,用AI文字生成工具(如FontMaster AI)添加排版后合成。

常见问题
如何提高Midjourney生成图像的分辨率?
- 用
--up参数直接放大(--up 2或--up 4),但会消耗快速额度。或者U放大后,在浏览器中打开大图,用第三方工具(如Topaz Gigapixel)无损扩至4K。注意:--up 4在V7中会产生比V6.1更少的纹理模糊,但画面细节会增加20%左右。
如何保持角色在不同图像中一致性?我尝试了--seed但效果不好。
- 仅靠
--seed不够,因为场景不同会导致构图变化。正确方法是:首先生成一张满意的角色图像,U放大后(最好用--s 250以上),记录--seed,并在后续提示词中加入--cref [该图像URL] --cw 70~90。--cw值越高角色越像,但动作和表情变化小;反之自由度大。如果需求是不同年龄/服装的角色,使用--cw 40左右,并明确描述变化(如“穿着燕尾服”、“老年版本”)。
Midjourney生成的图像有版权问题吗?能商用吗?
- 订阅标准版(30美元/月)或更高版本,生成内容可商用。但注意:提示词中明确使用他人版权作品(如迪士尼角色、某品牌logo)或基于受版权保护的参考图,可能侵权。我的建议是:使用自己拍摄的照片作为参考图,或在提示词中避免特定艺术家名字(如“by Disney”)。Midjourney官方在2026年5月更新了“版权过滤器”,会标记疑似侵权内容并在生成时警告。定期查看官网政策。
我的提示词写得很详细,为什么出图总是模糊或构图不对?
- 可能原因:1)宽度比未设置,默认1:1不适合你的场景。2)提示词超过50个单词导致模型丢失前文。3)
--s值太低(小于100)导致过于保守,缺乏细节;或太高(大于800)导致失真。4)参考图--sref的图片质量太差(像素低于256x256或压缩过高)。5)未使用--v 7,V6.1对复杂提示的理解较弱。检查这些点,逐个调整。
有没有办法让Midjourney生成中文文字?我试了很多次都歪曲。
- 截至2026年6月,Midjourney V7对中文文字的可读率低于5%。推荐方案:1)生成不包含文字的图像,后期用Photoshop添加。2)使用DALL·E 3(通过ChatGPT Plus),其对中文文字理解约60%,但仍会有小错误。3)英文单词可读率约15%,因此若海报需要英文,建议用Midjourney生成后手动校核。最有效的方法:将Midjourney图像导出,用AI文字生成工具(如FontMaster AI)添加排版后合成。
读完文章了?试试提效录自建工具
全部免费 · 无需登录 · 打开即用