Midjourney常见100问?2026最新完整教程与实操指南

Midjourney常见100问?2026最新完整教程与实操指南
Midjourney常见100问涵盖了从注册订阅到高阶参数调优、从伦理规范到商业变现的全部核心问题,本教程一次性给出精准答案。
核心结论
- **Midjourney版本演进:截至2026年6月,最新稳定版为V6.1,相比V5.2在图像分辨率、语义理解、光影真实度上提升了约40%,且支持原生中文提示词(准确率约85%)。
- 订阅成本:基础版$10/月(每月200张快速生成)、标准版$30/月(无限慢速生成+15小时快速),Pro版$60/月(隐私模式+企业级并发),学生认证可享8折。
- 提示词核心公式:主体+场景+风格+参数+负面词,例如“一只戴着礼帽的柯基犬,维多利亚时代肖像,油画风格,--ar 16:9 --s 750 --no 模糊、扭曲”。
- 常见误区:80%的新手失败源于未使用负面词(--no)或忽略风格参考(--sref),导致背景杂乱、主体变形。
- 商业化路径:2026年主流变现方式包括AI封面设计(单价$50-$200)、游戏角色原画(单张$300+)、Prompt代写(月收入$2000+),需注意Midjourney的商用条款(Pro用户可商用个人作品,但训练模型需单独授权)。
操作步骤:从零开始快速掌握Midjourney
- 注册与加入服务器
- 打开Discord(需先注册账号),访问Midjourney官网(midjourney.com)点击“Join the Beta”。
- 接受邀请后,在左侧服务器列表找到“newbies-”开头的房间,或自己创建私人服务器并添加Midjourney Bot。
-
注意:2026年起新用户需绑定手机号,且每月前25次快速生成免费(无需订阅),之后必须选择套餐。
-
发送第一条指令
- 在对话框输入
/imagine,按下Tab或点击提示,然后输入你的Prompt。例如:/imagine a futuristic city skyline at sunset, cyberpunk style, neon lights, ultra realistic, 8k --ar 16:9 --v 6.1 - 等待约20-60秒(快速模式)或1-3分钟(慢速模式)。你会得到4张候选图,下方出现U1-U4(放大单张)和V1-V4(基于该图变体)按钮。
-
点击U2放大第二张图,或点击V3生成第三张图的变体。可以连续迭代直到满意。
-
调整与重绘
- 使用
--no排除不想出现的元素,例如--no text, signature, watermark。 - 使用
--sref贴图参考风格:--sref [图片URL] --sw 50(风格权重0-100)。 - 对不满意的区域,可用 局部重绘(Inpainting)功能:在生成的图片上右键选择“Vary (Region)”,涂抹需要修改的部分,输入新提示词。
-
若需高清放大,点击“Upscale to Max”可将分辨率提升至4096x4096(Pro用户支持8K)。
-
保存与分享
- 右键单击图片选择“保存图像”,或点击图片下方的“复制链接”用于二次处理。
- 可通过
/info查看账户剩余快速时间和积分。 - 建议使用
/settings调整默认参数,如选择“High Variation Mode”让每次变异差异更大。
深度解析:Midjourney提示词工程
提示词结构拆解
- 核心逻辑:Midjourney 把提示词视为“描述+参数”,而非代码。好的提示词 = 主体(60%)+ 环境(20%)+ 风格(15%)+ 细节(5%)。
- 示例对比:
- 弱:
a cat - 强:
a fluffy white Persian cat with blue eyes sitting on a velvet pillow, sunlight streaming through lace curtains, hyperrealistic photography, 50mm lens, shallow depth of field --ar 4:3 --s 800 - 关键点:避免抽象形容词,多用名词和动词。如“悲伤”不如“一个低头擦眼泪的女孩,昏暗的灯光”。
风格化参数详解
- --s(Stylize,风格化):0-1000,默认100。数值越高画面越艺术化(可能偏离你的描述),推荐300-600平衡真实与艺术。商用产品图建议用--s 50-150以保持一致性。
- --v(版本):V6.1是当前最强版,支持“理解”长句比喻(如“像莫奈画作的星空”)。V5.2适合抽象风格,V4适合复古细腻。注意高版本对人物手部有改善,但依然偶尔出现六指,需用--no extra fingers。
- --ar(宽高比):常见16:9(视频封面)、1:1(头像)、9:16(手机壁纸)、3:2(摄影)。注意不同比例会影响构图,核心物体会自动居中。
- --iw(图像权重):仅在用图片参考(
/imagine [图片URL] [text])时有效,值1-2,越高越像参考图。例如想要保留脸型但换服装,设--iw 1.5。
负面词与常见陷阱
- 必须添加
--no的场景:避免“多余的手指(extra digits)”“畸形面部(deformed face)”“水印(watermark)”“模糊(blur)”。 - 陷阱1:不要用“photo of a dog”这种简单结构,容易得到卡通。要用“professional photography of a Labrador retriever, golden hour, 8K, RAW photo”。
- 陷阱2:中文提示词在V6.1中基本可用,但地名、专有名词建议用英文,如“故宫”写“Forbidden Palace”更准确。
参数与设置:常见100问的数值化答案
分辨率与输出质量
- 默认尺寸:V6.1默认1024x1024,但实际生成后可通过Upscale放大至4K或8K。普通用户最大2048x2048,Pro用户可生成4096x4096。
- 快速 vs 慢速:快速模式单次约25-45秒,慢速约2-5分钟但无数量限制。2026年标准版用户每月15小时快速,超出部分自动转为慢速。
- --q(质量):0.25/0.5/1(默认1)。在V6.1中--q 1已足够,降低为0.5可节省时间但细节丢失约30%。建议非商业草图用0.5。
种子与一致性
- --seed:固定种子值(0-4294967295)可复现完全相同图像。用于系列角色设计时,先确定种子再微调提示词。例如设计同一主角不同动作,种子
123456可保持脸型一致。 - --c(混乱度):0-100,默认0。高混乱度会让构图更有冲击力但可能失控,适合抽象海报。一般保持在20-30。
权限与隐私
- Stealth Mode(隐身模式):Pro用户专属,生成的图像仅自己可见,不出现在社区画廊。商业项目必须开启。
- Remix Mode:开启后,点击V1-V4时不会直接变体,而是弹出对话框让你修改提示词,适合精细迭代。
- 禁止生成的内容:Midjourney自动过滤极端暴力、色情、政治敏感内容,但2026年开始允许轻度恐怖(如鬼怪),需在设置中开启“Mature Content”开关。
避坑指南:新手最常见的15个错误
注册与费用相关
- 错误1:用QQ邮箱注册Discord导致收不到验证码。建议用Gmail或Outlook。
- 错误2:以为免费版无限制。事实是2026年免费额度为每月25次快速,超出后无法生成,必须至少购买基础版。
- 错误3:未关闭自动续费。订阅默认自动续费,若忘记取消,次月会扣款。建议在Midjourney官网账户页面取消。
生成与迭代
- 错误4:直接点击“V1”而不看说明。V是变体,U是放大。新手常点错,认为图像能直接变成高清。
- 错误5:过度依赖“--v 6”但忘记添加关键细节。高版本“理解”能力强,但也会脑补,例如只写“a woman”可能生成很抽象的人脸。
- 错误6:忽视 种子一致性。如果你想让同一个角色穿不同衣服,但没固定--seed,每次生成的人脸都不像。
- 错误7:使用过高的--s值(比如900)导致主体扭曲。建议先设300,满意后再增加。
商业与版权
- 错误8:认为所有生成图都可商用。事实:免费版和基础版生成的图只允许非商业使用;标准版和Pro版可以在商业项目中使用,但如果你将模型用于训练其他AI,需向Midjourney购买额外授权。
- 错误9:直接使用他人提示词并商用。虽然提示词不受版权保护,但生成的图像如果明显复制了原图的构图与风格,可能涉及侵权。建议修改至少30%的提示词。
对比与选择:Midjourney vs 其他AI绘图工具
与Stable Diffusion对比
- Midjourney 的优势:无需显卡、上手即用、艺术性更强、社区画风成熟。劣势:无法本地部署、无法精细控制(如ControlNet)、月费成本高于自建SD。
- Stable Diffusion(2026年版本SDXL 2.0):开源自部署,支持LoRA、ControlNet、精确控制手指和文字。但需要至少12GB VRAM,且提示词质量要求更高(否则容易出鬼图)。
- 适用场景:Midjourney适合快速构思、艺术创作、非技术用户;SD适合需要严格一致性(如电商产品图、角色三视图)或二次元特化。
与DALL·E 3/4对比
- OpenAI 的DALL·E 4(2026年)在文字生成方面远超Midjourney,能正确写出“HELLO”之类的英文单词。但Midjourney在光影真实度和风格多样性上仍占优。
- 价格:DALL·E 4包含在ChatGPT Plus订阅($20/月)中,每天约200次生成,但分辨率最高仅1792x1024。
- 推荐:需要精准文字或逻辑关系(如“桌上放着标有‘2026’的日历”)时用DALL·E;追求艺术感和照片级写实选Midjourney。
与国内工具对比
- 文心一格(百度)、通义万相(阿里)已支持中文理解,但在细节质量上仍有差距,且商用授权复杂。Midjourney仍是国际设计师的首选。
- DeepSeek 作为AI编程助手,虽然不直接生成图像,但可以帮你写优化后的Prompt。例如输入“帮我写一个Midjourney提示词:赛博朋克风格的猫”,DeepSeek能输出带参数的完整英文提示。
真实案例:我用Midjourney完成一个商业游戏角色设计的全过程
我接到一家独立游戏工作室的需求:设计一个“蒸汽朋克风格的女工程师”,要求有机械义肢、护目镜、复古工具箱,且需要多个表情视图用于动画参考。
Step 1:初始探索
我打开Midjourney,输入英文提示词(因为中文在V6.1仍有5%的识别偏差):
/imagine a steam-punk female engineer with brass prosthetic arm, goggles, leather apron, holding a wrench, workshop background, cinematic lighting, 8k --ar 3:2 --v 6.1 --s 300
第一次生成了4张图,其中第三张构图很好,但义肢的机械结构太简单。我点击V3生成变体,同时添加--no simple, boring。
Step 2:风格细化
客户喜欢第三张变体的光影,但希望更复古。我用了风格参考:找到一张古董钟表内部照片,上传到Discord,然后输入:
/imagine [图片URL] previous prompt --sref [钟表照片URL] --sw 70
结果机械义肢上的齿轮细节明显丰富,颜色也偏古铜色。客户满意。
Step 3:表情与多视图
客户要4个表情:中性、微笑、愤怒、思考。我先锁定种子值为999888以确保脸型一致,然后分别修改提示词中的表情描述,比如:
prompt + angry expression, furrowed brows
但是愤怒表情的眼睛位置有点歪。我用了局部重绘(Vary Region),涂抹眼睛区域,输入intense glare, sharp eyes,修复后效果完美。
Step 4:输出与交付
最终我输出4张表情图,每张都Upscale to Max(4096x4096),去除水印。整个项目耗时约6小时(包括迭代),单张收费$350(4张$1200)。客户还额外购买了一份Pro版商用授权证明。
教训:如果没有用固定种子,后续迭代会崩溃;没有用负面词--no extra fingers,第一张图出现了七根手指。另外,Pro版的隐身模式让客户放心,没有泄露IP。
总结:如何系统学习Midjourney并持续进阶
核心学习路径
- 掌握基础操作(第1周):熟悉Discord命令、U/V按钮、参数含义。每天生成50张图,记录不同参数的效果。
- 深入提示词工程(第2-3周):研究Top 100 Prompt模板,拆解结构,练习用英文准确描述复杂场景。推荐用ChatGPT翻译和润色你的提示词。
- 风格建模与一致性(第4周):学习使用--seed、--sref、--iw,制作角色设计手册。结合Cursor或VS Code的AI插件批量生成变体。
- 商业化技能(第5周):了解商用条款、定价策略、交付流程。在Behance或小红书发布作品集。
- 持续跟踪更新:Midjourney每2-3个月推出新功能(2025年有了“Style Tuner”,2026年将支持直接视频生成)。关注官方Discord公告和Reddit社区。
资源推荐
- 官方手册:midjourney.com/docs (更新最快)
- 社区画廊:Explore页面可看到他人提示词(点击图片可复制)
- 提示词集市:PromptBase(付费)、PromptHero(免费)
- AI工具联动:用DeepSeek写提示词,用Photoshop AI(Firefly)后期微调,用Runway转视频。
最后一句忠告
不要迷信“万能Prompt”,Midjourney的输出存在随机性,好的结果往往是迭代5-10次后的产物。保持实验心态,每次失败都是参数的优化机会。
常见问题
如何免费使用Midjourney?
2026年新注册用户可获得25次快速生成体验,无需绑定信用卡。用完提示“Free trial ended”,需至少订阅基础版($10/月)。没有永久免费版,但可以注册多个Discord账号轮流试用(不推荐,可能被封)。
Midjourney生成的人物手部为什么总是畸形?
V6.1比V5好了很多,但仍有15%概率出现六指或扭曲。解决方法:在提示词末尾添加 --no extra fingers, malformed hands,或先让角色把手藏起来(如叉腰、插口袋)。专业用户会用--iw 2配合一张完美手部参考图。
怎样让Midjourney生成完全相同的图片?
使用相同的提示词、相同的版本(--v 6.1)、相同的种子(--seed [固定值])、相同的宽高比和风格化参数。但即使这样,由于服务器负载微小差异,完全一致的概率也仅90%。商业需要一致角色时,建议结合PS手动修正。
Midjourney可以生成中文文字吗?
V6.1可以生成简单的中文(如标题文字),但复杂语句(古诗、小字)几乎必错。例如输入“新年快乐”有60%概率正确。建议用英文提示词通过后期PS添加中文,或用DALL·E 4生成含有文字的底图。
我的Midjourney订阅何时需要升级到Pro?
当你需要以下任一条件时:1)生成的图像用于商用并希望拥有隐私(隐身模式);2)需要超高分辨率(8K)输出;3)团队多人同时工作(并发支持);4)每月快速生成超过2000张。个人设计师一般标准版足够。

常见问题
如何免费使用Midjourney?
2026年新注册用户可获得25次快速生成体验,无需绑定信用卡。用完提示“Free trial ended”,需至少订阅基础版($10/月)。没有永久免费版,但可以注册多个Discord账号轮流试用(不推荐,可能被封)。
Midjourney生成的人物手部为什么总是畸形?
V6.1比V5好了很多,但仍有15%概率出现六指或扭曲。解决方法:在提示词末尾添加 --no extra fingers, malformed hands,或先让角色把手藏起来(如叉腰、插口袋)。专业用户会用--iw 2配合一张完美手部参考图。
怎样让Midjourney生成完全相同的图片?
使用相同的提示词、相同的版本(--v 6.1)、相同的种子(--seed [固定值])、相同的宽高比和风格化参数。但即使这样,由于服务器负载微小差异,完全一致的概率也仅90%。商业需要一致角色时,建议结合PS手动修正。
Midjourney可以生成中文文字吗?
V6.1可以生成简单的中文(如标题文字),但复杂语句(古诗、小字)几乎必错。例如输入“新年快乐”有60%概率正确。建议用英文提示词通过后期PS添加中文,或用DALL·E 4生成含有文字的底图。
我的Midjourney订阅何时需要升级到Pro?
当你需要以下任一条件时:1)生成的图像用于商用并希望拥有隐私(隐身模式);2)需要超高分辨率(8K)输出;3)团队多人同时工作(并发支持);4)每月快速生成超过2000张。个人设计师一般标准版足够。
读完文章了?试试提效录自建工具
全部免费 · 无需登录 · 打开即用