什么是 Midjourney?
Midjourney 是一款独立研发的人工智能图像生成工具,用户通过文本描述(提示词)即可生成高质量、富有艺术感的图像。它运行在 Discord 平台上,用户需要加入官方 Discord 服务器,在指定频道中使用 /imagine 命令来提交提示词,机器人会返回四张候选图像供用户选择、放大或二次创作。该工具由位于美国加州旧金山的 Midjourney, Inc. 开发,自 2022 年公测以来,因其独特的视觉风格和强大的构图能力,在设计师、艺术家、创意工作者中广受欢迎。
如何开始使用 Midjourney?
首先,你需要一个 Discord 账号。访问 Discord 官网或下载客户端,注册并登录。然后进入 Midjourney 官网,点击页面上的“Join the Beta”(加入测试)按钮,系统会引导你加入 Midjourney 的官方 Discord 服务器。进入服务器后,在左侧频道列表中找到任意一个“newbies-”开头的新手频道(例如 #newbies-1),在输入框中输入“/imagine”命令,接着输入你想要的图像描述(prompt),按回车即可开始生成。请注意,新用户会获得约 25 次免费生成机会(具体次数视官方政策调整),使用完后需要订阅付费计划才能继续生成。
Midjourney 有哪些订阅计划?费用是多少?
截至 2025 年,Midjourney 提供四种付费订阅计划:基本计划(Basic Plan)每月 10 美元,包含约 3.3 小时的快速生成时间,适合轻度使用;标准计划(Standard Plan)每月 30 美元,提供 15 小时快速生成时间和无限慢速生成,适合大多数用户;专业计划(Pro Plan)每月 60 美元,包含 30 小时快速生成时间和更高优先级;大型计划(Mega Plan)每月 120 美元,提供 60 小时快速生成时间。所有计划均支持商业使用授权(需遵守具体条款,企业或高营收用户可能需要升级 Pro 或 Mega 计划)。你可以随时在 Discord 内通过 /subscribe 命令或在官网账户页面管理订阅。
Midjourney 生成的图像可以商用吗?
可以,但需要遵循具体授权条款。Midjourney 的付费订阅用户(包括 Basic、Standard、Pro、Mega)拥有所生成图像的商业使用权,前提是你遵守 Midjourney 的服务条款。例如,如果你的公司年收入低于 100 万美元,使用 Basic 或 Standard 计划即可获得商用许可;若年收入超过 100 万美元,则必须订阅 Pro 或 Mega 计划。免费用户(试用期)生成的图像仅限非商业用途。此外,商用图像不得违反 Midjourney 的内容政策(如生成暴力、色情、误导性内容)。具体细节建议查阅官网的 Terms of Service 和 Commercial Terms。
如何提高 Midjourney 出图的质量?
可以从以下几点入手:第一,描述要具体且包含风格、构图、光影、色彩等关键词,例如“a cinematic shot of a cyberpunk city at night, neon lights, rain, volumetric fog, 8k, hyperrealistic”;第二,使用参数调整,例如 --ar 16:9 设置宽高比,--v 6.1 指定模型版本,--s 1000 控制风格化程度(数值越大越艺术化);第三,利用“垫图”(image prompting),上传参考图并在提示词中粘贴图片链接,让 AI 参考构图或颜色;第四,善用缩放(Zoom Out)、重绘(Vary Region)、平移(Pan)等迭代功能;第五,学习社区优秀的提示词,Midjourney 官方文档中提供了大量示例和最佳实践。
Midjourney 的模型版本有什么区别?
Midjourney 从 V1 到 V6 经历了多次迭代。当前主流版本为 V6.1(2024 年底发布),相比 V5 和 V5.2,V6.1 在图像细节、文字渲染、手部构造、光影一致性方面大幅提升,并且能更好地理解复杂自然语言提示词,不再需要过度依赖“艺术语”或关键词堆砌。V5.2 是此前广受好评的版本,风格偏写实;V4 则更偏向概念艺术。此外还有 Niji 模型(专为动画和二次元风格优化)和 MJ 测试版模型。使用 --v 参数可以强制指定版本,例如在提示词末尾加上 --v 6.1。
Midjourney 支持哪些图像比例和输出尺寸?
默认比例为 1:1(正方形)。你可以通过 --ar 参数自定义任意宽高比,例如 --ar 16:9 适合横屏壁纸,--ar 9:16 适合手机竖屏,--ar 2:3 适合摄影构图。图像输出尺寸受版本和设置影响:在标准快速模式下,初始四宫格图像为 1024x1024 左右;放大后(使用 U 按钮)可获得更高分辨率(最高约 2048x2048)。使用“Remaster”或“Vary (Subtle)”功能可能提升细节,但无法直接输出 4K 原生分辨率。如果需要更大尺寸,可以结合外部工具放大,但请注意 Midjourney 的像素细节本身已经很高。
如何删除或隐藏我在 Midjourney 上生成的图像?
在 Discord 中,你可以右击任何你生成的图像消息,选择“删除消息”即可从当前频道中删除。但请注意,删除 Discord 消息不会从 Midjourney 的历史记录中移除——你仍然可以在个人库(Gallery)的“Your Images”标签下看到所有生成记录,包括已删除的频道消息。要彻底删除个人库中的图像,需要登录 Midjourney 官网(需连接 Discord 账号),在“Images”页面找到对应图像,点击“Delete”按钮。此外,你也可以使用 /private 命令将生成模式设为私密(需在订阅设置中开启),这样其他用户无法在频道中看到你的生成结果,但个人库仍会保存。
Midjourney 如何处理用户隐私和数据?
根据 Midjourney 的隐私政策,用户生成的图像默认会被用于训练和改进模型(除非你明确选择退出)。你可以在账户设置中关闭“允许使用我的图像进行训练”选项。此外,Midjourney 会收集 Discord 用户名、生成时间、提示词内容等数据以提高服务质量。如果你希望完全删除所有历史生成记录和个人数据,可以联系支持团队提交删除请求。请注意,由于 Midjourney 运行在公共 Discord 频道,默认情况下你输入的提示词和生成的图像会公开显示给同一频道的其他用户,建议使用私密模式(/private)或在自己的私有 Discord 服务器中邀请 Midjourney 机器人来获得更多隐私控制。
Midjourney 能否生成写实的人脸和文字?
可以。自 V6 版本起,Midjourney 在生成真实人脸(尤其是正面、侧面、人物的表情和皮肤细节)方面进步显著,尽管偶尔仍会出现“恐怖谷”效应或手指异常。对于文字生成,V6.1 可以较好地渲染简单的英文单词或短语(如标题、标识),但复杂句子或非英文字符(如中文)通常很难准确呈现,容易出现拼写错误或乱码。建议在需要文字时尽量使用简短、大写的英文,并在提示词中用引号明确指定,例如 “COFFEE SHOP” 作为 neon sign 的一部分。
Midjourney 有手机 App 吗?
Midjourney 没有独立的手机 App。你可以通过手机版 Discord App(iOS/Android)使用 Midjourney:安装 Discord 并登录,加入 Midjourney 服务器后,即可在手机端输入命令、查看生成结果、进行放大和变体操作。手机端的体验与桌面端几乎一致,但部分高级参数输入可能不如键盘方便。建议在手机端使用“/settings”命令调整默认参数(如版本、比例、风格化值),以减少每次输入的时间。
什么是 Midjourney 的“放大”和“变体”功能?
当你使用 /imagine 得到四宫格结果后,每个图像下方有 U1~U4 和 V1~V4 两组按钮。U(Upscale)表示放大,点击后选中图像将生成更高分辨率的版本(同时保留构图和细节);V(Vary)表示变体,基于选中图像生成四个近似但有所变化的新图像。此外,放大后的图像还会提供“Vary (Subtle)”和“Vary (Strong)”选项,分别进行细微或大幅度的调整。还有“Zoom Out”按钮可扩大画面视野,“Pan”按钮可上下左右平移构图。这些功能让你无需从头修改提示词即可迭代出理想图像。
Midjourney 的“--seed”参数有什么用?
--seed 是控制随机种子的参数,范围 0~4294967295。如果你使用相同的提示词和相同的种子值,Midjourney 会生成几乎一致的图像(由于系统变量,可能略有微小差异)。这对于复现特定的构图或风格非常有用。例如,你生成一张满意的图像后,可以通过右键点击消息并选择“Add Reaction”,输入 “env” 来查看该图像的种子号(或使用 /show 命令),然后在后续创作中显式添加 --seed 数字,使得同类提示词的输出保持相似风格。不设置种子时,每次生成都是随机结果。
Midjourney 的“平铺”(Tile)功能如何使用?
平铺功能用于生成可无缝重复的图案(如纹理、墙纸、布料)。在你的提示词末尾加上 --tile 参数,Midjourney 会输出一个左右上下边缘可以完美衔接的图像。注意,该功能对某些结构复杂的场景(如自然景观)效果可能一般,最适合抽象图案、几何纹理或简单重复元素。生成后,你可以下载图像并在 Photoshop 等软件中设置为图案填充。此外,也可以结合 --ar 参数调整平铺画面的比例。
如何避免 Midjourney 生成的图像出现扭曲或变形?
常见问题包括手指数量异常、身体扭曲、背景透视错误。解决方法:1. 使用最新版本(--v 6.1)可极大降低畸形率;2. 在提示词中加入具体的人体部位描述,例如“correct anatomy, detailed hands, natural pose”;3. 使用负面提示(negative prompt)功能,在提示词末尾加上 --no disfigured, deformed, extra limbs;4. 若单个图像中人物过多,容易互相遮挡,建议减少主体数量或使用“single subject”等限定词;5. 对于复杂场景,可先用简单的提示词生成大致构图,再通过变体或局部重绘逐步修正。
Midjourney 支持哪些语言?提示词必须用英文吗?
虽然提示词理论上可以输入任何语言,但 Midjourney 的底层模型主要基于英文训练,因此使用英文描述会得到最准确、最稳定的结果。使用中文或其他语言时,模型可能无法正确理解语义,导致构图混乱或风格偏移。官方推荐使用英文撰写提示词,你可以借助翻译工具将中文转为英文再提交。当然,你可以在提示词中加入少量非英文词汇(如“kawaii”“château”)来表示特定风格,但主干描述建议用英文。
Midjourney 的社区和画廊功能是什么?
Midjourney 官网有一个公开的“Gallery”(画廊),展示来自全球用户的最新和精选作品。你不需要登录即可浏览,也可以按关键词、风格、色彩筛选。登录后,你可以在“Your Images”中管理自己的生成历史,同时可以为喜欢的作品点赞、收藏或复制提示词。此外,Discord 中的“#showcase”频道、以及 Reddit、Twitter 上的 #midjourney 标签都是活跃的社区交流场所,你可以从中获取灵感、分享作品并学习技巧。
Midjourney 的未来发展有哪些方向?
根据官方公告和社区动态,Midjourney 团队正在开发独立的 Web 应用(不再完全依赖 Discord)、视频生成、实时编辑和更精细的控制(如局部区域提示词权重)。V6 系列版本已经在理解复杂指令和物理逻辑上取得重大进展,未来可能推出用于 3D 模型生成的工具,以及与 Adobe 插件等第三方工具的集成。官方建议关注 Midjourney 官网的“Updates”页面和官方 Discord 的 #announcements 频道以获取最新动态。