默认输出 1024×1024 像素,可通过放大功能提升至更高分辨率,细节锐利、纹理真实,满足打印与数字展示需求。
通过 --style、--stylize 等参数以及提示词组合,可模拟摄影、油画、赛博朋克、二次元等多种风格,每次迭代都赋予创作者更大的美学自由度。
支持自定义宽高比(如 16:9、4:3、1:1 等),适配社交媒体、海报、影视分镜等不同场景,输出格式涵盖 PNG、JPG 及高动态范围图片。
Midjourney 以内部测试的形式首次亮相,由专注于人工智能研究的独立实验室开发。该工具基于扩散模型,能够通过文本描述生成图像,初期仅对邀请用户开放,主要目标是探索文本到图像生成的极限。这一阶段的积累为后续的公开测试打下了技术基础。
3月,Midjourney 正式进入公开测试阶段,用户通过 Discord 机器人即可体验。同年7月发布 V3 版本,显著提升了图像风格多样性、构图合理性以及色彩饱和度,使其在设计师和艺术家群体中迅速走红。11月推出 V4 版本,采用新的训练架构,在人物面部、手部细节以及场景一致性上取得突破性进展,成为当年最具影响力的 AI 绘图工具之一。
3月,V5 版本上线,大幅提高了图像的逼真度和细节丰富度,支持更高分辨率输出,并改善了文本理解和复杂场景生成能力。同年12月,V6 版本发布,在光影物理准确性、材质表现以及文字嵌入方面实现质的飞跃,同时引入更强大的自然语言理解,用户可通过更口语化的提示词获得高质量结果。
7月推出 V6.1 改进版本,重点优化了面部表情的自然度、皮肤质感以及光影过渡效果。12月发布 V6.2,增加了对图像风格化强度的精细控制,并改进了用户界面的交互逻辑。此外,Midjourney 在这一年开始内部测试视频生成功能,将生成能力从静态图像拓展至动态短片。
3月,V7 版本正式发布,采用全新底层模型架构,在图像一致性、创意多样性及生成速度上均有显著提升。该版本同时集成了视频生成模块,支持文本到视频的直接转换,标志着 Midjourney 从纯图像生成向多模态内容创作平台转型。用户社区规模持续扩大,官方也在逐步探索商业化订阅与 API 服务。