人工智能图像生成领域的热门工具 Midjourney 近日发布了其最新模型 Midjourney V7 的 Alpha 测试版本。此次更新距离上一个主要版本 V6 发布已近一年,带来了多项重要改进和新功能,旨在提升图像质量、用户体验和创作效率。
核心更新:图像质量与文本理解力提升
根据 Midjourney 官方及其 CEO David Holz 的介绍,V7 被称为“迄今为止最智能、最美观、最连贯的模型”。新模型在多个方面展现了进步:
- 图像质量:V7 生成的图像在纹理、细节(尤其是身体、手部等长期存在的难点)和整体连贯性上有了显著提高。用户分享的早期 V7 生成图像展示了令人印象深刻的细节水平和更高的真实感。相比 V6,V7 的图像被认为更加自然,减少了“蜡像感”或过度编辑感。
- 文本理解:V7 能够更智能地处理文本提示,提升了对复杂或细微描述的理解和执行精度。
- 个性化默认开启:V7 是 Midjourney 首个默认启用“个性化”功能的模型。用户需要先对大约 200 对图像进行评分,以建立个人化的视觉偏好档案。Midjourney 会学习用户的审美偏好,从而调整生成结果,使其更符合个人风格。用户也可以选择关闭此功能。
创新功能:“草稿模式”与语音交互
本次 V7 Alpha 版本最大的亮点之一是引入了全新的“草稿模式” (Draft Mode)。该模式具有以下特点:
- 高效率与低成本:生成速度据称比标准模式快 10 倍,而成本仅为标准模式的一半。
- 快速迭代:适合快速构思和创意迭代。用户可以快速生成初步想法,如果对结果满意,可以点击“增强”或“变化”以完整质量重新渲染。
- 语音交互:草稿模式支持语音输入。用户可以直接说出想法,让模型实时生成或调整图像,实现“边想边创作”的流畅体验,这被称为“对话模式”。
- 调用方式:在提示词后加入
--draft
参数即可启用。
版本与限制
目前,Midjourney V7 Alpha 提供了 Turbo(更快,成本更高,是 V6 常规速度成本的两倍)和 Relax(成本较低)两种标准渲染模式。标准的正常速度模式仍在优化中,将在未来提供。
需要注意的是,Alpha 版本的 V7 尚不包含所有功能。图像放大 (upscaling)、编辑和重新纹理 (retexturing) 等功能目前仍会调用 V6 模型来完成,预计将在未来两个月内逐步添加到 V7 中。
如何体验与未来展望
想要体验 Midjourney V7 Alpha,用户需要先完成个性化档案的建立(通过评分至少 200 对图片)。之后,可以在 Midjourney 网站或 Discord 机器人上选择使用 V7 版本(通过添加 --v 7
参数或在设置中选择)。
Midjourney 承诺在接下来的两个月内,每隔一到两周会为 V7 模型推出新的更新和功能,包括新的角色和对象参考系统。
尽管面临关于 AI 训练数据的法律诉讼,Midjourney 作为一家未接受外部融资的独立公司,仍在持续发展,并计划扩展到硬件、视频和 3D 对象生成等新领域。Midjourney V7 的发布,预示着 AI 图像生成技术在质量、效率和个性化方面又向前迈进了一步,其后续发展值得业界和用户持续关注。