Midjourney推出新版本 文生成模型再进一步

Midjourney的最新版本V6在12月21日于Discord上发布了测试版,目前处于alpha测试阶段。根据用户反馈,V6展现出了令人印象深刻的能力,能够轻松生成写实的图片和抽象的艺术作品,不输给设计师和摄影师。

Midjourney的首席执行官DaVid Holz将V6定位为一项重大革新成果。这是他们在AI超级集群上从零开始训练的第三套模型,开发周期长达九个月。Holz表示,V6生成的图像在真实度方面显著超越了之前的版本。V6的主要改进包括更高质量的画面、更强的语义理解能力、支持嵌入文本和更多提示词,以及更高的连贯性和丰富的模型知识。

据用户测试,V6现在支持超过350个字符的提示词长度,甚至能够理解标点和语法的微妙差异。从用户展示的图像来看,V6在理解力、光影、构图、材质和色彩等细节方面较上一代产品有显著提升。

这一性能提升有望为设计和营销行业带来更大的益处。一些跨境电商已经开始使用Midjourney的大模型制作商品介绍页和模特展示图。

此外,V6在处理人物细节方面取得了显著进展,能够呈现出手部的指纹和皮肤纹路,这是AI绘画领域的一次重要突破。

尽管V6目前还缺少V5.2模型中的一些功能,如左右平衡和缩放,但Holz表示这些功能将在后续更新中实现。

Midjourney的发展并未止步于V6,他们计划在未来迭代中进一步提升速度、图像质量、连贯性、提示遵循和文本准确性。V6发布后的30分钟内,已经宣布了第一次更新,生成速度提升了2.7倍。

未来,Midjourney的技术更新方向包括生成3D内容和视频。Holz预测,到2030年,他们可能会实现以每秒30帧的高分辨率实时生成整个视频游戏的内容。

Midjourney在Discord平台上的用户数量从200万增长到了1767万,每天有超过100万人上线。该产品已经实现了付费模式,用户可以根据不同套餐选择,每月费用从10至120美元不等。目前,由40名员工组成的团队使得Midjourney在2022年9月成功实现了2亿美元的年度盈利。