作者:老余捞鱼
原创不易,转载请标明出处及原作者。

写在前面的话:这两年来 Midjourney 一直是互联网上最好的人工智能图像生成器。它制作了一些我们所见过的最流行和最具争议的 AI 图像,Midjourney 无与伦比的快速连贯性和照片级真实感使其领先于 OpenAI、谷歌和亚马逊等 AI 领域的巨头。但最近 Midjourney 好像遇到了一个真正的竞争对手。Freepik 发布了其最新的AI 图像生成器— Mystic。在本文中,我将根据图像质量、即时连贯性、文本渲染准确率三个关键标准对 Mystic 与 Midjourney 的 V6.1 进行比较。
一、什么是 Mystic?
Mystic 是Freepik最新、功能最强大的图像模式 – 比最新推出的 Flux 图像模式强大得多。当您打开图像生成器工具并展开“模型”选项时,您会在列表底部看到“Mystic”。

Freepik 于近期正式推出 Mystic,现在可供付费用户使用。让我们首先比较一下他们在最重要的领域之一的能力:即时连贯性。
二、即时连贯性 PK
人工智能图像生成最关键的方面之一,也是许多模型常常缺乏的方面,就是即时连贯性。这指的是人工智能图像生成器创建与输入提示在逻辑和视觉上一致的图像的能力。要实现这一点,需要提示清晰、具体、没有歧义或矛盾,确保生成的图像与预期输出相匹配。
为了评估 Mystic 和 Midjourney 图像生成器的一致性,我使用了以下提示:
Prompt: Photo of a red sphere on top of a blue cube. Behind them is a green triangle, a dog on the right, a cat on the left


从上面的图片来看, Mystic 表现令人印象深刻,准确地按照描述和正确的顺序渲染了所有元素。相比之下,Midjourney V6.1 表现不佳——它不仅未能正确表示所有元素,而且还将猫放在了右侧,这与提示相反。
尽管有些人可能认为 Midjourney 偶尔会在这样的特定测试中遇到困难,但我的反复试验表明,在这种情况下它总是会失败。
首次引入此题目是为了展示 Stability AI 的稳定扩散 3图像模型的一致性。令人惊讶的是,五个月前的 SD3 图像模型仍然比 Midjourney 的最新模型表现更好。这是 SD3 的一个示例结果。

结果与提示的准确性非常准确,并且在动物白色皮毛上添加的微妙绿色色调非常令人印象深刻。
三、图像质量 PK
接下来,我们来进行图像质量的比较。为了真正比较 Mystic 和 Midjourney,我使用同样的提示来生成图像:
Prompt: Cinematic photography, medium shot, glamour instagram young woman. She has brown hair with purple highlights. glamour woman. She has a pretty face, She is sitting in a coffee in bar. An influencer, smiling face, with hand gestures as if she’s explaining something


两张图都很棒!Mystic 拍摄的图像非常惊艳,注重细节。皮肤纹理看起来更自然,细发丝更清晰,让图像呈现出无与伦比的逼真品质。
Midjourney 的图像乍一看同样令人印象深刻。然而,Midjourney 的一个反复出现的问题是它往往无法正确渲染手指。如果你没有注意到这一点,请再看一遍。
我们再来一轮比较:
Prompt: The baby kangaroo is unbelievably tiny, even smaller than a single grain of sand, perched delicately on the fingertip. Its minuscule body is covered in soft, velvety light brown fur, making it look like the tiniest, fluffiest speck of earth. The kangaroo’s eyes, though incredibly small, are bright and wide with curiosity, twinkling with a gentle innocence that melts the heart. Its tiny face, no bigger than a poppy seed, radiates pure sweetness, with an adorably round snout and a little smile that adds to its cuteness. The kangaroo’s tiny, rounded ears are perked up and impossibly cute, giving it an extra touch of charm.


好吧,这两款软件的效果都不错。在动物照片方面,Midjourney 和 Mystic 的效果都非常好。不过,Mystic 呈现的细节和真实感更清晰一些,让图像看起来更贴近现实。Midjourney 往往倾向于呈现更饱和、风格化的效果。
四、文本渲染准确度 PK
AI 图像模型的一个重要方面是它们能够在图像上呈现清晰易读的文本。这通常是图像模型的难点,因为对于 AI 模型来说,文本只是线条和形状的组合,而不是具有内在含义的东西。它们对字母、单词及其排列的直觉理解与人类不同。AI 将文本视为另一种视觉元素,而不是代表语言的符号。
令人惊讶的是,Mystic 和 Midjourney 都能够理解各种表面纹理并在其上添加文字。看看这些结果:
Prompt: An image of a young male model wearing a gray shirt with the text “Freepik Mystic” on it. The image is for advertising purposes with a plain background and studio lighting.


在上面的两张图片的情况下,我会选择 Mystic 生成的图像。不仅文本更清晰,而且图像的整体构图也更专业。
五、Mystic VS Midjourney V6.1
根据这些比较,很明显 Mystic 有很多优势。虽然我们仍然不知道 Mystic 基于哪种 Flux 图像模型,也不知道用于微调它的具体数据集,但其性能不言而喻。在 Midjourney 表现不佳的领域,Mystic 一直表现优于 Midjourney——特别是在正确渲染四肢和手指以及在各种表面上准确放置文本方面。
此外,Freepik 收购Magnific.a i 进一步提升了 Mystic 的价值。通过集成最强大的AI 图像升级器,用户现在只需单击一下即可升级其 AI 生成的图像。

这种增加的便利性,加上 Mystic 的卓越性能,使其成为 AI 图像生成领域的强大挑战者。
六、总结
- Mystic 在提示连贯性方面优于 Midjourney V6.1:通过具体的图像生成测试,Mystic 能够更准确地按照描述生成图像,而 Midjourney 在某些情况下出现了元素摆放错误。
- Mystic 提供更高的图像质量:在生成人物和动物的照片时,Mystic 展现了更加细腻和真实的纹理细节。
- Mystic 在文本渲染方面表现更佳:Mystic 能够在各种表面上更清晰地渲染文字,这对于广告和设计工作尤为重要。
- Mystic 的价值增加了 Freepik 的竞争力:结合 Magnific.ai 的技术,Mystic 为用户提供了一键式图像升级的便利,这在竞争激烈的 AI 图像生成市场中是一个显著的优势。
总之,我不得不说,Mystic 感觉比 Midjourney 更好。事实上,它尚未公开发布,这意味着在最终发布之前,可能会有进一步的改进。
令人惊讶的是,Midjourney 最终向所有人开放了其网络平台,这表明它正在逐渐脱离 Discord 的根源——说实话,很多非科技人士都会欣赏这一举措。但为什么他们花了这么长时间才这样做?为什么是现在?我猜他们开始感受到竞争对手的压力,尤其是 Blackforest Labs 发布 Flux 之后。Freepik 等平台已经集成了 Flux,并且它可以与 Upscaler 等其他工具无缝协作。
为了保持领先地位,Midjourney 需要尽快发布更强大的图像模型。如果他们不这样做,那么在不久的将来,我们开始听到更多有关 Freepik 或 Ideogram 等竞争对手的消息,我一点也不惊讶。
本文内容仅仅是技术探讨和学习,并不构成任何投资建议。
转发请注明原作
Be First to Comment