2025 年伊始,AI 视频领域便迎来新一轮技术竞赛,速度之快超出预期。 OmniHuman-1 发布不久,PixVerse 紧随其后推出了新模型更新,正式宣告 PixVerse V4 版本的到来。作为 AI 科技领域的观察者,笔者有幸在五天前获得了 PixVerse V4 的体验资格。经过全面测试,V4 版本在文本生成视频、图像生成视频以及新功能玩法等方面,均展现出肉眼可见的进步,底层模型能力实现了质的飞跃。
文本生成视频效果显著提升
PixVerse V4 在文本生成视频方面的能力提升令人印象深刻。以下是笔者测试的几个案例,直观展示新模型的生成效果:
文本生成视频案例 1:龙卷风灾难片
提示词: 龙卷风,高速移动,紧张刺激,城市公路上一辆 80 年代的橙色复古跑车高速前进、漂移。灾难电影氛围。
文本生成视频案例 2:雾气雄鹿
提示词: 空灵的雄鹿,身体由银色的雾气构成,在月光下闪烁着微弱的光芒。它的鹿角上装饰着浮动的光球,行动悄无声息,身后留下闪闪发光的雾迹。
文本生成视频案例 3:时空扭曲跃迁
提示词: 时空扭曲跃迁序列:应用爱因斯坦场方程模拟时空弯曲,相机沿克尔黑洞视界面运动,激活时间膨胀视觉效果。在跃迁点设置时空奇点,引入彭罗斯图解算法计算光锥变形(扭曲系数 145%)。
PixVerse V4 对科幻和硬核物理效果的支持尤其出色,生成效果令人惊艳。为了更直观地展示 PixVerse V4 在科幻和硬核物理效果方面的提升,我们来看一个案例。以下是生成该视频的提示词:
提示词: 超球面维度跃迁镜头: 11 维空间投影镜头运动,使用黎曼流形轨迹算法,在维度坍缩时激活拓扑缺陷视觉预警系统。
在超球面维度跃迁的案例中,视频中出现了文字,但测试表明,当前版本文字生成的可控性还有待提高,文本生成视频中可以生成文字,但在图像生成视频中尚不支持文字生成,且仅支持英文输入。
生成速度大幅提升 & V4 模型稳居 T1 梯队
除了生成效果的显著提升,PixVerse V4 另一个令人印象深刻的特点是生成速度的大幅提升。在极速模式下,大约 5 秒即可生成视频,效率提升非常明显。 综合来看,PixVerse V4 相比 V3.5 在各方面都有显著提升,新版 V4 模型无疑是当前 AI 视频领域的第一梯队水准。
回顾 PixVerse 的发展历程,其技术迭代速度令人瞩目:V1 版本于 2024 年 1 月 15 日上线,V2 版本于 7 月 24 日,V2.5 版本于 8 月 22 日,V3 版本于 10 月 29 日,V3.5 版本于 12 月 29 日,而最新的 V4 版本则在 2 月 24 日发布。 PixVerse 坚持快速迭代模型能力的策略是正确的。即使 PixVerse 凭借特效模板功能多次在社交媒体上引发热议,甚至在部分中东国家 App Store 榜单登顶,但 PixVerse 始终没有放缓模型迭代的步伐,反而不断加速模型进化。
自从 DeepSeek 引起广泛关注之后,AI 领域普遍形成共识:“AI 唯一的应用是智能本身”。 模型能力是 AI 技术发展的基石。应用层面的功能和体验优化,都是为了降低用户使用 AI 技术的门槛,如同模型能力的系数。例如,若模型能力为 10 分,有趣的特效模板功能如同系数 10,最终应用表现可达 100 分。反之,若模型能力仅为 1 分,即使应用功能再强大,最终效果也难以令人满意。
反观 AI 视频领域的 Runway 公司,其功能创新值得肯定,例如 Act-One、超级镜头运动等功能。 然而,在过去的半年里,Runway 的模型似乎没有显著的迭代更新。业内人士都清楚,在 AI 技术日新月异的背景下,半年时间意味着什么。 PixVerse 在技术迭代和功能创新之间找到了平衡点:在保持模型快速迭代的同时,不断提升模型的基础能力,从而使其他功能创新更具价值。
Sound 功能 & 特效模板再升级
PixVerse V4 推出了一项引人注目的新功能:Sound。
细心的读者可能已经注意到,前文展示的案例大多为视频格式,而非 GIF 动图。这是因为 PixVerse V4 生成的视频已具备自然流畅的音效。 (前文文本生成视频案例未使用视频格式展示,是由于平台单篇文章视频数量上限限制)。 用户只需启用 Sound 功能,即可为生成的视频自动匹配音效。
此外,PixVerse V4 还新增了 Speech (口型同步)、Restyle (风格迁移) 等实用功能,用户可以自行体验。 正如前文所述,强大的基础模型是各项功能有效发挥作用的前提。
最后,让我们再次聚焦 PixVerse 的明星功能——特效模板。 作为特效模板功能的开创者,PixVerse 在 V4 版本模型能力的加持下,特效模板的质量也更上一层楼。
PixVerse 的特效模板功能一直备受赞誉,在 V4 版本的模型加持下,其生成视频的质感和动作表现力再次提升。
总而言之,强大的模型能力是 AI 视频技术发展的基石。只有不断提升模型自身的智能水平,才能让特效、音效、风格迁移等应用功能真正发挥潜力,为用户带来 혁신적인 体验。可以预见,AI 视频领域的竞争将更加激烈,而技术创新无疑是 PixVerse 等厂商保持领先地位的关键。