Sorry, you have Javascript Disabled! To see this page as it is meant to appear, please enable your Javascript!

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

发表评论
86,893 views

A+

所属分类：产业区块链

测评效果超过Gen-2、Pika以及现有AI视频生成工具。

结果上线不到24小时就引发众人围观，比如一条推文就有近20万浏览量。

不少网友惊讶其效果，甚至直言：比runway和pika还要好。

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

“比runway和pika还要好”

研究人员也的确进行了实际的效果比较。选手分别为：MagicVideo-V2、StabilityAI的SVD-XT，新潜力玩家Pika1.0，以及Runway的Gen-2。

研究人员还将MagicVideo-V2与当下最先方法进行一对一的人类评估。

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

结果显示，相较于其他方法，人们认为MagicVideo-V2的效果更好。

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

（绿色、灰色和粉色条分别代表 MagicVideo-V2 被评价为更好、相当或较差的试验效果。）

如何实现？

简单来说，MagicVideo-V2是一条视频生成流水线，集成了文本到图像模型、视频运动生成器、参考图像嵌入模块、插值模块。

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

首先是有T2I模块首先根据文字生成1024×1024图像，随后I2V模块对该静态图像进行动画处理，生成600×600×32的帧序列，然后再用V2V模块增强，并完善视频内容，最后再用插值模块将序列扩展到94个帧。

这样一来，既保证了高保真，时间上也有连续性。

不过早在2022年11月字节曾推出了MagicVideo V1版。

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜

不过，当时更强调的是高效性，它能在单个GPU卡上生成256x256分辨率的视频。

参考链接：

ByteDance presents MagicVideo-V2

Outperforms SotA video models such as Pika 1.0, SVD-XT according to human evaluation

abs: https://t.co/nZOlH58Ev5
proj: https://t.co/4MUrSbkE1r pic.twitter.com/6rrvYJ4pDL

— Aran Komatsuzaki (@arankomatsuzaki) January 10, 2024

项目链接：
https://magicvideov2.github.io/
论文链接：
https://arxiv.org/abs/2401.04468
https://arxiv.org/abs/2211.11018

免责声明

发文时比特币价格：$42249

当前比特币价格：[crypto coins=”BTC” type=”text” show=”price”]

当前比特币涨幅：[crypto coins=”BTC” type=”text” show=”percent”]

免责声明：

本文不代表路远网立场，且不构成投资建议，请谨慎对待。用户由此造成的损失由用户自行承担，与路远网没有任何关系；

路远网不对网站所发布内容的准确性，真实性等任何方面做任何形式的承诺和保障；

网站内所有涉及到的区块链（衍生）项目，路远网对项目的真实性，准确性等任何方面均不做任何形式的承诺和保障；

网站内所有涉及到的区块链（衍生）项目，路远网不对其构成任何投资建议，用户由此造成的损失由用户自行承担，与路远网没有任何关系；

路远区块链研究院声明：路远区块链研究院内容由路远网发布，部分来源于互联网和行业分析师投稿收录，内容为路远区块链研究院加盟专职分析师独立观点，不代表路远网立场。

我的微信
这是我的微信扫一扫

我的电报
这是我的电报扫一扫

版权声明：本站原创文章，于2024年1月11日16:35:25，由 区块逐字 发表，共 1262 字。
转载请注明：效果超越Gen-2！字节最新视频生成模型，一句话让绿巨人戴上VR眼镜 - 路远网

发表评论取消回复

您必须登录才能发表评论！

文章目录
繁