• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

谷歌发布超强AI视频编辑工具!施展魔法的VLOGGER,音频加图片就搞定唇形和手势,还把表情编辑玩出花了!

谷歌发布超强AI视频编辑工具!施展魔法的VLOGGER,音频加图片就搞定唇形和手势,还把表情编辑玩出花了!
AITOP100
2024-04-07 13:45:18

出品 | 51CTO技术栈(微信号:blog51cto)

编译丨伊风

视频生成模型的脚步永不停歇!

图片 图片

4月2日,谷歌刚刚发布了强到可怕的AI视频编辑工具VLOGGER。VLOGGER就像收集了很多视频生成领域的前沿AI技能,而打造出的一款百宝箱。其中也有一些亮点细节,例如通过AI编辑,将让画面中讲话者的闭眼、闭嘴、甚至“wink”。

这意味着视频编辑在细节的深入上又精进了一个level!

VLOGGER的工作原理即输入音频和图像, 由“读唇器”根据音频预测说话者的动作,而“动画器”根据说话者的照片和动作细节创建视频帧。

图片 图片

 

要知道VLOGGER这个百宝箱里都装了什么,可以跟随以下示例来看!

1.VLOGGER的多面能力

基础的图生视频功能

将图片驱动为一段视频。

图片 图片

多语种唇形切换

输入一种语言的视频和另一种语言的音频,它能根据新输入的语言调整说话者的嘴部动作!

顺便一提,OpenAI的VOICE ENGINE也在关注多语种的能力。可以根据一段音频生成一段保留原声音色及口音的外语视频,如果这些能力都能打通,那么音视频内容的出海将会畅通无阻。 

 

图片 图片

表情细节编辑

VLOGGER使得表情编辑更进一步,例如单独控制一只眼睛等。通过使用工具,将生成新的面部表情和动作,用以提升视频的创意。 

图片 图片

2.最终效果,进步了但未完全消除“恐怖谷”

图片 图片

毫无疑问VLOGGER的视频留下了令人印象深刻的亮点。如讲话时自然的身体姿势,增加手部运动以在一定程度上提升了视频的真实感。然而,生成的表情和动作比起真实视频还存在机械感重、不流畅的问题,因此会存在一定的“恐怖谷”效应。

参考链接:https://twitter.com/hey_madni/status/1774832882902864327

想了解更多AIGC的内容,请访问:

51CTO AI.x社区

https://www.51cto.com/aigc/

0
0
原文链接:https://www.51cto.com/article/785532.html
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
相关资讯
  • 谷歌Gemini AI助手入驻Chrome:这才是真·智能浏览!

  • 这是个资讯

  • 测试内链识别文字

  • <script>alert("eee标题")</script>

  • 111

热点资讯

暂无数据

分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有