最近几周,由AI生成的会说话的网红视频疯狂传播。这些视频的逼真程度让人惊叹。
老实说,这些视频中的”恐怖谷效应“仍然存在。它们给人一种有点太过人工的感觉,但同时,你不得不承认AI在短短几个月内取得了多大的进步。
这既让人惊叹又有点可怕。当AI生成的人开始发表让你不得不仔细观看的TED演讲时,你就知道技术进步得太快了。
从TED演讲的照片开始,人们开始进一步尝试,使用像Runway Gen-3 Turbo和Kling AI这样的AI工具将这些图像转换成视频。为了增加最后的真实感,他们还使用RenderNet AI添加AI生成的配音和唇形同步,让这些数字网红栩栩如生。
在本文中,我将指导您使用四种AI工具创建属于自己的会说话的AI网红的完整工作流程:
- 使用Midjourney或Flux生成图像
- 使用Freepik Upscaler提升图像质量
- 使用Kling AI将图像转换为视频
- 使用RenderNet AI制作唇形同步视频
第1步:生成图像
第一步是为你的AI网红生成逼真的肖像照。你可以使用任何图像生成工具,但如果你追求最高级的真实感,我推荐使用Midjourney或Flux。
以下是使用Midjourney生成的示例图像:
提示词: 电影风格摄影,中景,魅力Instagram拉丁裔女性。她有棕色头发,带有紫色亮点。魅力女性。她有一张漂亮的脸,坐在咖啡馆里。一位网红,面带微笑,手势仿佛在解释什么。
这是我最喜欢的一张:
你可以随意调整提示词,生成尽可能多的图像,直到得到适合你的AI网红的完美照片。
第2步:提升图像质量
对于这一步,我将使用Freepik图像增强器。这个工具由Magnific AI驱动,结果会非常出色。
这是最终结果:
我喜欢这个工具为皮肤和头发添加纹理,使整体图像更加细致和逼真。
另一种方法是通过RenderNet AI的TrueTouch功能来提升图像质量。只需进入RenderNet AI仪表板,选择TrueTouch功能并上传原始图像。
它同样强大,并在增强图像方面提供了更多的自定义选项。
这是最终结果:
这张图像的细节水平看起来比我们在Freepik上做的还要好。皮肤纹理更锐利,而且眼睛看起来非常真实。
第3步:将图像转换为视频
下一步是将我们在第2步中创建的肖像图像转换为真实的视频。为此,我们需要借助AI视频生成工具,如Runway Gen-3、Kling AI、Vidu或Luma的Dream Machine。
如果你不想付费使用高级服务(像我一样),最好的免费替代品是Kling AI。Kling每天提供66个视频生成积分,足够创建至少五个5秒钟的视频剪辑。
前往Kling AI网站并创建一个账户。进入AI视频页面,在”图像参考”标签下上传我们的AI网红图片。
添加以下描述来指导AI生成我们想要的视频类型:
提示词: 一个微笑着说话的女人,说话时使用手势,多次眨眼,看着观众。
你可以根据需要自由调整提示词。
你可以根据自己的想象随意定制提示词。比如你希望你的AI网红看起来若有所思、机智或者略带恼怒。
这是最终视频的样子:
另外,你也可以使用Runway的Gen-3 Turbo将图像转换为视频。目前,他们提供300个免费生成积分。
这是最终的视频:
生成一个10秒的视频大约消耗30个积分。
很好!她看起来很生动,脸上的表情似乎在热情地分享成为网红的秘诀。
但是这里有个问题:她到底在说什么?这就是下一步的内容,添加旁白并同步她的嘴型。
第4步:编写脚本
现在我们有了视频,是时候给你的AI网红配音了。为此,你可以使用任何免费的AI聊天机器人,如OpenAI的ChatGPT、Google的Gemini或Anthropic的Claude AI,或者国内的百度文心、Kimi等等。
这里有一个简单的提示词可以开始:
提示词: 为一个10秒的视频剪辑写一段单独的段落脚本,内容是一个网红分享她走红的秘诀。
“想知道我走红的秘诀吗?这一切都关乎一致性、创造力和与观众互动!定期发帖,保持内容新鲜,并始终回复评论。这就是我如何将粉丝变成社区,让每一个帖子都成为热门的方法!”
第5步:添加旁白和唇形同步
现在来到最后一步 – 为你的AI网红添加声音并使她的嘴型与脚本同步。为此,我们使用RenderNet AI的Narrator功能。
注意2:此功能不包含在RenderNet AI提供的每日10个免费积分内。你需要购买积分才能使用此功能。生成一个10秒的视频剪辑将消耗367个积分。
首先,登录你的RenderNet AI账户并进入Narrator页面。上传我们之前生成的视频,然后按照提示操作。
注意1:视频必须是MP4格式,最大分辨率为2560×2560像素,最高帧率为60 fps。
如果你想更换面孔,有这个选项,但在这个例子中,我们使用我们原创的形象。
点击下一步按钮,设置语音和脚本(使用我们在第3步生成的脚本)。
在选择语音时,确保选择与AI角色匹配的声音。在这个例子中,我发现Rachel的声音非常适合我们的AI网红。
最后,点击生成按钮并等待处理完成。它会跳转到RenderNet Studio,在那里你可以根据需要对视频进行微调。
调整好后,下载最终结果,一个完全唇形同步的、会说话的AI网红视频。
这太酷了!我刚刚在不到一小时内制作了自己的会说话的AI网红视频,太不可思议了!
小结
说真的,做这个小实验我可玩嗨了,最后整出来的效果也是没谁了。想想看啊,咱们普通人随便摆弄几个AI工具,几分钟就能搞出这么个玩意儿,简直不可思议!AI这玩意儿发展得也太快了吧,感觉再过不久,这些AI模型怕是要上天啊。
你们想象一下,以后随便一个人,就一台破电脑加个网,就能整出一整套TED演讲或者超详细的产品测评,关键是自己连个镜头都不用露。这想法听着是挺带劲,但说实话,也挺吓人的。
咱们必须得清醒地认识到,这技术虽然牛,但风险也不小。要是管得不严,那些深度伪造、假新闻、政治忽悠可就满天飞了。所以啊,各位老铁们,咱用这些工具的时候,可得小心着点。
——
内容转自微信公众号「科技未来派」