2024.9.27-今天没什么新闻

1、omni-zero-couples:生成指定风格指定人脸的情侣照 提供一张情侣图作为底图,再提供一男一女作为要替换的人物图,可选设定图片风格参考,即可生成新人物的情侣图。效果一般,但是还算有趣。 Github:https://github.com/okaris/omni-zero-couples 在线使用:https://huggingface.co/spaces/okaris/omni-zero-couples

image.png

2、EMOVA:原生多模态LLM

具备图片+语音+文本的多模态能力,即完整版GPT-4o的能力。目前仅有演示,没有开源或API。

项目地址:https://emova-ollm.github.io/

video_demo_compressed.mp4

3、ElevenlabsDubbingGradio:AI翻译+配音

Elevenlabs的一个Gradio应用,输入你的Elevenlabs API,上传视频,即可生成指定语言的新配音。

可以认为是一个简化版的HeyGen,不会改变视频中人物的嘴型,估计音频长度和视频的对齐也会有问题。

Github:https://github.com/larsdpeder/ElevenlabsDubbingGradio