2024.7.5-LivePortrait：面部视频合成

1、LivePortrait：面部视频合成

提供一张角色参考+一段面部视频参考，即可合成该角色的面部视频。目前开源效果最佳，尤其适用于创建表情包。再搭配上克隆语音，恶搞经典影视剧太容易了。

效果演示：来自@huanggou

2、FunAudioLLM：语音识别模型和语音合成模型

FunAudioLLM是阿里通义团队发布的用于打通人类和LLM语音交流的框架，核心包含2个模型：

· SenseVoice：语音识别模型（ASR）

· CosyVoice：语音合成模型（TTS）

2个模型的质量非常高，SenseVoice在中文和粤语识别上，速度和准确度均比Whisper好；CosyVoice支持多语言、跨语言（句子中同时包含多个语言）、音色和情感控制、音频克隆，效果在开源模型中位于前列。