1、ChatTTS:合成超真实的语音
支持中英双语,会自动加入语气助词,特别像真人,读绕口令也有人的那种卡顿(效果不稳定)。
Github:https://github.com/2noise/ChatTTS
在线使用:https://huggingface.co/spaces/Dzkaka/ChatTTS
在线colab:https://colab.research.google.com/drive/1fJGsNoKxUD62no-Y2mb5onAkhIXbsrI5?usp=sharing
2、图片转手办模型
效果非常好。
ComfyUI工作流:https://openart.ai/workflows/datou/pvc-figurine/wH0ZKK3Ow2hFS3rkoRoD

3、MusePose:动作驱动的AI虚拟人视频生成
提供角色参考图和openpose动作视频,生成该角色的动作视频。基于Moore-AnimateAnyone优化,实现了阿里AnimateAnyone的效果。
Github:https://github.com/TMElyralab/MusePose
334049449-bb52ca3e-8a5c-405a-8575-7ab42abca248.mp4
4、Llama3-V:小模型开源最佳视觉模型
比LLaVA 1.6 7B强不少。