2024.7.2-可能是目前最好的中文开源TTS

1、Fish Speech V1.2：可能是目前最好的中文开源TTS 效果逼真，能说绕口令，支持克隆语音，效果稳定，可用性比ChatTTS、GPT-SoVITS强太多了。模型（开源不可商用）：https://huggingface.co/fishaudio/fish-speech-1.2 在线使用：https://fish.audio/zh-CN/

TTS.mp4

2、Runway开放Gen3

目前仅支持文本生成视频，付费用户可用，效果跟Luma、可灵不相上下，各有优劣，缺点是太贵了，折合5秒钟1美元。

有网友实现了角色可控，可以在多次生成时保持角色不变。

官网：https://runwayml.com/

3、微软悄然更新了Phi3-mini 模型能力提升，指令遵循能力提升，代码能力大幅提升。模型地址：https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

4、TensorArt：在线AI绘画平台，功能全面且有特色。

支持SD3、腾讯混元、SDXL等几乎全部的开源模型，支持Layer Diffusion生成透明背景，支持高清放大图片，支持自动修复面部和手部异常。

更有特色的是，你可以把自己的ComfyUI工作流封装成操作简单的H5页面（称作“AI小工具”），普通用户上传图片或输入提示词即可使用。社区里已经有不少人分享AI小工具，以下几张图就是我用AI小工具实现的效果（具体链接在ALT里）。

使用地址：https://tensor.art

Untitled

5、MimicMotion：腾讯开源的AnimateAnyone

输入动作序列+参考角色，生成该角色的动作视频。

项目地址：https://tencent.github.io/MimicMotion/