1、Fish Speech V1.2:可能是目前最好的中文开源TTS 效果逼真,能说绕口令,支持克隆语音,效果稳定,可用性比ChatTTS、GPT-SoVITS强太多了。 模型(开源不可商用):https://huggingface.co/fishaudio/fish-speech-1.2 在线使用:https://fish.audio/zh-CN/
2、Runway开放Gen3
目前仅支持文本生成视频,付费用户可用,效果跟Luma、可灵不相上下,各有优劣,缺点是太贵了,折合5秒钟1美元。
有网友实现了角色可控,可以在多次生成时保持角色不变。
3、微软悄然更新了Phi3-mini 模型能力提升,指令遵循能力提升,代码能力大幅提升。 模型地址:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3
4、TensorArt:在线AI绘画平台,功能全面且有特色。
支持SD3、腾讯混元、SDXL等几乎全部的开源模型,支持Layer Diffusion生成透明背景,支持高清放大图片,支持自动修复面部和手部异常。
更有特色的是,你可以把自己的ComfyUI工作流封装成操作简单的H5页面(称作“AI小工具”),普通用户上传图片或输入提示词即可使用。社区里已经有不少人分享AI小工具,以下几张图就是我用AI小工具实现的效果(具体链接在ALT里)。
使用地址:https://tensor.art
5、MimicMotion:腾讯开源的AnimateAnyone
输入动作序列+参考角色,生成该角色的动作视频。