1、Galileo:文字生成UI
支持文字生成UI和图片生成UI,效果很好。
在线使用:https://www.usegalileo.ai/explore
ssstwitter.com_1707245751995.mp4
2、YOLO-World:实时检测图片是否包含目标物 输入图片或视频,写出要检测的目标,可以实时标记出目标在图片中的位置。在V100上运行可以达到52FPS。 在线体验:https://huggingface.co/spaces/stevengrove/YOLO-World Github:https://github.com/AILab-CVC/YOLO-World 论文:https://arxiv.org/abs/2401.17270
3、BRIA-RMBG:一键抠图,去除背景 开源最佳,不可商用,效果还可以。 在线使用:https://huggingface.co/spaces/briaai/BRIA-RMBG-1.4 模型:https://huggingface.co/briaai/RMBG-1.4
4、MetaVoice 1B:支持语音克隆的TTS模型 开源可商用,仅支持英文,支持英式发音和美式发音。 Github:https://github.com/metavoiceio/metavoice-src 模型:https://huggingface.co/metavoiceio/metavoice-1B-v0.1
ssstwitter.com_1707275139103.mp4
5、Deforum 发布 Deforum Studio
之前只能在Discord频道使用。Deforum 通过演化的方式生成视频,不算常规的AI视频模型,是不能生成例如运动、镜头移动之类的效果的。