1、阿里发布Wan 2.6
不开源,Wan 2.5的升级版,支持角色参考,能同步生成音频和视频。
官方介绍:https://wan.video/blog/wan2.6-introduction
e6af628d1e29475db62aed0c0dda6d081765807783234.mp4
2、英伟达发布Nemotron 3系列模型 分3个版本: Nemotron 3 Nano,30B总参数,激活3B; Nemotron 3 Super,100B总参数,激活10B; Nemotron 3 Ultra,500B总参数,激活50B;
目前30B模型已开源,另外2个明年上半年开源。同时开源了训练数据集。 模型:https://huggingface.co/collections/nvidia/nvidia-nemotron-v3
3、One-to-All Animation:让照片动起来 能让照片人物,按参考视频的动作动起来,基于Wan2.1训练,效果比Wan2.2 Animate还好一些,支持大幅度的动作复刻。 Github:https://github.com/ssj9596/One-to-All-Animation ComfyUI工作流:‣
4、Resemble AI开源Chatterbox Turbo TTS模型,能实时生成音频,目前只开源了英文版本,有多语言版本尚未开源。
模型:https://huggingface.co/collections/ResembleAI/chatterbox-turbo
Banana Pro国内直连版
我做的小产品。无需VPN,填写key就能用,操作简单,适合小白。买了可以给别人用,搭个人情也不错。所有分辨率(1K/2K/4K)都是3毛一张,极具性价比,也可以同时使用我做的AI PPT功能。Banana Pro已经是工具,其他AI绘画还只是玩具。
使用Banana Pro:https://gordensun.github.io/BananaPro/