1、Gemini 2.5 Pro (I/O edition)
谷歌最新版本的模型,代码能力排第一。依旧在AI Studio可以免费使用。
官方介绍:https://blog.google/products/gemini/gemini-2-5-pro-updates/
2、LTX Studio发布LTXV 13B
新的开源视频模型,参数大,效果好,可以跟Wan 2.1一战。支持首尾帧,支持LoRA。
官方文档:https://www.lightricks.com/ltxv-documentation
3、HeyGen发布Avatar IV
使用照片+语音,即可生成说话视频。嘴型匹配程度提升,多角度支持,侧面完美,有自然的肢体动作。
4、Insert Anything:开源图片编辑框架
适用于DiT模型,可以实现换脸、换服装等图片编辑功能,演示效果很好。
项目地址:https://song-wensong.github.io/insert-anything/