2025.5.7-Gemini 2.5 Pro (I/O edition)

1、Gemini 2.5 Pro (I/O edition)

谷歌最新版本的模型,代码能力排第一。依旧在AI Studio可以免费使用。

官方介绍:https://blog.google/products/gemini/gemini-2-5-pro-updates/

2、LTX Studio发布LTXV 13B

新的开源视频模型,参数大,效果好,可以跟Wan 2.1一战。支持首尾帧,支持LoRA。

官方文档:https://www.lightricks.com/ltxv-documentation

aHCqyKx9aFsymCgo.mp4

3、HeyGen发布Avatar IV

使用照片+语音,即可生成说话视频。嘴型匹配程度提升,多角度支持,侧面完美,有自然的肢体动作。

ejZ-cpM_9kLGnj8u.mp4

4、Insert Anything:开源图片编辑框架

适用于DiT模型,可以实现换脸、换服装等图片编辑功能,演示效果很好。

项目地址:https://song-wensong.github.io/insert-anything/

image.png