1、QVQ-72B-Preview:Qwen视觉推理模型
基于Qwen2-VL-72B训练的带视觉的推理模型。部分评分比OpenAI o1还高,但是现在的评分水分很大,仅供参考吧。
模型:https://huggingface.co/Qwen/QVQ-72B-Preview
2、VideoVAEPlus:更好的视频编码器
高保真视频编码,显著提升了重建质量,尤其在细节保持和时序稳定性方面,能同时处理图像和视频的自编码任务,适用于视频生成模型。
项目地址:https://yzxing87.github.io/vae/
twittervid.com_bdsqlsz_d1a99a.mp4
我的知识星球
只分享精选的最佳AI应用和技巧,有服务群,可以答疑。目前50元可以加入。