2025.6.12-V-JEPA 2:Meta开源的世界模型

1、V-JEPA 2:Meta开源的世界模型 杨立昆带队的视觉模型,不仅能理解视频,而且能预测视频。在视觉评测的所有项目上都获得了最高分,在指挥机器人行动方面遥遥领先。 官方介绍:https://ai.meta.com/vjepa/ Github:https://github.com/facebookresearch/vjepa2 模型:https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6

image.png

2、字节开源LatentSync 1.6 嘴型同步模型,能处理切换镜头的情形,效果还可以。 模型:https://huggingface.co/ByteDance/LatentSync-1.6 Github:https://github.com/bytedance/LatentSync

395589524-150e00fd-381e-4421-a478-a9ea3d1212a8.mp4

3、MidJourney开始视频评分 可以在MidJourney网站上评分他们的AI视频模型生成视频,总体感受是美学依旧在线,但是视频水平也就是可灵1.5的水平,经常出现各种错误和幅度过小的情况。 我对MidJourney的视频模型很担忧,因为v7至今还会把手画错。 地址:https://www.midjourney.com/rank-video

4、v0推出Design Mode

AI生成的网页,可以选中元素调整细节,有点像DreamWeaver。。。

5QnuxWnSlv0672PH.mp4

我的知识星球

image.png