1、VGGSfM:从一组2D图像中重建相机视角和场景3D
输入一个物体的多角度图片,在3D场景中重建物体的形状和镜头视角,在3个数据集上达到了最佳效果。
项目地址:https://vggsfm.github.io/
teaser (2).mp4
2、ElevenLabs发布Turbo 2.5 model
文本生成语音的速度提升3倍。
官方API:https://elevenlabs.io/api
3、直观的RAG原理介绍视频
twittervid.com_imxiaohu_9c46bd.mp4