1、TokenVerse:Whisk背后的技术原理 谷歌发布了一篇论文,介绍了如何从多张图片中提取元素,生成最终的图片,即Whisk的效果。适用于DiT绘画模型,后续会开源。 项目地址:https://t.co/3N84zjloFl
2、AI Video Starting Kit:AI时代的视频编辑器 fal开源的网页应用,整合了图片、视频、TTS、音乐的各种AI API,然后在网页里可以生成+编辑。功能目前还比较简陋。 Github:https://github.com/fal-ai-community/video-starter-kit 限时在线体验,可以免费使用可灵1.5和海螺视频模型、Flux Ultra图片模型:https://fal-video-studio.vercel.app/
3、提升LLM安全性的新方法
OpenAI的一篇新文章,提出了一种新的提升LLM安全性的方法:提升LLM的推理时间。给推理模型更多“思考时间” (增加 inference-time compute) 能显著提升对抗鲁棒性。实验表明,多种攻击的成功率会随着模型计算时间的增加而降低,甚至趋近于零。
文章:https://openai.com/index/trading-inference-time-compute-for-adversarial-robustness/
4、Bolt new融资1.055 亿美元
B轮融资,融资金额基本与Cursor持平。
我的知识星球