1、Kling更新
更新了AI绘画模型KOLORS 1.5,新增AI模特功能。AI生成模特,然后AI试衣,然后生成展示视频,一套完整的流程就有了。

2、VidTok:开源视频分词器
微软开源的视频分词器(Video Tokenizers),类似LLM中的Tokenizers,是用于给模型提供最小可预测的单位。VidTok性能优秀,是视频生成和理解任务的高效基础工具。
Github:https://github.com/microsoft/VidTok
3、Mulberry:训练有思考能力的多模态LLM
能训练类似o1的有思考能力的多模态LLM,使用集体蒙特卡洛树搜索(CoMCTS)方法,通过多个模型的集体知识来协作搜索推理路径。
论文:https://arxiv.org/abs/2412.18319
4、OpenAI公司架构调整
目前是:非盈利公司 完全控股 盈利性公司 将改为:非盈利公司 只是 盈利性公司 的股东,占有一定比例的治理权
官方公告:https://openai.com/index/why-our-structure-must-evolve-to-advance-our-mission/
我的知识星球
只分享精选的最佳AI应用和技巧,有服务群,可以答疑。目前50元可以加入。