1、OpenAI宣布o3模型
推理和数学能力大幅提升,最近新出的超难的数学测试集,o3能解决25%的题目(o1只能解决2%),ARC-AGI得分87.5%,也远远超过o1。目前推理成本太高,暂时没有发布时间,预计mini版本明年1月发布。
官方介绍视频:https://openai.com/12-days/
2、Enhance-A-Video:提升视频质量 免训练,可以应用于现有视频模型(目前已支持混元和CogVideoX),提升效果显著。借鉴了LLM中温度参数的应用,DiT的温度参数决定帧间关联强度。计算时序注意力图的非对角线元素平均值作为帧间强度,使用增强型温度参数来调节时序注意力输出。 项目地址:https://oahzxl.github.io/Enhance_A_Video/ Github:https://github.com/NUS-HPC-AI-Lab/Enhance-A-Video
3、Ruyi-Mini-7B:新的开源视频模型
仅支持图片生成视频,开源,可商用的协议。
模型:https://huggingface.co/IamCreateAI/Ruyi-Mini-7B
396097666-4dedf40b-82f2-454c-9a67-5f4ed243f5ea.mp4
4、Sketch2Sound:音频版ControlNet Adobe的项目,未开源。输入音频+提示词,即可修改音频的声音效果,同时完美保持输入音频的节奏。演示视频的效果太精彩了,尤其是最后一段。 项目地址:https://hugofloresgarcia.art/sketch2sound/ 论文:https://arxiv.org/abs/2412.08550
我的知识星球
只分享精选的最佳AI应用和技巧,有服务群,可以答疑。目前50元可以加入。