2024.12.21-OpenAI宣布o3模型

1、OpenAI宣布o3模型

推理和数学能力大幅提升,最近新出的超难的数学测试集,o3能解决25%的题目(o1只能解决2%),ARC-AGI得分87.5%,也远远超过o1。目前推理成本太高,暂时没有发布时间,预计mini版本明年1月发布。

官方介绍视频:https://openai.com/12-days/

2、Enhance-A-Video:提升视频质量 免训练,可以应用于现有视频模型(目前已支持混元和CogVideoX),提升效果显著。借鉴了LLM中温度参数的应用,DiT的温度参数决定帧间关联强度。计算时序注意力图的非对角线元素平均值作为帧间强度,使用增强型温度参数来调节时序注意力输出。 项目地址:https://oahzxl.github.io/Enhance_A_Video/ Github:https://github.com/NUS-HPC-AI-Lab/Enhance-A-Video

demo (1).mp4

3、Ruyi-Mini-7B:新的开源视频模型

仅支持图片生成视频,开源,可商用的协议。

模型:https://huggingface.co/IamCreateAI/Ruyi-Mini-7B

396097666-4dedf40b-82f2-454c-9a67-5f4ed243f5ea.mp4

4、Sketch2Sound:音频版ControlNet Adobe的项目,未开源。输入音频+提示词,即可修改音频的声音效果,同时完美保持输入音频的节奏。演示视频的效果太精彩了,尤其是最后一段。 项目地址:https://hugofloresgarcia.art/sketch2sound/ 论文:https://arxiv.org/abs/2412.08550

hero.mp4

我的知识星球

只分享精选的最佳AI应用和技巧,有服务群,可以答疑。目前50元可以加入。

未命名的设计 (1).png