2024.12.21-OpenAI宣布o3模型

1、OpenAI宣布o3模型

推理和数学能力大幅提升，最近新出的超难的数学测试集，o3能解决25%的题目（o1只能解决2%），ARC-AGI得分87.5%，也远远超过o1。目前推理成本太高，暂时没有发布时间，预计mini版本明年1月发布。

2、Enhance-A-Video：提升视频质量 免训练，可以应用于现有视频模型（目前已支持混元和CogVideoX），提升效果显著。借鉴了LLM中温度参数的应用，DiT的温度参数决定帧间关联强度。计算时序注意力图的非对角线元素平均值作为帧间强度，使用增强型温度参数来调节时序注意力输出。项目地址：https://oahzxl.github.io/Enhance_A_Video/ Github：https://github.com/NUS-HPC-AI-Lab/Enhance-A-Video

demo (1).mp4

3、Ruyi-Mini-7B：新的开源视频模型

仅支持图片生成视频，开源，可商用的协议。

模型：https://huggingface.co/IamCreateAI/Ruyi-Mini-7B

396097666-4dedf40b-82f2-454c-9a67-5f4ed243f5ea.mp4

4、Sketch2Sound：音频版ControlNet Adobe的项目，未开源。输入音频+提示词，即可修改音频的声音效果，同时完美保持输入音频的节奏。演示视频的效果太精彩了，尤其是最后一段。项目地址：https://hugofloresgarcia.art/sketch2sound/ 论文：https://arxiv.org/abs/2412.08550

hero.mp4

我的知识星球

只分享精选的最佳AI应用和技巧，有服务群，可以答疑。目前50元可以加入。

未命名的设计 (1).png