1、OpenAI推出OpenAI o3-pro模型
Pro用户和API可用,能力很强,价格很贵。
官方更新日志:https://help.openai.com/en/articles/9624314-model-release-notes
2、Magistral:MistralAI开源的推理模型
是MistralAI的首个推理模型,24B参数。
模型:https://huggingface.co/mistralai/Magistral-Small-2506
3、Krea AI公布自研AI绘画模型:Krea 1
目前需要排队申请。
4、MonkeyOCR:兼具质量与效率的OCR模型 3B参数,采用结构-识别-关联的处理流程,兼具准确率和效率。 准确率比传统OCR明显提升,公式识别比MinerU提升了15%准确率;识别速度明显超过VLLM模型,每秒识别0.84页,大幅优于Qwen2.5 VL-7B的每秒0.12页。 Github:https://github.com/Yuliang-Liu/MonkeyOCR 模型:https://huggingface.co/echo840/MonkeyOCR
5、字节发布Seedance 1.0 Pro视频生成模型
即梦里的视频3.0 Pro就是这个模型,整体效果不错,与Veo 3、Kling 2.1是同一梯队的水平。
可以在豆包、即梦、火山引擎API使用。