1、字节豆包更新
核心要点:新增视觉能力、LLM能力提升、新增3D生成模型。
2、OpenAI更新
新增o1 API,支持函数调用、指令遵循、结构化输出、高级视觉功能,比Preview版本思考成本降低60%。
Realtime API升级,支持WebRTC,4o音频成本下降60%,4o-mini音频成本下降90%
官方介绍:https://openai.com/index/o1-and-new-tools-for-developers/
3、Falcon 3:开源最强小模型 分1B、3B、7B、10B四个大小,评分高于同等规模模型。 官方介绍:https://falconllm.tii.ae/falcon3/index.html 模型下载:https://huggingface.co/collections/tiiuae/falcon3-67605ae03578be86e4e87026
4、CosyVoice更新2.0版本
流式语音合成模型,响应快,支持多语言。
项目地址:https://funaudiollm.github.io/cosyvoice2/
5、混元视频模型发布FP8版本
需要的显存更小,模型地址:https://huggingface.co/tencent/HunyuanVideo
6、Google Veo 2生成的视频