2024.12.18-字节豆包更新

1、字节豆包更新

核心要点:新增视觉能力、LLM能力提升、新增3D生成模型。

2、OpenAI更新

新增o1 API,支持函数调用、指令遵循、结构化输出、高级视觉功能,比Preview版本思考成本降低60%。

Realtime API升级,支持WebRTC,4o音频成本下降60%,4o-mini音频成本下降90%

官方介绍:https://openai.com/index/o1-and-new-tools-for-developers/

3、Falcon 3:开源最强小模型 分1B、3B、7B、10B四个大小,评分高于同等规模模型。 官方介绍:https://falconllm.tii.ae/falcon3/index.html 模型下载:https://huggingface.co/collections/tiiuae/falcon3-67605ae03578be86e4e87026

image.png

4、CosyVoice更新2.0版本

流式语音合成模型,响应快,支持多语言。

项目地址:https://funaudiollm.github.io/cosyvoice2/

5、混元视频模型发布FP8版本

需要的显存更小,模型地址:https://huggingface.co/tencent/HunyuanVideo

6、Google Veo 2生成的视频