1、百度开源文心4.5系列模型
包括多个大小的模型,最大的424B-47B支持图片输入,最小的是0.3B模型。大参数的MoE模型,评分接近Qwen 3和Deepseek。
模型:https://huggingface.co/collections/baidu/ernie-45-6861cd4c9be84540645f35c9
2、FineWeb2:多语言数据集
由HuggingFace发布的数据集,20TB大小(不是token数,是硬盘空间大小),覆盖1000种语言。
数据:https://huggingface.co/datasets/HuggingFaceFW/fineweb-2
3、Qwen发布Qwen-TTS
多语言TTS,未开源,仅支持API使用。特色是支持中文方言。
官方介绍:https://qwenlm.github.io/blog/qwen-tts/
4、Deep Research Agent综述 介绍了Deep Research的原理、发展历程,以及市面上的产品。 论文:https://arxiv.org/abs/2506.18096
我的公众号:AI加速派