2025.1.29-Qwen2.5-Max:QWen大规模MoE模型

1、Qwen2.5-Max:QWen大规模MoE模型

评测指标超过DeepSeek V3,但是未开源,可以在QWen Chat上使用,或者通过API调用。

官方介绍:https://qwenlm.github.io/blog/qwen2.5-max/

2、goose:开源代码智能体

开源代码Agent,可扩展,不仅能写代码,还能安装、执行、测试。

介绍:https://block.github.io/goose/blog/2025/01/28/introducing-codename-goose/ Github:https://github.com/block/goose

3、Open Thought:开源推理数据集

项目的目标是提供开源的、适用于推理的数据集,并使用这些数据训练出超越DeepSeek-R1-Distill-Qwen-32B的模型。

Github:https://github.com/open-thoughts/open-thoughts

4、DeepSeek发现了o1的一些秘密

OpenAI首席研究员承认DeepSeek独立发现了他们在实现o1时的一些核心思想。

原推:https://x.com/markchen90/status/1884303237186216272

我的知识星球

未命名的设计 (1).png