2025.2.28-OpenAI发布GPT-4.5

1、OpenAI发布GPT-4.5

10倍于GPT-4的训练量,更有人情味,但是性能没有领先于竞品(Sonnet 3.7),在医学影像的诊断上优于其他模型。

希望后续基于GPT-4.5能训练出更强的推理模型和小模型。

官方报告:https://cdn.openai.com/gpt-4-5-system-card.pdf

2、DeepSeek开源周第5弹:3FS和smallpond

飞火流星文件系统(3FS):利用现代 SSD 和 RDMA 网络全带宽的并行文件系统,在 180 节点集群中达到6.6 TiB/s 总读取吞吐量,每个客户端节点 KVCache 查找峰值吞吐量 40+ GiB。

smallpond:基于 3FS 的数据处理框架,可扩展以处理 PB 级数据集

Github:https://github.com/deepseek-ai/DualPipehttps://github.com/deepseek-ai/smallpond

3、LLaDA:首个开源的Diffusion LLM 8B参数,能力非常一般,GPT-3的水平。不过很难说dLLM的前景怎样,因为从大纲到细节,确实像是人类的思考方式。 模型:https://huggingface.co/spaces/multimodalart/LLaDA 在线体验:https://huggingface.co/spaces/multimodalart/LLaDA

4、Ideogram发布Ideogram 2a模型

Ideogram擅长生成带文字的设计图,综合素质也不错,新发布的2a模型速度更快、价格更便宜。

我的知识星球

未命名的设计 (1).png