2025.2.24-Deepseek开源周第一弹:FlashMLA

1、Deepseek开源周第一弹:FlashMLA

专门用于提升英伟达H800 GPU的推理性能,内存带宽提升了 2-3 倍(3000 GB/s vs. 1000-1500 GB/s);计算性能提升了约 2 倍(580 TFLOPS vs. 200-300 TFLOPS);推理速度提升 30%-50%,特别是在长序列和大规模推理场景中。

受FlashAttention 2和3的启发而实现,另外有人推荐类似的项目:https://github.com/xiayuqing0622/flex_head_fa

Github:https://github.com/deepseek-ai/FlashMLA

2、Grok 3上线语音模式

仅英文可用,明晃晃支持18+模式。

貌似只有订阅会员可用,不过现在可能用的人多,我进去也不能对话。

a626725fbb0279c98d7a5ac5e0335fd.jpg

3、Cherry Studio 1.0版本发布

特色是让所有模型支持联网搜索,联网功能使用的是tavily。

Github:https://github.com/CherryHQ/cherry-studio

4、Pixverse发布4.0模型

视频质量提升,10秒内生成带音效的视频。

z8LZf82pG5Iu1sEt.mp4