1、Deepseek开源周第一弹:FlashMLA
专门用于提升英伟达H800 GPU的推理性能,内存带宽提升了 2-3 倍(3000 GB/s vs. 1000-1500 GB/s);计算性能提升了约 2 倍(580 TFLOPS vs. 200-300 TFLOPS);推理速度提升 30%-50%,特别是在长序列和大规模推理场景中。
受FlashAttention 2和3的启发而实现,另外有人推荐类似的项目:https://github.com/xiayuqing0622/flex_head_fa
Github:https://github.com/deepseek-ai/FlashMLA
2、Grok 3上线语音模式
仅英文可用,明晃晃支持18+模式。
貌似只有订阅会员可用,不过现在可能用的人多,我进去也不能对话。
3、Cherry Studio 1.0版本发布
特色是让所有模型支持联网搜索,联网功能使用的是tavily。
Github:https://github.com/CherryHQ/cherry-studio
4、Pixverse发布4.0模型
视频质量提升,10秒内生成带音效的视频。