1、Cohere开源Command A
111B参数,256K上下文,支持多语言。
评分接近GPT-4o和DeepSeek V3,但效率更高,2个A100即可部署,156token/s,开源但不可商用。
按照之前Cohere的惯例,应该不限制NSFW内容。
官方介绍:https://cohere.com/blog/command-a
模型:https://huggingface.co/CohereForAI/c4ai-command-a-03-2025
2、Gemini更新Deep Research
改由Gemini 2.0 Flash Thinking驱动,效果非常好,免费用户也可以适用,每月限量5次。
另外,Gemini APP也支持语音对话了。
在线使用:https://gemini.google.com/deepresearch
3、sesame语音模型开源
极其拟人的TTS,目前仅支持英文。
4、Wan高清化LoRA
模型:https://huggingface.co/sesame/csm-1b
类似ControlNet的Tile,可以把模糊的视频高清化。