1、DeepSeek-V3:超强的MoE LLM
由256个专家模型组成,总参数671B(如果算上多token预测模块,是685B),激活参数37B。评分整体接近Sonnet 3.5,尤其是代码能力格外优秀。
模型:https://huggingface.co/deepseek-ai/DeepSeek-V3
在线使用:https://www.deepseek.com/
2、CogAgent:开源GUI Agent
智谱开源的GUI Agent,基于GLM-4V-9B,能够实现自主屏幕操作。
Github:https://github.com/THUDM/CogAgent
官方介绍:https://cogagent.aminer.cn/blog#/articles/cogagent-9b-20241220-technical-report-en
3、DiTCtrl:多提示词视频生成 能根据多个连贯场景的提示词,生成平滑过渡且主体一致的运动视频。 项目地址:https://onevfall.github.io/project_page/ditctrl/
我的知识星球
只分享精选的最佳AI应用和技巧,有服务群,可以答疑。目前50元可以加入。