2024.12.26-DeepSeek-V3:超强的MoE LLM

1、DeepSeek-V3:超强的MoE LLM

由256个专家模型组成,总参数671B(如果算上多token预测模块,是685B),激活参数37B。评分整体接近Sonnet 3.5,尤其是代码能力格外优秀。

模型:https://huggingface.co/deepseek-ai/DeepSeek-V3

在线使用:https://www.deepseek.com/

image.png

2、CogAgent:开源GUI Agent

智谱开源的GUI Agent,基于GLM-4V-9B,能够实现自主屏幕操作。

Github:https://github.com/THUDM/CogAgent

官方介绍:https://cogagent.aminer.cn/blog#/articles/cogagent-9b-20241220-technical-report-en

3、DiTCtrl:多提示词视频生成 能根据多个连贯场景的提示词,生成平滑过渡且主体一致的运动视频。 项目地址:https://onevfall.github.io/project_page/ditctrl/

boy.mp4

我的知识星球

只分享精选的最佳AI应用和技巧,有服务群,可以答疑。目前50元可以加入。

未命名的设计 (1).png