1、CogVideoX-5B:当前最佳开源DiT模型
智谱开源了CogVideoX-5B,目前开源最近DiT视频模型,缺点是只能生成720*480的视频,不可商用。另外之前的2B版本,开源协议改成了可商用。
Github:https://github.com/THUDM/CogVideo
在线体验:https://huggingface.co/spaces/THUDM/CogVideoX-5B-Space
twittervid.com_zRdianjiao_8fc9d4.mp4
2、GameNGen:扩散模型驱动的游戏引擎 游戏画面完全是由扩散模型生成的,生成的依据是前面几帧画面和用户的交互,在单个TPU上可以达到每秒20帧以上,效果几乎以假乱真。 感觉未来实现Andrej说的完全基于神经网络的电脑,不会太遥远。 项目地址:https://gamengen.github.io/
https://www.youtube.com/watch?v=O3616ZFGpqw&list=PL3ZfMho22LwDvJSEKVBiwxNsVEqUTUmhJ&t=58s
3、Fire-Flyer AI-HPC:高性价比的AI硬件架构
DeepSeek AI发布的论文,使用这个软件+硬件结合的架构,部署10000个PCIe A100 GPU,实现了英伟达DGX-A100系统83%的性能,但成本节省50%,能耗节省40%
论文:https://arxiv.org/abs/2408.14158
4、谷歌推出了Gemini系列3个新模型
Gemini 1.5 Pro Experimental 0827:代码和推理能力更强
Gemini 1.5 Flash Experimental 0827:整体能力更强
Gemini 1.5 Flash 8B Experimental 0827:仅8B,更快
在AI Studio可以免费使用:https://aistudio.google.com/app/prompts/new_chat