2025.3.5-AI视频教学智能体

1、AI视频教学智能体 输入要学习的内容，AI生成带有动画和语音讲解的视频。大致实现过程：先由一个智能体生成教学大纲，再由一个智能体写出可运行的代码，再把代码的动画渲染成视频，并嵌入Kokoro生成TTS语音，得到最后的教学视频。项目地址：https://tiger-ai-lab.github.io/TheoremExplainAgent/ Github：‣

417412069-17f2f4f2-8f2c-4abc-b377-ac92ebda69f3.mp4

2、Aya Vision：开源视觉模型

Cohere开源的视觉模型，分8B和32B两个大小，Cohere旗下的模型，一大特色是不禁止NSFW的内容，所以这两个视觉模型可以用于解析NSFW图片。OCR能力不行。

在线体验：https://dashboard.cohere.com/playground/chat

模型：https://huggingface.co/collections/CohereForAI/c4ai-aya-vision-67c4ccd395ca064308ee1484

3、绘画模型解决数独问题

用图像生成模型（扩散模型）来生成数独问题的答案，成功率50%以上。虽然LLM解决数独问题很简单，但是用扩散模型也能解决，比较新颖。项目地址：https://geometric-rl.mpi-inf.mpg.de/srm/ Github：https://github.com/Chrixtar/SRM

4、教程：从头构建类似DeepSeek-R1的推理模型

HuggingFace推出的教程，课程逐步更新中，地址：https://huggingface.co/reasoning-course

我的知识星球

未命名的设计 (1).png