1、AI视频教学智能体 输入要学习的内容,AI生成带有动画和语音讲解的视频。 大致实现过程:先由一个智能体生成教学大纲,再由一个智能体写出可运行的代码,再把代码的动画渲染成视频,并嵌入Kokoro生成TTS语音,得到最后的教学视频。 项目地址:https://tiger-ai-lab.github.io/TheoremExplainAgent/ Github:‣
417412069-17f2f4f2-8f2c-4abc-b377-ac92ebda69f3.mp4
2、Aya Vision:开源视觉模型
Cohere开源的视觉模型,分8B和32B两个大小,Cohere旗下的模型,一大特色是不禁止NSFW的内容,所以这两个视觉模型可以用于解析NSFW图片。OCR能力不行。
在线体验:https://dashboard.cohere.com/playground/chat
模型:https://huggingface.co/collections/CohereForAI/c4ai-aya-vision-67c4ccd395ca064308ee1484
3、绘画模型解决数独问题
用图像生成模型(扩散模型)来生成数独问题的答案,成功率50%以上。虽然LLM解决数独问题很简单,但是用扩散模型也能解决,比较新颖。 项目地址:https://geometric-rl.mpi-inf.mpg.de/srm/ Github:https://github.com/Chrixtar/SRM
4、教程:从头构建类似DeepSeek-R1的推理模型
HuggingFace推出的教程,课程逐步更新中,地址:https://huggingface.co/reasoning-course
我的知识星球