1、LLM赛马
先让一个LLM处理任务,然后把输出作为下一个LLM的输入,让下一个LLM挑刺,进一步完善。如此重复,得到最佳的回复。但是我个人觉得效果不太大,不如会推理的模型效果更好。
原推:https://x.com/gregisenberg/status/1918661279641723158
2、Grok推出Rendering PDF功能
可以直接输出PDF文件。
3、实操教程:如何训练特定领域的模型
文章地址;https://huggingface.co/blog/anakin87/qwen-scheduler-grpo
4、HuggingFace的AI课程
课程持续更新,现在已经包含推理模型的部分。
课程:https://huggingface.co/learn/llm-course/chapter1/1
Github中文版:https://github.com/huggingface/course/tree/main/chapters/zh-CN
我的知识星球