2025.5.4-今天没什么新闻

1、LLM赛马

先让一个LLM处理任务,然后把输出作为下一个LLM的输入,让下一个LLM挑刺,进一步完善。如此重复,得到最佳的回复。但是我个人觉得效果不太大,不如会推理的模型效果更好。

原推:https://x.com/gregisenberg/status/1918661279641723158

2、Grok推出Rendering PDF功能

可以直接输出PDF文件。

3、实操教程:如何训练特定领域的模型

文章地址;https://huggingface.co/blog/anakin87/qwen-scheduler-grpo

4、HuggingFace的AI课程

课程持续更新,现在已经包含推理模型的部分。

课程:https://huggingface.co/learn/llm-course/chapter1/1

Github中文版:https://github.com/huggingface/course/tree/main/chapters/zh-CN

我的知识星球

image.png