1、Step1X-Edit:开源版GPT-4o图片编辑 类似GPT-4o、Gemini、豆包的图片编辑功能,输入文字即可修改图片,包括改动作、改风格、改文字等能力。实测效果一般,比GPT-4o差得远。唯一的优点是尺度稍微大一些,但是不好看也没什么用。 模型:https://huggingface.co/stepfun-ai/Step1X-Edit 在线体验:https://huggingface.co/spaces/stepfun-ai/Step1X-Edit
2、EasyEdit2:即插即用、调整LLM行为的框架 不需要额外训练,可以在推理时干预LLM的事实性、安全性、推理模式。 项目地址:https://zjunlp.github.io/project/EasyEdit2/
3、RLHF Book:强化学习综述 这篇论文梳理了基于人类反馈的强化学习(RLHF)的方方面面,从指令调整到训练奖励模型,到拒绝采样、强化学习、直接对齐算法。全文100多页。 论文:http://arxiv.org/abs/2504.12501v1 Github:https://github.com/natolambert/rlhf-book
我的知识星球