2025.5.9-HunyuanCustom:增强版本的混元视频

1、HunyuanCustom:增强版本的混元视频

支持保持人物、物体、场景一致性,支持文本、图片、音频、视频作为输入,支持编辑视频,例如插入或替换人物。唯一的缺点是模型生成的视频质量不高。

模型:https://huggingface.co/tencent/HunyuanCustom

XHc1sanbs0lsvAFs.mp4

2、ZenCtrl:生成不同视角、不同场景的物品图 提供一张物品参考,可以把物品放到其他场景,且支持生成不同角度的图片。 在线体验:https://huggingface.co/spaces/fotographerai/ZenCtrl 模型:https://huggingface.co/fotographerai/zenctrl_tools/tree/main/weights Github:https://github.com/FotographerAI/ZenCtrl

image.png

3、OpenAI上线强化微调API

可以微调o4-mini,使用思维链推理和特定任务的评分来提升模型性能,对于复杂领域尤其有用。另外,ChatGPT现在可以关联Github做Deep Research了。

官方文档:https://platform.openai.com/docs/guides/rft-use-cases

4、ZeroSearch:提升LLM搜索能力的框架

无需与真实搜索引擎交互即可激励 LLM 的搜索能力,使用SFT,把LLM转换成检索模块。

Github:https://github.com/Alibaba-nlp/ZeroSearch

我的知识星球

image.png