1、4 bit版QwQ-32B-Preview
4 bit版本的QwQ-32B-Preview,能力几乎与BF16一致。
模型:https://huggingface.co/ModelCloud/QwQ-32B-Preview-gptqmodel-4bit-vortex-v3
2、Flex.1-alpha:Flex新版本
Flex是基于FLUX.1-schnell微调的模型,目的是实现开源可商用版Flux Dev。
模型:https://huggingface.co/ostris/Flex.1-alpha
3、openai-realtime-agents OpenAI官方开源了一个使用Realtime API实现Agent的仓库,只需20分钟即可实现。
Github:https://github.com/openai/openai-realtime-agents
我的知识星球