1、Qwen2.5-1M:一百万Token上下文的LLM
一百万上下文,分7B和14B两个大小。
模型:https://huggingface.co/collections/Qwen/qwen25-1m-679325716327ec07860530ba
2、SpeechGPT 2.0-preview:开源原生多模态语音模型 支持多种音色,200毫秒延迟,暂时只支持中文。
在线体验:https://sp2.open-moss.com/
Github:https://github.com/OpenMOSS/SpeechGPT-2.0-preview
3、Tripo v2.5:生成细节更丰富的3D模型
Tripo更新了2.5版本,相比2.0版本,生成的3D模型细节更丰富。
4、X-Dyna:让角色动起来
类似Animate Anyone,输入角色和动作序列,让角色动起来。基于animatediff,效果一般。