1、RealisDance-DiT:生成高难度动作的视频
基于Wan2.1做了微调,能让人物生成非常难得动作,例如侧翻。
项目地址:https://thefoxofsky.github.io/project_pages/RealisDance-DiT/index
2、Unsloth Dynamic v2.0 GGUF:更好性能的量化版本
2.0版本的量化方法,可以更好的保留LLM量化后的性能。
量化模型合集:https://huggingface.co/collections/unsloth/unsloth-dynamic-v20-quants-68060d147e9b9231112823e6
3、百度发布ERNIE X1 Turbo和ERNIE 4.5 Turbo
价格便宜,评分接近GPT-4o。之前说过要开源,目前还没开源。
4、Hummingbird-0:嘴型同步模型
Tavus的全能模型的副产品,单独拆出来做了嘴型同步模型。仅提供API,在fal和官网可以使用。
fal地址:https://fal.ai/models/fal-ai/tavus/hummingbird-lipsync/v0
官方API:https://docs.tavus.io/sections/lipsync/overview
我的知识星球