1、DeepSeek R1小版本升级
可能是基于DeepSeek V3 0324训练R1模型,代码能力、速度有明显提升。目前在官网可以使用。
2、OmniConsistency:DiT绘画模型通用插件 适用于Flux等DiT绘画模型,能在保持主体一致性的同时,实现风格泛化,且与现有的LoRA兼容。效果非常好,风格化接近GPT-4o的水平,人物一致性的保持比GPT-4o好。 在线使用:https://huggingface.co/spaces/yiren98/OmniConsistency 模型:https://huggingface.co/showlab/OmniConsistency
3、HunyuanVideo-Avatar:语音驱动视频生成
通过音频,生成人物说话的视频,人物有肢体和头部动作,有表情,支持多角色。适用于虚拟人的场景。
模型:https://huggingface.co/tencent/HunyuanVideo-Avatar
4、Google AI Edge Gallery:手机运行本地模型
谷歌的手机APP,可以在手机本地运行LLM,并且支持图片多模态。安卓版已发布,iOS后续发布。
Github:https://github.com/google-ai-edge/gallery
5、Trae推出付费订阅
首月3美元,后续每月10美元,可以支付宝付款。每月600次免排队次数(实际可能还要排队,但是更优先)。同时有消息称字节不再允许使用Cursor,只能使用Trea。