1、RF-DETR:开源最佳实时识别模型 实时识别画面中的物体,准确率和速度优于YOLO系列模型,开源可商用。 官方介绍:https://blog.roboflow.com/rf-detr/ Github:https://github.com/roboflow/rf-detr
2、阿里开源LHM:让人物图片动起来
效果类似阿里之前的AnimateAnyone,输入人物图片和参考视频,可以让人物按视频的动作生成视频。
项目地址:https://lingtengqiu.github.io/LHM/
Github:https://github.com/aigc3d/LHM
3、腾讯发布混元T1思考模型
特色是Mamba和Transformer结合,能力比不上DeepSeek R1。未开源,提供API使用,价格倒是很便宜。
在线使用:https://llm.hunyuan.tencent.com/#/chat/hy-t1
4、Remade-AI开源一系列Wan LoRA
其中效果比较好的是机械脸。
模型:https://huggingface.co/Remade-AI
5、字节开源InfiniteYou:图像保持人物一致性