2025.5.19-BLIP3-o:原生多模态视觉模型

1、BLIP3-o:原生多模态视觉模型 同时具有图片理解和图片生成的能力,而且效果还可以。对标GPT-4o的图片多模态,比之前DeepSeek开源的Janus强不少。 在线体验:https://blip3o.salesforceresearch.ai/ Github:https://github.com/JiuhaiChen/BLIP3o 模型:https://huggingface.co/BLIP3o

image.png

2、ListenHub:AI短播客

橘子大佬的AI产品,专门用于生成3分钟左右的短播客,是一种学习新知识的播客方式。

产品地址:https://listenhub.ai/zh

3、KEEP:视频人脸高清化

可以把视频中人脸的部分高清化。

Github:https://github.com/jnjaby/KEEP

在线体验:https://huggingface.co/spaces/rcfeng/KEEP

image.png

我的知识星球

image.png