1、Lovart:首个AI设计智能体
能调用各种绘画API和视频API,也能调用LibLib上的Flux和LoRA,并且智能体的编排效果确实很好,产出效果比豆包和ChatGPT都好,可以说没有竞品。 要是发布的再早一些,早在GPT-4o之前发布,就牛逼了。
目前需要排队,官网:https://www.lovart.ai/
效果演示视频:
2、DeerFlow:字节开源的Deep Research框架
集成了MCP服务,能搜索,能生成图片报告,能生成音频播客。
Github:https://github.com/bytedance/deer-flow
3、Seed1.5-VL:字节的视觉推理模型
未开源,20B激活参数的LLM(总参数估计得200B以上)+ 532M视觉编码器。具有推理能力的视觉LLM,在38项评测上得分最高。在火山引擎上可以使用API。
论文:https://arxiv.org/abs/2505.07062
在线体验:https://huggingface.co/spaces/ByteDance-Seed/Seed1.5-VL
4、Qwen发布官方量化模型
模型集合:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f
5、GPT-4o发布一周年