1、AuraFlow 0.1:开源DiT绘画模型 与SD3相同,是DiT架构,5.6B大小,书写英文的能力优秀。非常早期的版本,但是效果还可以。 模型地址:https://huggingface.co/fal/AuraFlow 在线使用:https://huggingface.co/spaces/multimodalart/AuraFlow

2、MiraData:高质量视频数据集 Mira是腾讯的Mini Sora项目,MiraData是为了达成目标而开源的高质量视频数据集,在视频时长、视频描述细节、运动强度和视觉质量方面都超越了以前的数据集。 视频来源由人工挑选,由GPT-4V生成结构化视频描述,从四个不同的角度(主体、背景、运镜、风格)详细描述视频。
项目地址:https://mira-space.github.io/ Github:https://github.com/mira-space/MiraData
3、SEED-Story:能写图文故事的多模态模型 基于SEED-X,提供角色图片和故事要求,可以保持角色一致,完成整个故事的文字和配图。 Github:https://github.com/TencentARC/SEED-Story

4、SmartCrawl:把任意网页变成API
尚未发布,感觉是借助云端浏览器做了一个Agent。
排队地址:https://www.firecrawl.dev/smart-crawl
twittervid.com_ericciarla_2fc1bf.mp4
5、OpenAI对AGI的分级
一:聊天机器人,具备对话能力
二:推理者,人类水平的解决问题能力
三:智能体,能够执行行动
四:创新者,能够辅助发明创造
五:组织,能够组织复杂任务