1、Emu3.5:原生多模态模型
能生成和编辑图片,类似Nano Banana。也能分析图片。由BAAI开源。
Github:https://github.com/baaivision/Emu3.5
2、FIBO:基于Json的AI绘画模型
训练时的图-文数据使用Json格式,对于提示词的遵循效果更好。
模型:https://huggingface.co/briaai/FIBO
3、扩散模型原理讲解
偏理论,需要数学基础,讲解AI绘画的扩散模型的原理。
论文:https://www.arxiv.org/abs/2510.21890
4、未来风卡片提示词
来自宝玉。上传一张社交个人信息的截图,然后写以下提示词(话说这个在GPT-4o时代不是已经玩过一遍了么)。
一张 9:16 竖版逼真的赛博美学未来社交软件界面照片:一只手拿着一张竖直半透明的亚克力卡片,占据了大部分画面。上面显示着一个社交媒体个人资料界面,但没有任何横幅或背景图片。卡片有平滑的圆润边缘,闪烁着柔和的霓虹灯光,呈现出粉色、紫色和蓝色的渐变。背景黑暗而模糊,以突出发光的边缘。卡片表面如水晶般清澈,个人资料的细节仿佛雕刻,只显示参考图中的信息,按照顺序依次显示:
- 头像(居中)
- 用户名、顶部的认证徽章
- 个人介绍
- 地理位置、网站
- 加入日期
- 关注数和被关注数
- 关注按钮
手指上的灯光反射看起来富有电影感和氛围感,营造出一种高科技的全息氛围。

5、On-Policy Distillation:策略蒸馏