2023.11.28-Starling-7B:通过AI反馈强化学习的LLM

1、Starling-7B:通过AI反馈强化学习(RLAIF)的LLM

数据集由GPT-4标注,基于Openchat 3.5训练LLM,基于Llama2-7B训练奖励模型。

MT-Bench仅次于GPT-4。

项目地址:https://starling.cs.berkeley.edu/

数据集:https://huggingface.co/datasets/berkeley-nest/Nectar

奖励模型:https://huggingface.co/berkeley-nest/Starling-RM-7B-alpha

LLM模型:https://huggingface.co/berkeley-nest/Starling-LM-7B-alpha

2、Self-Operating Computer Framework:让GPT-4V自动操作电脑 本身是一个自动操作电脑的框架,结合了GPT-4V的能力,能让GPT识别出按钮和文本框位置,自动输入文字、自动点击按钮提交,像是智能版按键精灵。 Github:https://github.com/OthersideAI/self-operating-computer

285079251-9e8abc96-c76a-46fb-9b13-03678b3c67e0.mp4

3、Excalidraw 发布文字生成图表和原型生成代码的功能 网址:https://excalidraw.com 入口:右上角最后一个图标 - text to diagram 和 wireframe to code

文字生成图片实际是让GPT-4把文字需求转换成了Mermaid代码,然后渲染出来,每天免费10次。 原型图生成代码,需要提供 GPT-4V 的OpenAI Key

Untitled

4、Deforum开启了Discord内生成视频的Beta测试 频道地址:https://discord.gg/deforum 进入子频道beta-2-animate使用,操作说明在beta-info中。 Deforum生成视频的形式是最早期的模样,只能算是演化,不能算是动画,相比之前在出图质量上有明显的提升。

我生成的视频:

gorden1713-skint_goon_8069-animation-skint_goon_8069.mp4