2024.7.19-3个小而强的模型

1、GPT-4o mini

ChatGPT 3.5的替代者(3.5现已下线),超便宜,15美分/百万输入,60美分/百万输出,128K上下文,多模态(与GPT-4o类似,目前仅支持文字和图片输入,后续会支持输入输出文字图片语音) 官方介绍:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

Untitled

2、Mistral NeMo

Mistral开源的模型,12B,能力稍微超过LLaMA 3 8B,128K上下文,Tokenizer更高效,多语言能力更强,中文显著优于LLaMA 3 8B 官方介绍:https://mistral.ai/news/mistral-nemo/ 模型:https://huggingface.co/mistralai

Untitled

3、DCLM-7B

苹果开源的模型,7B,能力跟LLaMA 3 8B接近,优点是全开源包括数据集,缺点是只有2K上下文。 Github:https://github.com/mlfoundations/dclm 模型:https://huggingface.co/apple/DCLM-7B

4、Morphic Studio:生成可控视频

看起来像ControlNet版视频生成,能inpaint、能生成一致角色、能指定动作变化。

排队地址:https://studio.morphic.com/

twittervid.com_morphicfilms_f12350.mp4