1、深度求索发布DeepSeek V2模型
236B参数的混合专家模型,激活参数仅有21B,中文能力和推理能力比较好,但是指令遵循比较弱。
API价格超级便宜,每100万输入仅1元,每100万输出仅2元。
模型:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat

2、Granite Code LLMs:IBM发布一系列代码模型
开源,大小覆盖3B、8B、20B、34B,8B大小在同等大小中表现最佳。
Github:https://github.com/ibm-granite/granite-code-models
模型:https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330

3、GPT2重现LLM竞技场
这次有了2个版本: im-a-good-gpt2-chatbot 和 im-also-a-good-gpt2-chatbot
不能指定使用这2个模型,只能在随机时看到。
竞技场地址:https://chat.lmsys.org/
4、Logo Diffusion:专门生成logo的AI产品