1、MLFlow:一套服务于机器学习全生命周期的平台
致力于让机器学习更简单、统一、高效。 新增LLM自动评估功能,可以替代人工评估。 新闻博客:https://databricks.com/blog/announcing-mlflow-28-llm-judge-metrics-and-best-practices-llm-evaluation-rag-applications-part MLFlow Github:‣ 官方文档:https://mlflow.org/docs/latest/index.html
2、LangChain推出模板功能
可以通过模板快捷地部署AI应用,其中RAG模板就有18个! 官方新闻:https://blog.langchain.dev/langserve-hub/ GIthub:https://github.com/langchain-ai/langchain/tree/master/templates

3、LeMa:从错误中学习,让LLM更强大
一种借助GPT-4当老师的微调方法,使LLM的数学能力大幅提升。大致流程:
1)先让LLM回答数学问题,产生回答错误的数据集;
2)然后用GPT-4做老师,标注出LLM回答错误的步骤、解释回答错误的原因并生成正确答案;
3)使用第二步GPT-4生成的数据对LLM进行微调;
论文:https://arxiv.org/abs/2310.20689
Github(暂未发布代码):https://github.com/microsoft/CodeT

4、Phind宣称他们的模型在代码能力上超越GPT-4
Phind是专注于AI写代码的应用,模型基于CodeLlama-34B训练。最近宣传他们的模型在代码能力行超越了GPT-4,而且速度快5倍。我表示怀疑。