2023.11.1-MLFlow-服务机器学习全周期

1、MLFlow:一套服务于机器学习全生命周期的平台

致力于让机器学习更简单、统一、高效。 新增LLM自动评估功能,可以替代人工评估。 新闻博客:https://databricks.com/blog/announcing-mlflow-28-llm-judge-metrics-and-best-practices-llm-evaluation-rag-applications-part MLFlow Github:‣ 官方文档:https://mlflow.org/docs/latest/index.html

2、LangChain推出模板功能

可以通过模板快捷地部署AI应用,其中RAG模板就有18个! 官方新闻:https://blog.langchain.dev/langserve-hub/ GIthub:https://github.com/langchain-ai/langchain/tree/master/templates

Untitled

3、LeMa:从错误中学习,让LLM更强大

一种借助GPT-4当老师的微调方法,使LLM的数学能力大幅提升。大致流程:

1)先让LLM回答数学问题,产生回答错误的数据集;

2)然后用GPT-4做老师,标注出LLM回答错误的步骤、解释回答错误的原因并生成正确答案;

3)使用第二步GPT-4生成的数据对LLM进行微调;

论文:https://arxiv.org/abs/2310.20689

Github(暂未发布代码):https://github.com/microsoft/CodeT

Untitled

4、Phind宣称他们的模型在代码能力上超越GPT-4

Phind是专注于AI写代码的应用,模型基于CodeLlama-34B训练。最近宣传他们的模型在代码能力行超越了GPT-4,而且速度快5倍。我表示怀疑。

官方新闻:https://www.phind.com/blog/phind-model-beats-gpt4-fast