2024.8.18-今天没什么新闻

1、1.5-Pints:9天训练1个LLM

更注重数据集的质量,数据集大小仅57B token,仅需9天即可完成LLM训练。基于的是LLaMA架构。

Github:https://github.com/Pints-AI/1.5-Pints

论文:https://arxiv.org/abs/2408.03506v1

2、LongWriter:让LLM能输出更长token

一般LLM的输出长度是8K,即使是Gemini这种上下文128K的LLM,这篇论文提出了一种方法,将超长生成任务分解为子任务,使现有LLM能够生成超过20000字的输出。不过GPT-4o在最近推出了输出长度64K的模型,显然比这个方法更高效。

论文:https://arxiv.org/abs/2408.07055v1

Github:https://github.com/thudm/longwriter

3、SAM-2_Surgical_Video:SAM 2在手术视频的效果评估

整体来讲效果不错,但是有新工具出现时会有追踪不准确的情况。目前只是评估数据集,为以后的手术机器人视觉学习提供了基础。

Github:https://github.com/AngeLouCN/SAM-2_Surgical_Video

论文:https://paperswithcode.com/paper/2408-01648