2024.8.18-今天没什么新闻

1、1.5-Pints：9天训练1个LLM

更注重数据集的质量，数据集大小仅57B token，仅需9天即可完成LLM训练。基于的是LLaMA架构。

2、LongWriter：让LLM能输出更长token

一般LLM的输出长度是8K，即使是Gemini这种上下文128K的LLM，这篇论文提出了一种方法，将超长生成任务分解为子任务，使现有LLM能够生成超过20000字的输出。不过GPT-4o在最近推出了输出长度64K的模型，显然比这个方法更高效。

3、SAM-2_Surgical_Video：SAM 2在手术视频的效果评估

整体来讲效果不错，但是有新工具出现时会有追踪不准确的情况。目前只是评估数据集，为以后的手术机器人视觉学习提供了基础。