2024.5.3-多词元预测

1、通过多词元预测实现更快更好的LLM LLM基本都是自回归地预测下一个token,每次只预测一个,Meta的这篇论文提出一次性预测多个token甚至是句子,因为预测的内容更多,LLM可以更全面的考虑整体结构,从而更有逻辑性。 这种推理方式更像人类思考的方式,我觉得这个推理方法很有前景。 论文:https://arxiv.org/abs/2404.19737

Untitled

2、StoryDiffusion发布了部分源码

保持角色一致,可以生成多图漫画和长视频,目前发布了生成漫画部分的源码。

Github:https://github.com/HVision-NKU/StoryDiffusion

在线体验:https://huggingface.co/spaces/YupengZhou/StoryDiffusion

3、实用的提示词工程实操策略

不是提示词教程,而是提示词实操策略。

原文:https://twitter.com/cwolferesearch/status/1786025095959298234

宝玉翻译版:https://baoyu.io/translations/prompt-engineering/basic-ideas-behind-prompt-engineering

Datou总结脑图:

Untitled

4、综述:NeRF在机器人领域的应用和进展 神经辐射场(NeRF)除了在计算机视觉应用,在机器人领域也非常有应用前景。这篇论文总结了NeRF在机器人领域的应用和进展。 论文:https://arxiv.org/abs/2405.01333

Untitled