2024.1.4-Mobile ALOHA：自主学习的机器人

1、Mobile ALOHA：可以自主学习的机器人操作系统

由坦福大学开发，用于执行需要双手和全身协调的复杂移动任务。能炒菜，能开柜子。

通过模仿学习，仅通过50次任务演示，就能自主完成日常生活中的各种任务。

项目地址：https://mobile-aloha.github.io 训练代码：https://github.com/MarkFzp/act-plus-plus 硬件代码：https://github.com/MarkFzp/mobile-aloha 教程：https://docs.google.com/document/d/1_3yhWjodSNNYlpxkRCPIlvIAaQ76Nqk2wsqhnEVM6Dc

ssstwitter.com_1704304566259.mp4

2、减少LLM幻觉的方法

这篇论文总结了减少LLM幻觉的32种方法，包括RAG、微调模型，提示词工程等。论文：https://arxiv.org/abs/2401.01313

Untitled

3、Self-Extend：提升LLM上下文的长度

无需训练和微调，仅通过几行代码，即可提升LLM context的有效长度。不是提升LLM的上下文长度，是减少了上下文长度的退化。方法看起来异常的简单，只是后移了token的位置（在更远的地方建索引）论文：https://arxiv.org/abs/2401.01325

4、E5-mistral-7b-instruct：使用合成数据训练的Embedding模型 亮点是仅使用LLM生成的数据即可实现不错的效果，使用合成数据+标记数据训练可以实现SOTA。大小比其他模型大10倍，性能也仅是微弱提升。更大的意义是实践了合成数据的作用。论文：https://arxiv.org/abs/2401.00368 模型：https://huggingface.co/intfloat/e5-mistral-7b-instruct

Untitled

5、Deblurring-3D-Gaussian-Splatting：减少高斯泼溅的渲染模糊问题

之前的辐射渲染，可以合成高质量的图片和3D场景，但是训练成本高，渲染时间长。新兴的高斯泼溅，可以实时渲染，但是存在图片模糊的情况。 Deblurring-3D-Gaussian-Splatting提出了新的实时去模糊框架，可以实现高质量实时渲染。项目地址：https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/ 论文：https://arxiv.org/abs/2401.00834

ssstwitter.com_1704353973233.mp4