2024.1.4-Mobile ALOHA:自主学习的机器人

1、Mobile ALOHA:可以自主学习的机器人操作系统

由坦福大学开发,用于执行需要双手和全身协调的复杂移动任务。能炒菜,能开柜子。

通过模仿学习,仅通过50次任务演示,就能自主完成日常生活中的各种任务。

项目地址:https://mobile-aloha.github.io 训练代码:https://github.com/MarkFzp/act-plus-plus 硬件代码:https://github.com/MarkFzp/mobile-aloha 教程:https://docs.google.com/document/d/1_3yhWjodSNNYlpxkRCPIlvIAaQ76Nqk2wsqhnEVM6Dc

ssstwitter.com_1704304566259.mp4

2、减少LLM幻觉的方法

这篇论文总结了减少LLM幻觉的32种方法,包括RAG、微调模型,提示词工程等。 论文:https://arxiv.org/abs/2401.01313

Untitled

3、Self-Extend:提升LLM上下文的长度

无需训练和微调,仅通过几行代码,即可提升LLM context的有效长度。 不是提升LLM的上下文长度,是减少了上下文长度的退化。方法看起来异常的简单,只是后移了token的位置(在更远的地方建索引) 论文:https://arxiv.org/abs/2401.01325

4、E5-mistral-7b-instruct:使用合成数据训练的Embedding模型 亮点是仅使用LLM生成的数据即可实现不错的效果,使用合成数据+标记数据训练可以实现SOTA。 大小比其他模型大10倍,性能也仅是微弱提升。更大的意义是实践了合成数据的作用。 论文:https://arxiv.org/abs/2401.00368 模型:https://huggingface.co/intfloat/e5-mistral-7b-instruct

Untitled

5、Deblurring-3D-Gaussian-Splatting:减少高斯泼溅的渲染模糊问题

之前的辐射渲染,可以合成高质量的图片和3D场景,但是训练成本高,渲染时间长。 新兴的高斯泼溅,可以实时渲染,但是存在图片模糊的情况。 Deblurring-3D-Gaussian-Splatting提出了新的实时去模糊框架,可以实现高质量实时渲染。 项目地址:https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/ 论文:https://arxiv.org/abs/2401.00834

ssstwitter.com_1704353973233.mp4