1、Mobile ALOHA:可以自主学习的机器人操作系统
由坦福大学开发,用于执行需要双手和全身协调的复杂移动任务。能炒菜,能开柜子。
通过模仿学习,仅通过50次任务演示,就能自主完成日常生活中的各种任务。
项目地址:https://mobile-aloha.github.io 训练代码:https://github.com/MarkFzp/act-plus-plus 硬件代码:https://github.com/MarkFzp/mobile-aloha 教程:https://docs.google.com/document/d/1_3yhWjodSNNYlpxkRCPIlvIAaQ76Nqk2wsqhnEVM6Dc
ssstwitter.com_1704304566259.mp4
2、减少LLM幻觉的方法
这篇论文总结了减少LLM幻觉的32种方法,包括RAG、微调模型,提示词工程等。 论文:https://arxiv.org/abs/2401.01313

3、Self-Extend:提升LLM上下文的长度
无需训练和微调,仅通过几行代码,即可提升LLM context的有效长度。 不是提升LLM的上下文长度,是减少了上下文长度的退化。方法看起来异常的简单,只是后移了token的位置(在更远的地方建索引) 论文:https://arxiv.org/abs/2401.01325
4、E5-mistral-7b-instruct:使用合成数据训练的Embedding模型 亮点是仅使用LLM生成的数据即可实现不错的效果,使用合成数据+标记数据训练可以实现SOTA。 大小比其他模型大10倍,性能也仅是微弱提升。更大的意义是实践了合成数据的作用。 论文:https://arxiv.org/abs/2401.00368 模型:https://huggingface.co/intfloat/e5-mistral-7b-instruct

5、Deblurring-3D-Gaussian-Splatting:减少高斯泼溅的渲染模糊问题
之前的辐射渲染,可以合成高质量的图片和3D场景,但是训练成本高,渲染时间长。 新兴的高斯泼溅,可以实时渲染,但是存在图片模糊的情况。 Deblurring-3D-Gaussian-Splatting提出了新的实时去模糊框架,可以实现高质量实时渲染。 项目地址:https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/ 论文:https://arxiv.org/abs/2401.00834