2025.2.9-今天没什么新闻

1、MedRAX:解读胸部X光片的智能体

将最先进的CXR分析工具和多模态LLM无缝集成到统一框架中的通用智能体。MedRAX能够动态利用这些模型来解答复杂的医疗查询,与开源和专有模型相比,MedRAX达到了最先进的性能水平。

论文:https://arxiv.org/abs/2502.02673

Github:https://github.com/bowang-lab/MedRAX

2、ZebraLogic:评估LLM推理能力的框架 ZebraLogic能够生成具有可控和可量化复杂度的谜题,用于评估LLM在不同难度下的推理能力。从排行榜上可以看出,DeepSeek是跟o1同水平的模型,推理类模型(o1系列、DeepSeek)的得分显著高于普通LLM。 评估数据集:https://huggingface.co/datasets/WildEval/ZebraLogic 排行:https://huggingface.co/spaces/WildEval/ZebraLogic 论文:https://arxiv.org/abs/2502.01100

image.png

3、混元生成角色一致的视频

使用混元视频模型+自己训练的LoRA。

原贴地址:https://www.reddit.com/r/StableDiffusion/comments/1ijvua0/opensource_almostconsistent_real_anime_made_with/

8qJfSRWX-fYMltwB.mp4

我的知识星球

未命名的设计 (1).png