2025.7.21-今天没什么新闻

1、JDGenie:京东开源的通用智能体

完整的多Agent框架,开箱即用,轻量,不依赖于云平台。在GAIA榜单准确率达到75.15%,超过OpenManus、OWL、AutoAgent等产品。

Github:https://github.com/jd-opensource/joyagent-jdgenie

2、Agentic-R1:更擅长调用工具的模型

针对问题会采取最佳策略,调用工具来解决算术和算法问题,使用基于文本的推理来解决抽象问题。7B模型,整体评分略高于DeepSeek R1蒸馏的7B模型。

Github:https://github.com/StigLidu/DualDistill

image.png

3、我是如何免费、快速给视频制作字幕

方法1:Gemini 流程:Gemini识别音频/视频,手动创建.srt文件,复制粘贴进去,然后导入剪映使用。 使用我这个提示词,在AI Studio里选择Gemini Flash 2.5,效果好到不需要开Think模式就能准确出结果,速度快的很。

提示词:
识别我上传的音频/视频里的文字,并提供可快速复制的srt格式的字幕文本,每句字幕必须使用 hh:mm:ss,xxx --> hh:mm:ss,xxx 的时间标记,尤其是每句字幕的截止时间也务必遵循格式。中文必须使用简体中文,不能出现繁体字。
以下是一段示例字幕,用作格式参考:
1
00:00:00,347 --> 00:00:07,037
有一个问题其实就是,以后现在和过去哪个其实是最重要的,

2
00:00:07,037 --> 00:00:11,107
那我觉得是过去创造了现在,现在来决定未来,

3
00:00:11,107 --> 00:00:17,217
那我觉得说我们能够把握的其实只有现在。

方法2:剪映老版本 Mac端的5.9.0的老版本剪映,还能免费用字幕识别功能,不知道还能用多久,随缘用吧。

夸克:https://pan.quark.cn/s/9aef9ab3c7f1#/list/share

百度:https://pan.baidu.com/s/1vTtK0Vbp6jjxxO_kG8sMpg?pwd=9svv#list/path=%2F

谷歌:https://drive.google.com/drive/folders/15jg8J22YueF6K2FfLQ6wEoEl5J3qwL-D

我的公众号:AI加速派