2026.4.16-Claude Opus 4.7发布

1、Claude Opus 4.7发布 相比Opus 4.6能力提升(除了搜索能力)。 官方介绍:https://www.anthropic.com/news/claude-opus-4-7

image.png

2、GPT-Image-2即将发布 目前灰度阶段,一部分用户已经能用上了,在LMArena里可以抽到,上传2张空白图做参考,可以提升抽到的概率。效果非常好,文字几乎完美,美学也好,能判定为超越了Nano Banana Pro。下方图片完全由GPT-Image-2生成,包括所有文字。

image.png

3、OpenAI Agents SDK升级:对标Claude Managed Agents 大版本升级,从之前Chatbot形式的Agent提升到能持续执行任务的Agent,提供了完整的Harness运行环境。Python版本已经开源。 与Vercel类似,沙箱也是作为工具调用,而不是Agent直接运行在沙箱里(下图很直观)。内置支持Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel等沙箱服务,也支持自己部署沙箱。 Github:https://github.com/openai/openai-agents-python 官方介绍:https://openai.com/index/the-next-evolution-of-the-agents-sdk/

4、谷歌发布Gemini 3.1 Flash TTS 相比Gemini 2.5 Pro TTS有细微提升,中文效果还可以,但是距离完美差一点点。在AIStudio里可以免费使用,单次最长生成20秒音频。

5、阿里开源Qwen3.6-35B-A3B 小版本升级,但好消息是阿里还在开源。 模型:https://huggingface.co/Qwen/Qwen3.6-35B-A3B

6、Video Use:Claude Code直接剪辑视频 Browser Use公司开源的另外一个给Agent用的工具,原理是提取视频的字幕,并标注每个单词的时间点,然后LLM根据字幕和时间点来剪辑视频,能去掉口头禅、措辞、空白时间段。也支持按需截图分析,但整体还是靠字幕文本。适合口播类视频,能实现的功能比较有限。 Github:https://github.com/browser-use/video-use

7、Gemini推出Mac客户端 没必要下载,跟网页端一样不好用。

Banana Pro国内直连版 我做的小产品。无需VPN,填写key就能用,操作简单,适合小白。买了可以给别人用,搭个人情也不错。所有分辨率(1K/2K/4K)都是3毛一张,极具性价比,也可以同时使用我做的AI PPT功能快速生成大厂风格PPT。Banana Pro已经是工具,其他AI绘画还只是玩具。

使用Banana Pro:https://gordensun.github.io/NanoBananaPro/ 使用AI PPT:https://gordensun.github.io/NanoBananaProPPT/

我的公众号:AI加速派 分享国内可以直接操作的前沿教程,而且教程里的token和key我都承包了,你甚至不用注册账号就能跑通。

image.png