1、Claude Code桌面端更新 可视化管理多个对话窗口,集成了终端、文件编辑、HTML和PDF预览、查看Diff。大幅度改版。 Claude客户端尤其适合非程序员使用,日常聊天用Chat,处理Excel/PPT等用Cowork,写代码用Code,一个客户端,3种场景。
2、Claude Code推出Routines功能 自动化运行任务,支持定时任务、API调用、GitHub Webhook,在Claude Web云端运行。 三种触发方式 · 定时触发(Scheduled):设定小时/天/周级别的执行频率,比如"每晚2点从Linear拉最高优先级bug,尝试修复并PR" · API触发:每个Routine自带独立端点和认证Token,任何能发HTTP请求的系统都可以触发——监控告警、内部工具等 · GitHub Webhook触发:订阅仓库事件(如PR创建),Claude会为每个匹配事件创建独立Session,持续跟踪情况 官方介绍:https://claude.com/blog/introducing-routines-in-claude-code
3、Claude新增实名认证机制 目前按条件触发,尚未大规模推广,以后订阅账号会更难。不过我觉得整体影响可控,一方面国外对于收集实名信息管控很严,不容易触发;另一方面,我们还有万能的闲鱼。 官方介绍:https://support.claude.com/en/articles/14328960-identity-verification-on-claude
4、Chrome里的Gemini支持Skills 方便在侧边栏的Gemini快速复用prompt,省去了复制粘贴的步骤。
5、Word集成微软Copilot 在Word侧边栏可以直接使用Copilot辅助编辑文档。
6、Spark 2.0:基于THREE.js的高性能3D高斯泼溅渲染引擎 李飞飞的World Labs开源,让Web开发者用几行代码就能在网页中渲染3DGS场景。 Github: ‣
7、Midjourney发布V8.1版本 美学还是领先的,相比V8版本速度提升、成本降低。
8、谷歌发布Gemini Robotics-ER 1.6 具身智能模型,强化了空间推理和多视角理解能力,提升了空间安全能力。并且与Boston Dynamics合作验证了在工业巡检场景的实用价值。 官方介绍:https://deepmind.google/blog/gemini-robotics-er-1-6/
9、OpenAI发布GPT-5.4-Cyber 专门针对安全场景微调的模型,赶鸭子上架应对Mythos的模型,没什么用。 官方介绍:https://openai.com/index/scaling-trusted-access-for-cyber-defense/
Banana Pro国内直连版 我做的小产品。无需VPN,填写key就能用,操作简单,适合小白。买了可以给别人用,搭个人情也不错。所有分辨率(1K/2K/4K)都是3毛一张,极具性价比,也可以同时使用我做的AI PPT功能快速生成大厂风格PPT。Banana Pro已经是工具,其他AI绘画还只是玩具。
使用Banana Pro:https://gordensun.github.io/NanoBananaPro/ 使用AI PPT:https://gordensun.github.io/NanoBananaProPPT/
我的公众号:AI加速派 分享国内可以直接操作的前沿教程,而且教程里的token和key我都承包了,你甚至不用注册账号就能跑通。
