1、Cohere开源语音识别模型Transcribe 2B参数,本地能跑,可能是目前的开源最佳,但是不确定中文识别的效果如何。 模型:https://huggingface.co/CohereLabs/cohere-transcribe-03-2026

2、谷歌发布Lyria 3 Pro 能生成3分钟的有人声的歌曲,Pro用户可以在Gemini里使用,也可以付费在AI Studio里使用API。 官方介绍:https://blog.google/innovation-and-ai/technology/ai/lyria-3-pro/
3、Claude Code指令速查表 网址:https://cc.jiangrzc.cn/
4、TRIBE v2:AI预测大脑对视频刺激的fMRI响应 用Meta自家的三个基座模型分别提取视觉、音频和文本特征,统一投影到同一维度后拼接,再通过Transformer建模时序和跨模态关系,最终预测1000个脑区的fMRI信号。 在Algonauts 2025比赛中获得冠军。 模型:https://huggingface.co/facebook/tribev2
Banana Pro国内直连版 我做的小产品。无需VPN,填写key就能用,操作简单,适合小白。买了可以给别人用,搭个人情也不错。所有分辨率(1K/2K/4K)都是3毛一张,极具性价比,也可以同时使用我做的AI PPT功能快速生成大厂风格PPT。Banana Pro已经是工具,其他AI绘画还只是玩具。
使用Banana Pro:https://gordensun.github.io/NanoBananaPro/ 使用AI PPT:https://gordensun.github.io/NanoBananaProPPT/
我的公众号:AI加速派 分享国内可以直接操作的前沿教程,而且教程里的token和key我都承包了,你甚至不用注册账号就能跑通。
