2026.3.26-开源ASR模型Transcribe

1、Cohere开源语音识别模型Transcribe 2B参数，本地能跑，可能是目前的开源最佳，但是不确定中文识别的效果如何。模型：https://huggingface.co/CohereLabs/cohere-transcribe-03-2026

2、谷歌发布Lyria 3 Pro 能生成3分钟的有人声的歌曲，Pro用户可以在Gemini里使用，也可以付费在AI Studio里使用API。官方介绍：https://blog.google/innovation-and-ai/technology/ai/lyria-3-pro/

3、Claude Code指令速查表 网址：https://cc.jiangrzc.cn/

4、TRIBE v2：AI预测大脑对视频刺激的fMRI响应 用Meta自家的三个基座模型分别提取视觉、音频和文本特征，统一投影到同一维度后拼接，再通过Transformer建模时序和跨模态关系，最终预测1000个脑区的fMRI信号。在Algonauts 2025比赛中获得冠军。模型：https://huggingface.co/facebook/tribev2

Banana Pro国内直连版 我做的小产品。无需VPN，填写key就能用，操作简单，适合小白。买了可以给别人用，搭个人情也不错。所有分辨率（1K/2K/4K）都是3毛一张，极具性价比，也可以同时使用我做的AI PPT功能快速生成大厂风格PPT。Banana Pro已经是工具，其他AI绘画还只是玩具。

使用Banana Pro：https://gordensun.github.io/NanoBananaPro/ 使用AI PPT：https://gordensun.github.io/NanoBananaProPPT/

我的公众号：AI加速派分享国内可以直接操作的前沿教程，而且教程里的token和key我都承包了，你甚至不用注册账号就能跑通。