2026.6.5-实时音乐模型Magenta RealTime 2

1、谷歌开源实时音乐模型Magenta RealTime 2 延迟约200ms，有2.4B和230M两个大小的模型，支持文本和音频输入，不过只能生成纯音乐，不能生成带人声的歌曲。模型：https://huggingface.co/google/magenta-realtime-2

2、Codex新增Build iOS Apps插件 可以在Codex的浏览器里实时查看和调试iOS应用，是把模拟器的画面串流到浏览器里实现的。

3、ChatGPT发布"Dreaming"记忆系统 后台异步生成记忆，自动提炼，自动修正。官方介绍：https://openai.com/index/chatgpt-memory-dreaming/

4、Anthropic发布了一篇博客：当AI能构建AI自身 文章前半部分写的是AI发展非常快，AI已经能写用于AI的代码了，然后说这样很危险，呼吁大家放缓AI研发的进度，甚至要研发一个协作系统，能保证大家一起放缓。丝毫没提自己先放缓AI研发的事，而且Anthropic前几天刚提交了招股书。整个文章非常莫名其妙。原文：https://www.anthropic.com/institute/recursive-self-improvement

5、电商从业者的福音 Gemini Omni可以去除视频里的硬字幕，自动补充被字幕遮挡的画面。下方视频1：原视频，带字幕；下方视频2：Gemini Omni编辑后的视频；

有字幕的广告视频.mp4

Remove_text_from_video_202606042245.mp4

GPT Image 2 / Banana Pro国内直连版 我做的小产品。无需VPN，填写key就能用，操作简单，适合小白。买了可以给别人用，搭个人情也不错。GPT Image 2是1毛一张，Banana所有分辨率（1K/2K/4K）都是3毛一张，极具性价比，也可以同时使用我做的AI PPT功能快速生成大厂风格PPT。

使用Banana Pro和GPT Image 2：https://gordensun.github.io/NanoBananaPro/ 使用AI PPT：https://gordensun.github.io/NanoBananaProPPT/

我的公众号：AI加速派分享国内可以直接操作的前沿教程，而且教程里的token和key我都承包了，你甚至不用注册账号就能跑通。