2026.6.5-实时音乐模型Magenta RealTime 2

1、谷歌开源实时音乐模型Magenta RealTime 2 延迟约200ms,有2.4B和230M两个大小的模型,支持文本和音频输入,不过只能生成纯音乐,不能生成带人声的歌曲。 模型:https://huggingface.co/google/magenta-realtime-2

2、Codex新增Build iOS Apps插件 可以在Codex的浏览器里实时查看和调试iOS应用,是把模拟器的画面串流到浏览器里实现的。

3、ChatGPT发布"Dreaming"记忆系统 后台异步生成记忆,自动提炼,自动修正。 官方介绍:https://openai.com/index/chatgpt-memory-dreaming/

4、Anthropic发布了一篇博客:当AI能构建AI自身 文章前半部分写的是AI发展非常快,AI已经能写用于AI的代码了,然后说这样很危险,呼吁大家放缓AI研发的进度,甚至要研发一个协作系统,能保证大家一起放缓。丝毫没提自己先放缓AI研发的事,而且Anthropic前几天刚提交了招股书。整个文章非常莫名其妙。 原文:https://www.anthropic.com/institute/recursive-self-improvement

5、电商从业者的福音 Gemini Omni可以去除视频里的硬字幕,自动补充被字幕遮挡的画面。 下方视频1:原视频,带字幕; 下方视频2:Gemini Omni编辑后的视频;

有字幕的广告视频.mp4

Remove_text_from_video_202606042245.mp4

GPT Image 2 / Banana Pro国内直连版 我做的小产品。无需VPN,填写key就能用,操作简单,适合小白。买了可以给别人用,搭个人情也不错。GPT Image 2是1毛一张,Banana所有分辨率(1K/2K/4K)都是3毛一张,极具性价比,也可以同时使用我做的AI PPT功能快速生成大厂风格PPT。

使用Banana Pro和GPT Image 2:https://gordensun.github.io/NanoBananaPro/ 使用AI PPT:https://gordensun.github.io/NanoBananaProPPT/

我的公众号:AI加速派 分享国内可以直接操作的前沿教程,而且教程里的token和key我都承包了,你甚至不用注册账号就能跑通。

image.png