2025.5.24-Gemini 2.5 Flash Exp Audio

1、Gemini 2.5 Flash Exp Audio:原生多模态语音模型

谷歌在I/O大会上新发布的Gemini 2.5 Flash Exp Audio模型,是原生多模态模型,支持文本、图片、语音输入,支持文本、语音输出。 输出的语音支持各种语气和声音,也能唱歌和RAP,虽然中文有时会有发音错误,但整体也非常不错了,ASMR的少女声音,让人感觉又恋爱了。 使用地址:https://aistudio.google.com/app/live,在右侧选择Gemini 2.5 Flash Exp Audio Thinking Dialog,然后把Affective dialog开关打开。

录制于 2025-05-23 23.59.12.mp4

2、THE WAY OF CODE:代码之道

Rick Rubin结合老子的《道德经》和Vibe Coding的经验写的书,做成了可视化网页。

地址:https://www.thewayofcode.com/

我的知识星球

image.png