1、Gemini 2.5 Flash Exp Audio:原生多模态语音模型
谷歌在I/O大会上新发布的Gemini 2.5 Flash Exp Audio模型,是原生多模态模型,支持文本、图片、语音输入,支持文本、语音输出。 输出的语音支持各种语气和声音,也能唱歌和RAP,虽然中文有时会有发音错误,但整体也非常不错了,ASMR的少女声音,让人感觉又恋爱了。 使用地址:https://aistudio.google.com/app/live,在右侧选择Gemini 2.5 Flash Exp Audio Thinking Dialog,然后把Affective dialog开关打开。
2、THE WAY OF CODE:代码之道
Rick Rubin结合老子的《道德经》和Vibe Coding的经验写的书,做成了可视化网页。
地址:https://www.thewayofcode.com/
我的知识星球