2025.6.4-Fish Audio发布S1声音模型

1、Fish Audio发布S1声音模型

可以生成像演员一样品质的语音，语气自然，能带情绪。中文语音我首推Fish Audio。

官方介绍：https://openaudio.com/blogs/s1

SjpgpzdpO60aOIfH.mp4

2、Luma上线视频编辑功能

可以基于原始视频的动作，转换成新的风格和内容。宣传视频的效果非常好。

官方介绍：https://lumalabs.ai/blog/news/introducing-modify-video

q9sSXVk3ZB-Z5-xD.mp4

3、VLM-R3：类似o3的多模态推理模型

像o3一样，能够自动根据需要放大图片来查看细节，并把局部图片融入到推理过程中。

论文：https://arxiv.org/abs/2505.16192

4、OpenAI o3-pro模型已上线

目前仅200美元的Pro用户可以使用。

另外，Codex现在Plus用户也可以使用了。

5、Veo3保持角色一致的小技巧