2025.6.4-Fish Audio发布S1声音模型

1、Fish Audio发布S1声音模型

可以生成像演员一样品质的语音,语气自然,能带情绪。中文语音我首推Fish Audio。

官方介绍:https://openaudio.com/blogs/s1

SjpgpzdpO60aOIfH.mp4

2、Luma上线视频编辑功能

可以基于原始视频的动作,转换成新的风格和内容。宣传视频的效果非常好。

官方介绍:https://lumalabs.ai/blog/news/introducing-modify-video

q9sSXVk3ZB-Z5-xD.mp4

3、VLM-R3:类似o3的多模态推理模型

像o3一样,能够自动根据需要放大图片来查看细节,并把局部图片融入到推理过程中。

论文:https://arxiv.org/abs/2505.16192

4、OpenAI o3-pro模型已上线

目前仅200美元的Pro用户可以使用。

另外,Codex现在Plus用户也可以使用了。

5、Veo3保持角色一致的小技巧