1、Fish Audio发布S1声音模型
可以生成像演员一样品质的语音,语气自然,能带情绪。中文语音我首推Fish Audio。
官方介绍:https://openaudio.com/blogs/s1
2、Luma上线视频编辑功能
可以基于原始视频的动作,转换成新的风格和内容。宣传视频的效果非常好。
官方介绍:https://lumalabs.ai/blog/news/introducing-modify-video
3、VLM-R3:类似o3的多模态推理模型
像o3一样,能够自动根据需要放大图片来查看细节,并把局部图片融入到推理过程中。
论文:https://arxiv.org/abs/2505.16192
4、OpenAI o3-pro模型已上线
目前仅200美元的Pro用户可以使用。
另外,Codex现在Plus用户也可以使用了。
5、Veo3保持角色一致的小技巧