1、OpenAI o1模型
新系列模型,从o1开始重新命名,特色是推理能力更强,在回答问题前使用CoT充分思考回答。Plus会员可用,o1 preview每周限制30条消息,o1 mini每周限制50条消息。
关于模型的详细解读,建议直接看官方介绍和文档,提供了比较详细的原理解释。总体来讲,从堆训练资源转为了堆推理资源。
API的字面价格是3倍,实际推理消耗的token几倍到几十倍,综合价格比GPT-4o至少高10-20倍。
官方介绍:https://openai.com/index/introducing-openai-o1-preview/
Cursor、Github Copilot已接入模型。免费使用o1 preview和o1 mini的方式: 1)https://fal.ai/models/fal-ai/openai-o1 2)https://huggingface.co/spaces/yuntian-deng/o1 3)https://huggingface.co/spaces/yuntian-deng/o1mini
2、PuLID发布Flux版本
用于保持角色一致,仅需一张图片,无需再训练LoRA,效果还不错。
Github:https://github.com/ToTheBeginning/PuLID
在线使用:https://huggingface.co/spaces/yanze/PuLID-FLUX
3、SunoAI上线AI翻唱功能
提供你唱的一段歌,AI给翻唱成完整的歌曲,支持通过文字来制定音乐风格,仅付费用户可用。。要是能克隆声音就更好了。
twittervid.com_nickfloats_f01807.mp4
4、HeyGen推出Avatar 3.0
虚拟人不再局限于口型同步,更有半身动作,并且面部表情和语音的语调相匹配。