1、Grok 3发布
10万卡训练,分Grok 3、Grok 3 mini两个版本,支持搜索和思考模式。能力绝对一线。
在官网和X里可以使用,官网功能更齐全。
官网地址:https://grok.com/
2、阶跃星辰开源视频和音频模型
· 视频模型:Step-Video-T2V,30B大小,一次可以生成204帧的视频。
Github:https://github.com/stepfun-ai/Step-Video-T2V
· 音频模型:Step-Audio:原生多模态语音对话系统。开源一系列音频相关模型,包括
Step-Audio-Chat:130B原生多模态语音模型
Step-Audio-TTS-3B:支持唱歌和RAP的语音合成TTS模型
Step-Audio-Tokenizer:分词模型
Github:https://github.com/stepfun-ai/Step-Audio
412358953-f95a7a49-032a-44ea-a10f-553d4e5d21c6.mp4
3、SkyReels-V1:基于混元微调的人像视频模型
专注于生成人物视频。开源。