2025.3.20-Reka开源Reka Flash 3

1、Reka开源Reka Flash 3 Reka是由十几个谷歌DeepMind前科学家们创办的公司,Reka Flash 3是他们开源的首个模型,21B的推理模型,在同等大小中能力远超其他模型,得分超过Command A、Gemma 3 27B等。 在线体验(效果很不错):https://space.reka.ai/ 模型:https://huggingface.co/RekaAI/reka-flash-3

image.png

2、嘴炮PS:动动嘴就能P图

我让Sonnet 3.7写了一个网页应用,语音输入,调用Gemini API编辑图片,效果优秀。 Sonnet 3.7太强了,一次性写的几百行代码就能运行,极少有程序员能做到这样吧,而且提示词很简单,大多内容是贴的官方文档。

提示词:语音调用Gemini API编辑图片提示词

Github(价值不大):https://github.com/GordenSun/voice-gemini-editor

zw_o9cALa668q5jh.mp4

3、英伟达开源Nemotron-Super系列推理模型 3个大小,8B、49B、249B,分别从LLaMA 3的8B、70B、405B蒸馏和强化训练而来。支持通过提示词开启或关闭推理模型。 比较低调,模型介绍都没有放跟其他模型的评分对比,49B优于QwQ 32B,弱于DeepSeek R1。 模型:https://huggingface.co/collections/nvidia/llama-nemotron-67d92346030a2691293f200b

4、阶跃星辰开源Step-Video-TI2V视频模型

DiT架构,30B参数,支持图生视频和文生视频。至少需要64G显存才能运行。

模型:https://huggingface.co/stepfun-ai/stepvideo-ti2v

71HktzAUyutOJnIx.mp4

5、Orpheus 3B:开源TTS模型

3B大小,LLaMA架构,支持情感控制和语音克隆。应该不支持中文。

官方介绍:https://canopylabs.ai/model-releases