2025.7.15-Voxtral:开源最佳语音识别模型

1、Voxtral:开源最佳语音识别模型 由Mistral AI开源,分3B和24B两个大小,准确率显著高于Whisper v3 Large、Gemini Flash 2.5,支持多语言。 模型:https://huggingface.co/mistralai/models

image.png

2、Grok APP上线3D虚拟伴侣

有各种动作,记忆聊天内容,还有好感度系统,3级以上好感度可以回复NSFW内容。支持语音聊天和视频聊天,能讲中文,但是中文不太好。

_yaExsmEE0ZKQerx.mp4

3、Groq上线Kimi K2模型

推理速度可达185 token/s。

在线使用,同时支持API:https://console.groq.com/playground?model=moonshotai/kimi-k2-instruct

4、谷歌上线gemini-embedding-001 API

谷歌首个开放使用的嵌入模型,MTEB评分显著高于OpenAI的嵌入模型。100万token 0.15美元。

官方介绍:https://developers.googleblog.com/en/gemini-embedding-available-gemini-api/

5、Claude发布应用和工具目录

用于快速查看和启动MCP。

地址:https://claude.ai/directory