2024.3.3-D-ID Agents:真正的数字分身

1、D-ID Agents:真正的数字分身 用你的照片做虚拟人,再克隆上你的声音,再上传文件来同步你的知识库,能实现只有2秒延迟的视频对话。 我试了下,目前一直提示不在线,体验不到真实的效果。 使用地址:https://studio.d-id.com/agents

Introducing D-ID Agents - Build and deploy AI assistants you can speak with face-to-face.mp4

2、Pix2Text:开源的公式识别工具 可能是最好的开源模型,除了Mathpix商用模型,比其他的商用模型也不差。 普通人用免费版就够用,也提供了付费版本,错误率更低。 Github:https://github.com/breezedeus/Pix2Text 在线使用(每人每天可以免费识别 10000 个字符):https://p2t.breezedeus.com/ 抱抱脸使用(可以体验付费模型):https://huggingface.co/spaces/breezedeus/Pix2Text-Demo

Untitled

3、ChatGPT灰度测试语音朗读功能

选择语音角色,然后在每个回复下面都会有一个语音播放按钮,支持多语言。之前的各种浏览器插件,即将退出舞台,我现在用的是Voice Control for ChatGPT插件,支持语音输入和回复朗读。

ssstwitter.com_1709393649497.mp4