1、接入了ChatGPT的火火兔
买了小码哥@lewangx的魔改火火兔,整体还是不错的,语音识别准确,响应速度可以接受,声音有趣且多。 目前预置的系统提示词还比较弱,文字长度和角色也做了限制(因为太费钱了,ChatGPT、whisper、微软TTS 3个接口费用),期待后续SaaS服务上线,用户可以自定义角色和语音。
2、PlayHT 2.0 Turbo:超快的文字生成语音的平台
我试了一下,生成一段17秒的音频,只用了0.7秒。如果用他们提供的SDK,速度会更快。只支持英文。
在线体验地址:https://play.ht/playground

3、RealFill 发布源码
出去旅游时拍了一系列照片,其中一张只拍了半身,想变成全身照怎么办? RealFill 可以根据你提供的其他照片,保持角色、服装、环境一致来进行生成式填充。
项目地址:https://realfill.github.io Github:https://github.com/thuanz123/realfill
ssstwitter.com_1696077310653.mp4
4、TensorRT:英伟达推出的插件,提升Stable Diffusion的性能
如果你的SD用的是英伟达RTX系列显卡和Automatic1111 WebUI,那推荐安装这个插件,可以提升SD出图性能。 安装插件后,点击生成引擎(需要2-10分钟),才会真正生效。
Github:https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT
5、OpenAgents:集成了多个代理的对话平台