1、Luma AI发布新的视频模型Ray 2
视频更逼真,目前仅支持文本生成视频,后续会支持图生视频和视频生视频。
twittervid.com_LumaLabsAI_107cf6.mp4
2、ReaderLM-v2:网页转Markdown和Json 1.5B参数的小模型,专门用于网页转Markdown和从网页提取Json,转换准确率不弱于32B的大模型。 官方介绍:https://jina.ai/news/readerlm-v2-frontier-small-language-model-for-html-to-markdown-and-json/ 模型:https://huggingface.co/jinaai/ReaderLM-v2/tree/main
3、海螺发布语音模型T2A-01-HD
支持语音克隆,能生成情感丰富的语音。未开源,目前网页上限时免费使用。
使用地址:https://www.hailuo.ai/audio
4、Social Media Agent:半自动的社交智能体
能完成读取网页、写推文、贴配图、发布,但是登录和发布的环节,需要人类干预。
Github:https://github.com/langchain-ai/social-media-agent
5、利用Kokoro-82M制作有声电子书
这篇教程介绍了如何使用Kokoro-82M TTS模型制作有声电子书。Kokoro-82M最大的优点是设备要求低,不过目前开源v0.19版本只能生成英文,后续开源v0.23版本后可以生成中文。