2025.1.16-Luma AI发布新的视频模型Ray 2

1、Luma AI发布新的视频模型Ray 2

视频更逼真,目前仅支持文本生成视频,后续会支持图生视频和视频生视频。

twittervid.com_LumaLabsAI_107cf6.mp4

2、ReaderLM-v2:网页转Markdown和Json 1.5B参数的小模型,专门用于网页转Markdown和从网页提取Json,转换准确率不弱于32B的大模型。 官方介绍:https://jina.ai/news/readerlm-v2-frontier-small-language-model-for-html-to-markdown-and-json/ 模型:https://huggingface.co/jinaai/ReaderLM-v2/tree/main

image.png

3、海螺发布语音模型T2A-01-HD

支持语音克隆,能生成情感丰富的语音。未开源,目前网页上限时免费使用。

使用地址:https://www.hailuo.ai/audio

4、Social Media Agent:半自动的社交智能体

能完成读取网页、写推文、贴配图、发布,但是登录和发布的环节,需要人类干预。

Github:https://github.com/langchain-ai/social-media-agent

5、利用Kokoro-82M制作有声电子书

这篇教程介绍了如何使用Kokoro-82M TTS模型制作有声电子书。Kokoro-82M最大的优点是设备要求低,不过目前开源v0.19版本只能生成英文,后续开源v0.23版本后可以生成中文。

教程:https://claudio.uk/posts/epub-to-audiobook.html