2024.8.14-Gemini Live

1、Gemini Live

谷歌发布会发布了新的Pixel和一系列AI功能,其中的亮点有:

· Gemini Live:类似GPT-4o,支持语音聊天,能调用摄像头根据看到的内容问答,且能调用系统应用。

· Pixel的摄像和视频增加AI功能,包括Add Me(把角色合成到照片中)、AI编辑图片等。

· Pixel Studio AI绘图应用,Imagen3的APP版本

完整内容:https://blog.google/products/platforms-devices/made-by-google-2024-collection/

image.png

2、X AI 发布Grok-2

马斯克旗下的AI公司,发布2个模型:Grok-2和Grok-2 mini,可用性相比之前的1.5版本大幅提升,评分超过GPT-4,但没有超过Sonnet 3.5。接入了Flux,可以生成非常好的图片。X的Premium会员可用。

官方介绍:https://x.ai/blog/grok-2

image.png

3、UniPortrait:角色一致性+风格参考的框架 实现了单角色一致性(类似IPAdapter)、多角色一致性和风格参考,效果还可以,但是相比ComfyUI工作流没什么优势。 项目地址:https://aigcdesigngroup.github.io/UniPortrait-Page/ 在线使用:https://huggingface.co/spaces/Junjie96/UniPortrait

image.png

4、HeadGAP:图片生成3D虚拟人 基于高斯泼溅实现,输入3个视角的图片,即可生成该角色逼真的3D虚拟人,并且可以根据参考视频实现面部表情同步(像是3D版LivePortrait) 项目地址:https://headgap.github.io/

252.mp4