AI大模型
-
Imagen 3 – 谷歌推出最新文生图模型
Imagen 3 是由 Google DeepMind 开发的最新文本到图像(Text-to-Image)生成大模型,该模型于2024年5月14日(美国当地时间)在谷歌的I/O开发…
-
Veo – 谷歌DeepMind推出的高分辨率、长视频生成AI模型
Veo是谷歌DeepMind推出的一款AI视频生成模型,它能够根据简短的文本描述或图像生成高质量的视频内容。该模型支持使用文本生成视频,能创建超过60秒的1080P视频,并支持多种…
-
MagicVideo-V2 – 字节跳动开发的AI视频生成模型和框架
MagicVideo-V2 是一款由 字节跳动 公司团队开发的AI视频生成模型和框架。它通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块,构建了一个端到端的视频…
-
百川智能 – 汇聚世界知识,创作妙笔生花
百川智能是一家由王小川和茹立云联合创立的中国公司,专注于研发并提供通用人工智能服务。融合了意图理解、信息检索以及强化学习技术,结合有监督微调与人类意图对齐,在知识问答、文本创作领域…
-
腾讯混元大模型 – 腾讯全方位自研的大型通用语言模型
腾讯混元大模型(Tencent Hunyuan Large Model)是腾讯公司推出的一系列超大规模的人工智能模型,旨在通过深度学习和自然语言处理等技术,实现更智能、更自然的人机…
-
Outfit Anyone – 阿里推出的虚拟试穿技术模型/为您打造个性化虚拟试穿体验
Outfit Anyone是阿里巴巴推出的一种虚拟试穿技术,它利用先进的人工智能和机器学习技术,为用户在照片上提供高质量和细节一致的虚拟试穿效果。这种技术可以适应不同的姿势和身材,…
-
DDColor:阿里巴巴达摩院推出的开源AI图像上色模型
DDColor是由阿里巴巴达摩院团队在 ICCV 2023 发布的开源 AI 图像上色模型。它采用创新的 双解码器(Dual Decoders)结构,结合多尺度视觉特征与可学习的颜色查询(Color Queries),能够为黑白或灰度图像自动生成自然、逼真的色彩效果。
-
Etna模型 – 七火山科技开发的文生视频AIGC模型/能生成15秒4K视频
Etna模型是由七火山科技开发的文生视频AIGC模型,它能够根据用户简短的文本描述,自动生成相应的视频内容。这一技术的出现,标志着AI在视频内容创作领域迈出了重要一步。Etna模型…
-
MuseV – 腾讯推出高保真虚拟人视频生成框架
MuseV由腾讯音乐娱乐的天琴实验室所研发,基于扩散的虚拟人类视频生成框架,主要用于生成高质量的虚拟人视频和口型同步。它支持从图像到视频、文本到图像到视频、视频到视频等多种生成方式…
-
云雀大模型 – 字节跳动研发基于注意力机制的深度学习语言模型
云雀大模型是字节跳动研发的一种基于注意力机制的深度学习语言模型,非常适合处理自然语言处理任务。它使用了Transformer架构,具有良好的并行性和效率,可以在大规模数据集上进行训…