admin
-
DDColor:阿里巴巴达摩院推出的开源AI图像上色模型
DDColor是由阿里巴巴达摩院团队在 ICCV 2023 发布的开源 AI 图像上色模型。它采用创新的 双解码器(Dual Decoders)结构,结合多尺度视觉特征与可学习的颜色查询(Color Queries),能够为黑白或灰度图像自动生成自然、逼真的色彩效果。
-
Etna模型 – 七火山科技开发的文生视频AIGC模型/能生成15秒4K视频
Etna模型是由七火山科技开发的文生视频AIGC模型,它能够根据用户简短的文本描述,自动生成相应的视频内容。这一技术的出现,标志着AI在视频内容创作领域迈出了重要一步。Etna模型…
-
MuseV – 腾讯推出高保真虚拟人视频生成框架
MuseV由腾讯音乐娱乐的天琴实验室所研发,基于扩散的虚拟人类视频生成框架,主要用于生成高质量的虚拟人视频和口型同步。它支持从图像到视频、文本到图像到视频、视频到视频等多种生成方式…
-
云雀大模型 – 字节跳动研发基于注意力机制的深度学习语言模型
云雀大模型是字节跳动研发的一种基于注意力机制的深度学习语言模型,非常适合处理自然语言处理任务。它使用了Transformer架构,具有良好的并行性和效率,可以在大规模数据集上进行训…
-
EMO (Emote Portrait Alive) – 阿里创新音频驱动型肖像视频生成框架
EMO (Emote Portrait Alive) 是由阿里巴巴集团智能计算研究院的研究团队开发的创新音频驱动型肖像视频生成框架。该系统以音频信号为驱动,生成栩栩如生的肖像视频。…
-
GPT-4 – OpenAI 开发的最新一代大型语言模型
GPT-4(Generative Pre-trained Transformer 4)是由 OpenAI 开发的最新一代大型语言模型。它是一个多模态模型,能够接受图像和文本输入,并…
-
天工AI – 双千亿级大语言模型/搜索/对话/写作助手
天工AI是由昆仑万维和奇点智源合作自研的国产大型语言模型,具备强大的数据处理能力和深度学习能力,能够迅速适应各种复杂场景。它拥有高度智能化的算法,在语音识别、图像识别、自然语言处理…
-
智源悟道大模型 – 智源研究院开源万亿级人工大模型
智源悟道大模型是由北京智源人工智能研究院发布的一系列大模型。其中,悟道3.0大模型系列包含悟道·天鹰(Aquila)语言大模型系列、“天秤(FlagEval)”大语言评测体系及开放…
-
简悦 SimpRead – 如杂志般沉浸式阅读体验的扩展
简悦SimpRead是一款信息管理和知识管理工具,它集剪藏、稍后读、阅读、批注、回顾、导出等多种功能于一体,提供一站式服务。这款工具最大的特点之一是它基于本地环境的稍后读/标注系统…
-
Sora- OpenAI 最新发布的文本生成视频模型。
Sora是 OpenAI 最新发布的文本生成视频模型。它可以根据用户提供的文本描述,生成长达一分钟的全动态视频,1080P 高质量视频,其中包含精细复杂的场景、生动的角色表情以及复…