AI知识分享AI知识分享
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
  • AI For Everyone

    • 什么是AI
    • 构建 AI 项目
    • 在公司内构建AI
    • AI与社会
  • AIGC_2024大会

    • 大模型下的软件工程:进展与挑战
    • 大语言模型智能体高效协作框架
    • 生成式人工智能的数学与统计学基础
    • 脑认知启发的人工智能
    • LLM Reasoning and Generalization
  • AIGC_2025大会

    • 构建人工智能安全的微基准测试
    • 大语言模型与软件自动化的变革与趋势
    • 基于大模型的代码生成和摘要技术

生成模型四种重要架构

生成模型领域中的有四种重要架构,包括:变分自编码器(VAE)、生成对抗网络(GAN)、基于流模型(Normalizing Flow)/扩散模型(Diffusion Model)和自回归模型(Autoregressive Model)。下面详细阐述其区别:

变分自编码器(VAE)

原理:VAE是一种生成模型,利用变分推断框架对数据分布进行建模。它通过将输入数据映射到潜在空间(Latent Space)并进行重构来生成数据。VAE使用的是变分推断和重参数化技巧,以便在优化过程中能够进行有效的梯度传播。

生成过程:

  • 编码器:从数据中学习到一个潜在空间的概率分布。
  • 解码器:从潜在空间中采样,然后重构输入数据。

特点:

  • 优点:训练稳定,能够通过变分推断进行高效优化,且模型可以很好地进行潜在空间的解释。
  • 缺点:生成的样本可能不如GAN那样真实,因其生成过程中使用了均值方差的近似。

生成对抗网络(GAN)

原理:GAN通过对抗训练的方式生成数据。它由两个网络组成——生成器(Generator)和判别器(Discriminator)。生成器的目标是生成尽可能真实的样本,而判别器的目标是区分真实样本和生成样本。生成器和判别器在训练过程中相互博弈,最终生成器学会生成接近真实的数据分布的样本。

生成过程:

  • 生成器:从潜在空间中采样噪声,然后通过神经网络生成样本。
  • 判别器:判断输入样本是否为真实样本。

特点:

  • 优点:生成的样本通常非常逼真,尤其在图像生成任务中。
  • 缺点:训练不稳定,容易出现模式崩溃(Mode Collapse)问题,且没有显式的潜在空间结构。

基于流模型(Normalizing Flow)

原理:流模型通过一系列可逆变换将简单分布(通常是高斯分布)映射到复杂数据分布。这些变换是可逆的,因此可以直接计算数据分布的概率。训练时,流模型通过最大化数据的对数似然来学习数据分布。

生成过程:

  • 变换:首先从简单分布(例如标准高斯分布)采样,然后通过一系列可逆的变换得到目标数据分布。

特点:

  • 优点:能够精确建模数据分布,且生成过程是可逆的,可以直接计算生成样本的概率。
  • 缺点:对于高维数据,流模型可能面临计算开销大的问题,因为需要多个高维变换和计算行列式。

扩散模型 (Diffusion Model)

原理:扩散模型基于一个逐步加入噪声的过程和一个去噪的过程。首先将真实数据通过一系列步骤逐渐添加噪声,直到变成噪声分布。然后训练一个去噪模型,通过逆过程逐步去除噪声,从而恢复原始数据。

生成过程:

  • 加噪声过程:通过多次添加噪声,逐步将真实数据转化为纯噪声。
  • 去噪过程:学习如何从噪声中恢复数据,通过逆过程生成数据。

特点:

  • 优点:生成质量很高,尤其在图像生成中与GAN相比,有时生成的细节更丰富。
  • 缺点:生成过程通常较慢,因为需要进行多次步骤(反向扩散)。

自回归模型 (Autoregressive Model)

原理:自回归模型生成数据的方式是逐步地生成每个数据点,依赖于前一个数据点的生成。在文本生成中,每个词汇的生成依赖于前一个生成的词汇;在图像生成中,每个像素的生成依赖于之前生成的像素。

生成过程:

  • 逐步生成:每个数据点的生成依赖于前一个或前几个已生成的点。
  • 条件生成:通常使用条件概率建模,给定之前的部分生成数据来预测下一个数据点。

特点:

  • 优点:生成过程简洁且容易理解,训练和推理稳定,且具有条件生成能力。
  • 缺点:生成速度较慢,特别是在高维数据(如图像)中,生成过程通常需要逐点生成。

总结对比:

特性/模型VAEGANFlow ModelDiffusion ModelAutoregressive Model
原理变分推断对抗训练可逆变换(Normalizing Flow)加噪声和去噪过程条件概率(逐步生成)
生成方式通过潜在空间采样通过生成器生成样本通过变换从简单分布到复杂分布逐步去噪恢复数据逐步生成每个数据点
生成速度较快较快较慢(需要多次变换)较慢(需要多次去噪)较慢(逐点生成)
训练稳定性稳定不稳定,模式崩溃问题稳定但计算开销大稳定但计算开销大稳定
生成质量较差较好较好,但不如GAN非常好,细节丰富很好,但生成速度慢
潜在空间可解释性良好无明确潜在空间良好不明确无明确潜在空间
最近更新: 2026/1/24 10:44
Contributors: klc407073648