AI知识分享AI知识分享
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
  • Transformer

    • Transformer - 概述
    • Transformer - Encoding and Decoding Context with Attention
    • Transformer - Tokenizers
    • Transformer - 架构
    • Transformer - Block
    • Transformer - 自注意力
    • Transformer - MoE
    • Transformer - Transformer
  • Pytorch

    • Pytorch - Dataset
    • Pytorch - TensorBoard
    • Pytorch - transforms
    • Pytorch - DataLoader
    • Pytorch - nn
    • Pytorch - Model
    • Pytorch - train
    • Pytorch - Practice
    • Pytorch - pytorch
  • HuggingFace

    • HuggingFace - Transformers
    • HuggingFace - Pipeline
    • HuggingFace - Tokenizer
    • HuggingFace - Model
    • HuggingFace - Datasets
    • HuggingFace - Evaluate
    • HuggingFace - Trainer

Transformers - Encoding and Decoding Context with Attention

  • 概述
  • BERT
  • Context Length
  • Parameters
  • Year of Generative AI

概述

  • 一种完全基于注意力机制、没有 RNN 的新架构

  • 可以并行训练,从而显著加快计算速度

  • 堆叠这些块可以增强编码器和解码器的强度。

Transformer Encoder

Attention is All You Need

表现模型

BERT

BERT(Bidirectional Encoder Representations from Transformers,来自 Transformer 的双向编码器表示)

BERT

  • BERT 专注于表示语言和生成上下文词嵌入
  • [CLS] 标记(分类标记)
    • 附加输入标记:用作整个输入的表示
    • 通常用作输入嵌入,用于在分类等特定任务上微调模型
  • 掩蔽语言建模
    • 训练
      • 输入序列中的一些单词随机被掩蔽
      • 模型经过训练可以预测这些掩蔽的单词
      • 通过这样做,模型在尝试解构这些掩蔽的单词时学会表示语言

Masked Language Modeling

训练是一个两步过程:

Two-step trainng process

生成模型

Generative Pre-Trained Transformer (GPT)

嵌入是随机初始化的

GPT & BERT

Context Length

Context Length

Parameters

GPT evolution

Year of Generative AI

Evolution of Proprietary and Open-source models

最近更新: 2025/4/5 15:37
Contributors: klc407073648
Prev
Transformer - 概述
Next
Transformer - Tokenizers