AI知识分享AI知识分享
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
  • 理论理解

    • 理论理解 - Transformers 神经网络图解指南
    • 理论理解 - LLM长上下文
  • 工程实践

    • 工程实践 - 如何训练自己的大语言模型
    • 工程实践 - 提示工程指南
  • 应用开发

    • 应用开发 - LLM Agent

如何训练自己的大语言模型

    参考资料

    • How to train your own Large Language Models

    内容

    • 数据输入
      • Stack Overflow | The-Stack-dedup(Hugging Face) | Public Replit
    • 数据处理
      • Databricks
      • Tokenization和Vocabulary Training
        • 训练我们自己的自定义词汇表,使我们的模型能够更好地理解和生成代码内容
    • 模型训练
      • MosaicML
    • 评估
      • HumanEval框架

    备注:

    • Databricks 是一家云计算公司,提供一个统一的数据分析平台,旨在帮助企业更高效地处理和分析大规模数据。
    • Hugging Face 是一个领先的人工智能公司,专注于自然语言处理(NLP)和机器学习领域。
    • MosaicML 是一家专注于提升机器学习模型训练效率和降低训练成本的公司。它提供了一个平台,用于优化和加速大规模机器学习模型的训练过程。

    最近更新: 2026/1/25 10:52
    Contributors: klc407073648
    Next
    工程实践 - 提示工程指南