AI知识分享AI知识分享
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
  • AI For Everyone

    • 什么是AI
    • 构建 AI 项目
    • 在公司内构建AI
    • AI与社会
  • AIGC_2024大会

    • 大模型下的软件工程:进展与挑战
    • 大语言模型智能体高效协作框架
    • 生成式人工智能的数学与统计学基础
    • 脑认知启发的人工智能
    • LLM Reasoning and Generalization
  • AIGC_2025大会

    • 构建人工智能安全的微基准测试
    • 大语言模型与软件自动化的变革与趋势
    • 基于大模型的代码生成和摘要技术

大语言模型与软件自动化的变革与趋势 —— 李戈

  • 乔姆斯基层级(Chomsky Hierarchy)
  • 神经网络与乔姆斯基层级
  • 如何通过 Chomsky 层次结构(Chomsky Hierarchy) 来评估大语言模型(LLMs)的形式推理能力
    • 🧠 对 LLM 的启示
    • 小结
  • 不同层次的理解
    • 纵向理解
    • 狭义理解
    • 关于 大语言模型(LLM) 与 AI for Software Engineering(AI4SE) 发展现状的几个关键观点

背景

意图与代码之间的联系

意图与代码:

类比到自然语言与程序语言的关系

类比到自然语言与程序语言的关系

类比到逻辑思考与逻辑计算的关系

逻辑思考(不确定性)

  • 基于连续性假设进行建模
  • 状态表示具有模糊性
  • 状态之间基于概率转移
  • 符号语义依赖于其上下文

逻辑计算(确定性)

  • 基于离散状态进行推理
  • 状态表示具有确定性
  • 具有确定的状态转移关系
  • 产生式推理不依赖于上下文

基础大模型框架存在的问题

乔姆斯基层级(Chomsky Hierarchy)

乔姆斯基层级是形式语言理论中的一个重要分类体系,将语言按复杂度分为四类,从低到高依次为:

语法类型自动机模型记忆结构产生式规则
正则语言 (Regular, R)有限状态自动机 (FSA)自动机状态A → a 或 A → aB
上下文无关语言 (Context-Free, CF)下推自动机 (PDA)无限栈(仅栈顶可访问)A → α
上下文有关语言 (Context-Sensitive, CS)线性有界自动机 (LBA)有界带(所有位置可访问)αAβ → αγβ
递归可枚举语言 (Recursively Enumerable, RE)图灵机 (TM)无限带(所有位置可访问)γ → α

注:其中 a 是终结符,A,B 是非终结符,α,β,γ 是由终结符和/或非终结符组成的字符串。

尽管大模型在实践中表现出色,但从计算理论角度看,它们尚未突破乔姆斯基层级中较低层次的限制。

神经网络与乔姆斯基层级

乔姆斯基层级:

  • 左图:我们的实证评估将架构定位在形式语言类别的层次结构上。
  • 右图:每个形式语言类别都与一个最小计算模型(自动机)相关联,用于
  • 识别或生成该语言。所有自动机的核心都是一个有限状态控制器,

![](./images/乔姆斯基层级.png)

这是一个嵌套的集合图,表示不同类型神经网络所具备的语言识别能力,对应于乔姆斯基层级的不同级别:

层级对应语法类型神经网络模型记忆结构
最内层(绿色)Finite (有限状态)FFNN, Transformer无显式记忆
橙色Regular (正则)RNN隐含状态(有限记忆)
黄色Deterministic Context-Free (确定性上下文无关)Stack-RNN显式栈结构
粉色Context-Sensitive (上下文有关)Tape-RNN线性带(线性存储)
蓝色Recursively Enumerable (递归可枚举)Tape-RNN + 更强机制无限带(类似图灵机)

不同神经网络对于不同任务的表现

如何通过 Chomsky 层次结构(Chomsky Hierarchy) 来评估大语言模型(LLMs)的形式推理能力

乔姆斯基体系是计算机科学中刻画形式文法表达能力的一个分类谱系,是由语言学家诺姆·乔姆斯基于1956年提出的。它包括四个层次:

类型名称生成器(Generator)接受器(Acceptor)计算能力
Type-3正则语言(Regular)正则文法有限状态自动机(FSA)有限记忆
Type-2上下文无关语言(Context-Free)上下文无关文法下推自动机(PDA)栈式内存
Type-1上下文敏感语言(Context-Sensitive)上下文敏感文法线性有界自动机(LBA)线性受限内存
Type-0递归可枚举语言(Recursively Enumerable)无限制文法图灵机(TM)无限内存

🧠 对 LLM 的启示

任务类型LLM 表现预期
正则语言(Level 3)大多数 LLM 能轻松处理(如简单的模式匹配)
上下文无关语言(Level 2)部分 LLM 可以处理,但需训练或提示工程(如括号匹配)
上下文敏感语言(Level 1)很难,除非模型具备强归纳能力或外部工具辅助
递归可枚举语言(Level 0)几乎不可能 —— 因为这涉及不可判定问题(如停机问题),LLM 不可能完美解决

LLM 的形式推理能力大致停留在 Level 2~3 之间,远未达到图灵完备水平。

小结

Transformer的特点:

  • 拟合能力强
  • 推理能力弱(特别是泛化推理能力弱)

要支持Logic of Computing的建模,需解决:

  • 状态表示问题
  • 状态转移问题
  • 递归计算问题

软件自动化

不同层次的理解

纵向理解

  1. 低级自动化:自动化系统只起程序人员的作用。亦即,从软件设计规格说明到可执行的程序代码这一过程的自动化。
  2. 中级自动化:自动化系统除了起程序人员的作用外,还起设计人员的作用、系统分析人员的作用。亦即,从形式的软件功能规格说明到设计规格说明,一直到可执行的程序代码这一过程的自动化。
  3. 高级自动化:自动化系统除了起程序人员的作用、软件设计人员、系统分析人员的作用外,还起领城专家的作用。亦即,从非形式的软件描述,经形式的软件功能规格说明、软件设计。

狭义理解

软件自动化:从形式的软件功能规格说明到可执行的程序代码这一过程的自动化。

软件 - 是现实世界的解决方案在计算机系统中的映射。

当前的大模型能帮我们实现软件自动化吗?

当前的大语言模型难以实现理想中的软件自动化!

关于 大语言模型(LLM) 与 AI for Software Engineering(AI4SE) 发展现状的几个关键观点

大模型发展进入相对稳定的平台期

  • 后继模型会追平原领先模型
  • 软件开发工具基本AI能力趋于对齐

大模型与软件工程的融合将逐渐进入深水区

  • 如何进行充分的领域化:
  • 如何与业务流程深度融合

关于Agent

当前,在软件开发中,应用基于Agent的方法,在很大程度上,是为了**“用人类知识/经验”补齐LLM在如下两个方面的欠缺**:

  • 通用LLM的领域知识缺失:
  • LLM的底层能力缺陷:
  • Agent相关技术可能长期存在;

软件开发模式发生显著变化:

以开发最终软件制品为主 ——> 以开发自动生产最终制品的自动化工具为主

最近更新: 2026/1/24 10:44
Contributors: klc407073648
Prev
构建人工智能安全的微基准测试
Next
基于大模型的代码生成和摘要技术