基础优化方法

基础优化方法是机器学习和深度学习中用于最小化（或最大化）目标函数（通常称为损失函数或代价函数）的核心技术。

其中最经典、最基础的方法是梯度下降法（Gradient Descent），以及其若干变种。以下将对这些基础优化方法进行系统性展开描述：

梯度下降法（Gradient Descent, GD）

梯度下降是一种一阶优化算法，利用目标函数关于参数的**梯度（一阶导数）**来迭代更新参数，朝着使目标函数值减小的方向移动。

\theta_{t+1} = \theta_t - \eta \nabla J(\theta_t)

其中：

根据每次更新所用数据量的不同，梯度下降可分为三类：

实际应用中最常用的是 Mini-batch GD，也是深度学习框架（如 PyTorch、TensorFlow）默认采用的方式。