Gradient Accumulation - AI & ML Glossary | Farez Vadsaria

Training & Optimization

Gradient Accumulation

Summing gradients over multiple batches before updating, simulating larger effective batch sizes.

This concept is essential for understanding training & optimization and forms a key part of modern AI systems.

Training
Batch Size
Memory Efficiency

Tags

training-optimization training batch-size memory-efficiency

Related Terms

Batch Size

The number of training examples processed together in one forward/backward pass.

Training

The process of teaching a machine learning model by adjusting its parameters based on data to minimize prediction errors.

← Back to All Terms