Optimizer

June 19, 2025

SEvo

June 8, 2025

Simba: 符号梯度的可行性

在 Lion 优化器之上的一些探索

May 7, 2025

1-bit Adam: Communication Efficient Large-Scale Training with Adam's Convergence Speed

Adam 预训练的 1-bit SGD 优化方法

May 7, 2025

GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection

GaLore, 低秩空间中的梯度投影以及权重更新

May 7, 2025

MICROADAM: Accurate Adaptive Optimization with Low Space Overhead and Provable Convergence

MicroAdam, 通过梯度稀疏化以及 error compensation 实现轻量的优化器

May 7, 2025

Q-GaLore: Quantized GaLore with INT4 Projection and Layer-Adaptive Low-Rank Gradients

Q-GaLore, 对 GaLore 进一步施加低精度量化

March 19, 2025

SOLO

January 1, 0001

Lightweight Optimizers