Simba: 符号梯度的可行性
在 Lion 优化器之上的一些探索
在 Lion 优化器之上的一些探索
个人的环境配置
图上特征 prompt 等价各异 graph prompt
统一 graph/edge/node-level 的 graph prompt
Laplace 变换的基本概念
讨论 RoPE base 对于相似 Tokens 感知能力的影响
理解 RoPE 的高低频
LLM Representational Collapse
TTA, Test-Time Augmentation
Adam 预训练的 1-bit SGD 优化方法