Addressing Representation Collapse in Vector Quantized Models with One Linear Layer
SimVQ, 坐标变换替代可学习 Codebook
SimVQ, 坐标变换替代可学习 Codebook
一种利用 Rotation Trick 来替代 STE 的方案
是否每个 Item 都值得一个可学习的 Embedding 呢
来自 OpenAI 的 process supervision
来自 DeepSeek 的 process supervision
在 Lion 优化器之上的一些探索
图上特征 prompt 等价各异 graph prompt
统一 graph/edge/node-level 的 graph prompt
Laplace 变换的基本概念
讨论 RoPE base 对于相似 Tokens 感知能力的影响