Base of RoPE Bounds Context Length

预备知识

核心思想

RoPE

20250513174554

注: 通过上面的证明可以发现: 1. 这个等式比较依赖 $q, k$ 有相近的均值期望 (或者二者的期望差恰好和 $q$ 的期望构成一个接近垂直的情况). 2. $\epsilon$ 的设置压根没有意义, 因为假设 $\epsilon$ 期望为 0 跟直接假设 $\epsilon \equiv 0$ 在结果上没有任何区别, 不如后者来着更清晰.

20250513205428

参考文献

  1. Men X., Xu M., Wang B., Zhang Q., Lin H., Han X., and Chen W. Base of RoPE Bounds Context Length. NeurIPS, 2024. [PDF] [Code]