论文
随笔
Tags
Slides
⤴

KV Cache

July 2, 2025

EARN: Efficient Inference Acceleration for LLM-based Generative Recommendation by Register Tokens

通过减小 KV cache size 加速 LLMRec 的推理

Note
Sequential Recommendation
LLM
KV Cache
Empirical
KDD
2025

MTandHJ © 2026