Fine-Tuning Language Models with Just Forward Passes
零阶优化 & 收敛理论
零阶优化 & 收敛理论
基于认知科学实现推荐用户模拟, 并以此探究信息茧房、从众心理等现象
在知识图谱上实现 LLM, KG 的交替推理
利用 LLM 高效生成个性化广告语
Agent Distillation
Agent 的 Reasoning & Action 蒸馏
通过减小 KV cache size 加速 LLMRec 的推理
LC-Rec, LLM + RQ-VAE + 丰富的多任务训练
讨论 RoPE base 对于相似 Tokens 感知能力的影响
理解 RoPE 的高低频