Structured Agent Distillation for Large Language Model
Agent 的 Reasoning & Action 蒸馏
Agent 的 Reasoning & Action 蒸馏
不同采样策略在不同曝光偏差下的区分性, 鲁棒性, 一致性
混合距离用于量化匹配 & 端到端的联合训练
序列推荐任务的马尔科夫性
分析比较了现有生成式推荐的 Tricks 并给出了一个训练框架
利用多任务/多目标优化学习到更佳的 Attention 分布, 促进跨域推荐
通过 Q-Former 将 semantic IDs 转换为 textual IDs
兼顾 Low-level 的 Pixel 信息和 High-level 的 Semantic 信息
非常自然的 Image-Codeword+Text-LLM-NextCodeWord-Generation 流程
符号序列的自动切分, 探究非 Subword Tokenizer 的可能性