Structured Agent Distillation for Large Language Model
Agent 的 Reasoning & Action 蒸馏
Agent 的 Reasoning & Action 蒸馏
不同采样策略在不同曝光偏差下的区分性, 鲁棒性, 一致性
混合距离用于量化匹配 & 端到端的联合训练
分析比较了现有生成式推荐的 Tricks 并给出了一个训练框架
利用多任务/多目标优化学习到更佳的 Attention 分布, 促进跨域推荐
将 Product Quantization 用于搜索以降低存储占用
通过 Q-Former 将 semantic IDs 转换为 textual IDs
非结构化的一维离散 Visual Tokens 生成策略
Visual Tokens & Masked Image Modeling
自回归图像生成: Multi-scale Quantization & Next-scale Prediction