Progressive Semantic Residual Quantization for Multimodal-Joint Interest Modeling in Music Recommendation
对残差量化的修改
对残差量化的修改
经过正交变换后的向量量化
混合距离用于量化匹配 & 端到端的联合训练
分析比较了现有生成式推荐的 Tricks 并给出了一个训练框架
将 Product Quantization 用于搜索以降低存储占用
通过 Q-Former 将 semantic IDs 转换为 textual IDs
非结构化的一维离散 Visual Tokens 生成策略
Visual Tokens & Masked Image Modeling
自回归图像生成: Multi-scale Quantization & Next-scale Prediction
兼顾 Low-level 的 Pixel 信息和 High-level 的 Semantic 信息