UniCode$^2$: Cascaded Large-scale Codebooks for Unified Multimodal Understanding and Generation
非常自然的 Image-Codeword+Text-LLM-NextCodeWord-Generation 流程
非常自然的 Image-Codeword+Text-LLM-NextCodeWord-Generation 流程
TiTok 框架 + Softmax 版 Vector Quantization 以期更高的压缩比
COBRA, 链接离散编码和稠密表示的尝试
LC-Rec, LLM + RQ-VAE + 丰富的多任务训练
OneRec, 端到端的推荐模型
SimVQ, 坐标变换替代可学习 Codebook
一种利用 Rotation Trick 来替代 STE 的方案
QARM, 多模态推荐对齐与量化
LIGER, 生成式检索的冷启动缺陷与解决方案