Pareto Multi-Task Learning
通过限定子区域实现 Pareto MTL
通过限定子区域实现 Pareto MTL
从梯度融合角度理解多任务/多目标优化
将 Product Quantization 用于搜索以降低存储占用
通过 Q-Former 将 semantic IDs 转换为 textual IDs
非结构化的一维离散 Visual Tokens 生成策略
Visual Tokens & Masked Image Modeling
自回归图像生成: Multi-scale Quantization & Next-scale Prediction
兼顾 Low-level 的 Pixel 信息和 High-level 的 Semantic 信息
非常自然的 Image-Codeword+Text-LLM-NextCodeWord-Generation 流程
符号序列的自动切分, 探究非 Subword Tokenizer 的可能性