Product Quantization for Nearest Neighbor Search
将 Product Quantization 用于搜索以降低存储占用
将 Product Quantization 用于搜索以降低存储占用
通过 Q-Former 将 semantic IDs 转换为 textual IDs
非结构化的一维离散 Visual Tokens 生成策略
Visual Tokens & Masked Image Modeling
自回归图像生成: Multi-scale Quantization & Next-scale Prediction
兼顾 Low-level 的 Pixel 信息和 High-level 的 Semantic 信息
非常自然的 Image-Codeword+Text-LLM-NextCodeWord-Generation 流程
符号序列的自动切分, 探究非 Subword Tokenizer 的可能性
TiTok 框架 + Softmax 版 Vector Quantization 以期更高的压缩比
多尺度 Transformer, 探究非 Subword Tokenizer 的可能性