TokenFlow: Unified Image Tokenizer for Multimodal Understanding and Generation
兼顾 Low-level 的 Pixel 信息和 High-level 的 Semantic 信息
兼顾 Low-level 的 Pixel 信息和 High-level 的 Semantic 信息
非常自然的 Image-Codeword+Text-LLM-NextCodeWord-Generation 流程
符号序列的自动切分, 探究非 Subword Tokenizer 的可能性
TiTok 框架 + Softmax 版 Vector Quantization 以期更高的压缩比
通过减小 KV cache size 加速 LLMRec 的推理
COBRA, 链接离散编码和稠密表示的尝试
OneRec, 端到端的推荐模型
一种利用 Rotation Trick 来替代 STE 的方案
是否每个 Item 都值得一个可学习的 Embedding 呢
在 Lion 优化器之上的一些探索