MEGABYTE: Predicting Million-byte Sequences with Multiscale Transformers
多尺度 Transformer, 探究非 Subword Tokenizer 的可能性
多尺度 Transformer, 探究非 Subword Tokenizer 的可能性
图上特征 prompt 等价各异 graph prompt
统一 graph/edge/node-level 的 graph prompt
TIGER, 向量量化生成式检索
找工作
FSQ, 标量量化