SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer

预备知识

核心思想

20250716141244

个人感觉 SoftVQ 这个思想并没有什么高明的地方, 实际上就可以看成是 Gumbel-softmax 替代了 STE, 不过 Latent Tokens 的设计倒是让人眼前一亮.

参考文献

  1. Chen H., Wang Z., Li X., Sun X., Chen F., Liu J., Wang J. Raj B., Liu Z. and Barsoum E. SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer. CVPR, 2025. [PDF] [Code]