Principled Synthetic Data Enables the First Scaling Laws for LLMs in Recommendation

研究背景

核心思想

Semantic ID Tokens

Item-Text Alignment Data

Collaborative Filtering (CF) Data

Synthetic User Interaction Histories (UIH)

关键洞察

实验设置

明显的 Scaling Laws

20260521180354

不同场景下模型和数据的影响力

20260521180808

不同合成数据的非对称影响

20260521182042

Domain-specific 数据不可或缺

20260521182622

继往开来

相当有意思, 扎实的工作.

参考文献

  1. Zhang B., Zhang Q., Cheng J., Chen H., Wang Q., Sun W., Li S., Li J., Wu J., Fan X. and Yan H. Principled Synthetic Data Enables the First Scaling Laws for LLMs in Recommendation. ICML, 2026. [PDF] [Code]