2024

March 5, 2026

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

GRPO: Group Relative Policy Optimization

February 26, 2026

SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering

定制化 Agent-Computer Interface

February 26, 2026

SWE-Bench: Can Language Models Resolve Real-World GitHub Issues?

SWE-Bench

December 6, 2025

Think-on-Graph: Deep and Responsible Reasoning of Large Language Model on Knowledge Graph

在知识图谱上实现 LLM, KG 的交替推理

November 21, 2025

Learnable Item Tokenization for Generative Recommendation

兼顾语义和协同信息的 Tokenizer

July 23, 2025

An Image is Worth 32 Tokens for Reconstruction and Generation

非结构化的一维离散 Visual Tokens 生成策略

July 21, 2025

Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

自回归图像生成: Multi-scale Quantization & Next-scale Prediction

July 15, 2025

SpaceByte: Towards Deleting Tokenization from Large Language Modeling

探究非 Subword Tokenizer 的可能性

June 28, 2025

Adapting Large Language Models by Integrating Collaborative Semantics for Recommendation

LC-Rec, LLM + RQ-VAE + 丰富的多任务训练

June 15, 2025

Addressing Representation Collapse in Vector Quantized Models with One Linear Layer

SimVQ, 坐标变换替代可学习 Codebook