AI Software Engineering
- AI Software Engineering 是深度学习 (LLM 为主) 的一个重要的应用场景. 区别于一般的 Function-level 的代码生成, AI Software Engineering 旨在实现 LLM 在 Repository-level 甚至更为复杂问题上的工程实践. 其核心难点在于: 长上下文理解, 逻辑保持与代码风格统一等.
2025
如何根据 issue 准确定位相关代码: Code Graph -> Causal Issue Graph
强调多文件修改的 Benchmark
自动化 Repository-level 实例采集框架
自动化 Repository-level 实例采集框架
Code Graph & Graph Attention Mask
自动化 Repository-level 实例任务生成
2024
提供更丰富的 Repository-level 任务并验证训练 verifier models 的潜力
通过 Repository-level 的 Code Graph 实现更为高效的工程代码生成
如何让模型理解语法结构: Graph -> Code 的重建任务 & GraphQA
开源之光: 在 DeepSeek-V2 中间节点接续训练
定制化 Agent-Compute-Interface
构建 The Stack v2 并提出更广泛的数据选择和训练
从零开始训练 Code 基模: NTP & FIM
2023
2021
Encoder-Decoder 的 Code 基模: Masked Span Prediction (MSP)