论文笔记 StructCoder: Structure-Aware Transformer for Code Generation

admin•2025-09-17 07:22:46•网站建设•阅读21

目录简单介绍摘要相关模型结构的比较本文的贡献 StructCoder模型与设计符号表示 Code AST DFG 编码器Encoder 输入编码Input emdedding 具有结构感知力的自注意力机制

简单介绍

摘要

简单介绍

这篇文章介绍提出了一个具有代码结构感知能力的Transformer模型用来处理代码翻译（基于某种程序语言生成另一种程序语言）和代码生成任务（基于自然语言描述生成程序语言）。

原文链接

摘要

Transformer在处理自然语言任务上取得了不错的效果，由于代码语言（PL）和自然语言（NL）

之间存在一定的共同性，因此近年来有很多的组织开始使用Transformer来处理PL任务。

但是相比于自然语言，程序语言具有更强的语义和句法逻辑，基于此，开发者改进Transformer提出StructCoder模型，使模型的编码器可以很好的学到source code的语法和数据流向（data flow），模型的解码器可以很好的学到target code的语法和数据流。此模型在CodeXGLUE 集上是目前的SOTA模型。

目前已有的两种代码句法表征方法是将以下两种结构编码进模型：

AST(Abstract Syntax Tree ,抽象语法树）:生成AST的中序遍历，AST的生成规则，使用RNN 编码AST的路径，在序列模型中使用基于AST的attention机制；
- DFG（Data Flow Graph 数据流向图）：含有的信息比AST更多，却没有AST复杂。

int add1 ( int a ) { s= a + 1 ; return s ; }

基于以上代码生成的AST与DFG分别如下图所示：

本文的贡献

改进Transformer模型使编码器解码器都具有结构感知能力，提出StructCoder：
1. 编码器使用结构感知自注意力机制（structure-aware self-attention）；
2. 解码器加入两项附加任务：APP（AST路径预测），DFP（数据流向预测）；
预训练，使输入的代码、AST和DFG中部分失去意义，以此训练生成原始代码并且进行APP和DFP两项训练任务；

3. StructCoder是目前基于CodeXGLUE 数据集的SOTA模型。

StructCoder模型与设计

符号表示

Code

Source Code tokens ；

Target Code tokens 。

AST

N代表AST中所有节点的集合;

代表所有AST中的叶子节点;

r代表AST的根结点;

p(n)表示的节点n的父节点;

，当且仅当token 是叶节点一部分时 ;

n.type代表是一个节点的类型。

DFG

代表了Code S中的所有变量;

是两个变量之间的邻接矩阵，当且仅当来源于时;

，当且仅当变量是token 的一部分时，。

编码器Encoder

输入编码Input emdedding

输入序列由源代码tokens，对应的AST叶节点，对应的DFG变量构成：

token:通过单词表来编码；

DFG变量：use a default emdedding（原文是这么写的，还不是很理解）；

AST叶节点：需要按照以下公式编码叶节点的路径信息：

其中为根结点到该叶节点的路径上的节点；

为节点类型的编码函数；

为节点顺序编码函数。

具有结构感知力的自注意力机制structure-aware self-attention

代码之间Code-code：和传统注意力计算方式一致

其中代表的lookup emdedding函数，用来存储两个token之间的相对位置信息。

叶节点之间Leaf-leaf：除了计算两个叶节点之间的自注意力之外还需要计算两节点之间的相似度

变量之间Variable-variable：两个变量之间有联系才会计算注意力

代码与叶节点或者变量之间Code-leaf/variable:两者相互之间有联系才会计算注意力

特殊符号<CLS>和<SEP>被视作代码并且和其他所有的变量与叶节点有联系。

上图就代表了输入编码和注意力机制的可视化表示。

解码器Decoder

在解码器的输出需要完成三个任务：基于以输出序列的下一个token的预测，根叶节点路径预测和DFG变量之间联系预测。

语言模型Token预测

和传统的语言模型一样。

概率：

为解码器第i个时刻隐藏层的输出向量；

为第i个时刻各个token的预测概率。

损失:

为第i个时刻输出的在正确token上面的预测概率。

AST路径预测APP

时刻i，根叶路径中第k个节点的概率分布：

损失：

DFG关系预测DFP

第i个时刻的token来自于第j个时刻的token的概率：

cond判断在ground truth中两个token有联系（一个来源于另一个）：

存在两个有联系的变量即,使得与token 有联系即，并且和token 有联系即。

损失：

decoder总损失

预训练

增加噪声：掩盖或者去除原始输入的35%的token，AST叶节点与DFG变量，和35%的叶节点路径；

模型参数初始化：使用CodeT5模型中的参数来初始化本次预训练的参数，与AST，DFG有关的参数随机初始化；

数据集：CodeSearchNet

实验结果

PL-PL

NL-PL

从上述数据可以看出CodeT5是一个有力的竞争对手，而StructCoder是在CodeXGLUE上实现代码翻译和代码生成的SOTA模型。

案例对比

说明StructCoder可以很好学习到代码中的语义与数据流向。

消融实验

去除StructCoder中的某一个组件，观察StructCoder中的表现，发现去除任意一个组件都会降低StructCoder的评价表现，尤其是去除AST输入之后。

模型的限制与更深思考

由于在输入序列中加入了AST与DFG信息，处理起来复杂度增加尤其是在算注意力时复杂度二次增长
存在少数bad case，需要二次加工
代码的生成有多种正确答案，而在训练时数据集只有一个ground truth，因此需要制定合适的评价标准
生成的代码缺少安全性，有效性，模块化方面的思考
只有大企业才适合训练此巨大规模的模型

以上就是我认为论文中值得学习的内容，更多的训练细节与超参设置推荐去阅读原文！

发布者：admin，转转请注明出处：http://www.yc00.com/web/1755047285a5232894.html

笔记论文 StructCoder Structure GENERATION

admin

网站建设
论文笔记 StructCoder: Structure-Aware Transformer for Code Generation
目录简单介绍摘要相关模型结构的比较本文的贡献 StructCoder模型与设计符号表示 Code AST DFG 编码器Encoder 输入编码Input emdedding 具有结构感知力的自注意力机制
admin
1月前
220
网站建设
Video Super-Resolution with Recurrent Structure-Detail Network阅读笔记
Video Super-Resolution with Recurrent Structure-Detail Network（视频超分与循环的结构-细节网络）文章检索出处：
admin
1月前
160
网站建设
Graph Structure Learning（图结构学习应用续篇）
博主在以往的文章中更新过图结构学习的相关概念，和北邮团队的几篇关于图结构学习的文章（主要KDD20，AAAI21，WWW21，AAAI21）。 Graph Structure Learning（图结构学习综述） Graph Structur
admin
1月前
160
网站建设
IDEA structure窗口各标志及功能
文章目录图标对象类型访问权限其他修饰符工具栏图标对象类型 class 类interface 接口enum 枚举interface 注解class initializer 代码块method 方法field 字段
admin
1月前
200
网站建设
结构张量structure tensor（matlab）
目录一、结构张量是什么二、如何用matlab实现 1、打开matlab软件，点击新建，出现编辑器界面 2、将以下代码复制到编辑器中（注意命名规则&#xff0
admin
1月前
210
网站建设
SAP 报错Inconsistency in the dictionary for structure “USADDR3“.
SAP 程序Down掉以后处理执行SE38—程序—RSDDCHECK输入报错的字段，然后点击执行执行完以后就可以。
admin
1月前
220
网站建设
Structure-from-Motion Revisited
转载请注明出处：https:blog.csdnq_z_r_sarticledetails97813700机器感知一个专注于SLAM、三维重建、机器视觉等相关技术文章分享的公众号Abstract对无序图片集
admin
1月前
170
网站建设
Project Structure详解
Project Structure“ 项目结构”对话框允许您管理项目和IDE级别的元素，例如Modules，Facets，Libraries， Arti
admin
1月前
210
网站建设
idea的structure窗口的使用，快速了解一个类【idea操作】
idea的structure窗口的使用，快速了解一个类【idea基础使用】1.打开方式快捷键：Alt72.功能按钮说明通过structure窗口我们可以快速直观的了解一个类的属性&
admin
1月前
190
网站建设
Systemverilog 第七课 Structure
第七课 Structure structure是一组变量或者常数的集合，能够更方便地同时访问其中的元素。语法： struct{int a,b;logic[7:0] opcode;logic[23:0] address;bit err
admin
1月前
200
网站建设
论文笔记：Highly accurate protein structure prediction with AlphaFold (AlphaFold 2 & appendix)
注：这篇Nature的论文，如果光看正文，没法理解，需要结合它的补充材料一起看同时这篇文章看得太吃力了QAQ，如果有说的不对的地方
admin
1月前
150
网站建设
【IDEA】Structure功能中各标志的含义
idea 左边的Structure，各个标志的意思栏目从左到右各个含义1、按访问修饰符排序，从按public、protected、default、private从上往下排2、按字母a-z排序3
admin
1月前
260
网站建设
论文笔记 ACL 2021|TEXT2EVENT: Controllable Sequence-to-Structure Generation for End-to-end Event Extract
文章目录1 简介1.1 动机1.2 创新2 方法2.1 事件抽取转换为结构生成2.2 Sequence-to-Structure结构：2.3 模型学习3 实验1 简介论文题目：TEXT2EVE
admin
1月前
200
网站建设
Ubuntu出现Structure needs cleaning处理方法
在编译嵌入式Linux buildroot的过程中，电脑突然掉电，重启电脑后，在编译kernel时出现了“Structure needs cleaning”相关提示，于是想clean后再编译，发现clean时也会有相关提示： guocho
admin
1月前
200
网站建设
jboss7 set java_jboss-deployment-structure.xml配置
我正在尝试将应用程序从JBoss AS 6迁移到JBoss AS 7.我尝试迁移的应用程序依赖于其他项目 . 由于JBoss AS 7中新的类加载器，我必须在jboss-deployment-structure.xml
admin
1月前
230
网站建设
Every Document Owns Its Structure: Inductive Text Classification via GNN (TextING)
文章目录摘要引言文本分类方法TextING构建思路和创新点方法构图基于图的词交互读出函数模型变种实验数据集对比模型实验设置结果参考文献摘要文本分类是自然语言的基础，GNN进来被广泛用于该任务。然而&#xff0
admin
1月前
210
网站建设
GNN 2021(八) Heterogeneous Graph Structure Learning for Graph Neural Networks，AAAI
北邮石川老师团队的论文，又是有关异构图的。本文指出，异构图在现实中不可避免地是有噪声的或不完整的，因此，对于hgnn来说，学习异构图结构而不是仅仅依赖原始图结构是至关重要的。本文首次尝试学习最优的异构图结构用于hgnn，提出了一个新的框架
admin
1月前
190
网站建设
End-to-end Structure-Aware Convolutional Networks for Knowledge Base Completion
文章目录研究问题背景动机模型思想模型框架实验部分评价
admin
1月前
220
网站建设
idea配置Project Structure及Tomcat并支持热部署
Project Settings项目设置Project项目Modules模块Libraries项目类库Facets资源路径（源码路径、root路径，图片
admin
1月前
170
网站建设
Finding Structure in Time论文解读
《Finding Structure in Time》-1990作者Jeffrey L.Elman已经于2018年的六月份去世了。该文的引用量非常之高，目前有9000多，所以也导致有些神经网
admin
1月前
240

发表回复

评论列表（0条）

暂无评论

论文笔记 StructCoder: Structure-Aware Transformer for Code Generation

简单介绍

摘要