基于层次化结构表示的数据到文本生成方法被引量：1

Data-to-text generation methods based on hierarchical structural representation

在线阅读下载PDF

导出

摘要最近的数据到文本生成方法广泛采用了编码器—解码器架构或其变体,但是这些方法无法识别数据中不同部分的信息的重要性,导致在选择适当的内容和排序方面表现不佳。针对这些问题,提出了一个基于层次化结构表示的数据到文本生成方法,它包括规划阶段和生成阶段,规划阶段通过实体级、记录级的多层次注意力来增强语义空间的表达能力,输出的计划代表重要内容的高层次表示,同时将计划输入给生成阶段的生成器得到最终的文本。通过在两个数据到文本生成的数据集上进行的广泛实验表明,该方法相比于已有的数据到文本生成方法,生成的文本对数据的描述更加准确,质量更高,该方法的提出为数据到文本生成的研究提供了一定的指导性作用。 Recent data-to-text generation methods have widely adopted encoder-decoder architectures or their variants,but these methods fail to identify the different importance of information in different parts of the data,resulting in poor performance in selecting appropriate content and ranking.To address these problems,this paper proposed a data-to-text generation method based on hierarchical structural representation,which consisted of a planning phase and a generation phase.The planning phase enhanced the representation of the semantic space through multi-level attention of entity-level and record-level,and the output plan represented a high-level representation of the important content,while the plan was input to the generator in the generation phase to obtain the final text.Extensive experiments on two datasets generated by data-to-text show that the method generates texts have more accurate descriptions of data and higher quality compared to existing data-to-text generation methods.The proposed method provides some guidance for the research of data-to-text generation.

作者龚永罡郭怡星廉小亲马虢春王希刘宏宇 Gong Yonggang;Guo Yixing;Lian Xiaoqin;Ma Guochun;Wang Xi;Liu Hongyu(School of Artificial Intelligence,Beijing Technology&Business University,Beijing 100048,China)

机构地区北京工商大学人工智能学院

出处《计算机应用研究》 CSCD 北大核心 2023年第8期2399-2403,共5页 Application Research of Computers

基金 “十三五”时期北京市属高校高水平教师队伍建设支持计划资助项目(CIT&TCD201904037)。

关键词数据到文本生成多层次注意力层次化结构表示编码器—解码器架构 data-to-text generation multi-level attention hierarchical structure representation encoder-decoder architecture

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1曹娟,龚隽鹏,张鹏洲.数据到文本生成研究综述[J].计算机技术与发展,2019,29(1):80-84. 被引量：12

二级参考文献3

1李苏.机器新闻发展的市场进路及反思——以Autamated Insights公司为例[J].新闻界,2015(18):56-61. 被引量：14
2周佳玥.从NLG到机器新闻写作——机器新闻的发展与反思[J].今传媒,2017,25(10):18-19. 被引量：6
3金兼斌.机器新闻写作:一场正在发生的革命[J].新闻与写作,2014(9):30-35. 被引量：57

共引文献11

1郭腾州,孙宝山.深度学习在文本生成中的应用研究[J].仪器仪表用户,2020,27(2):110-112. 被引量：1
2许晓泓,何霆,王华珍,陈坚.结合Transformer模型与深度神经网络的数据到文本生成方法[J].重庆大学学报（自然科学版）,2020,43(7):91-100. 被引量：13
3孙鹤立,孙玉柱,张晓云.基于生成对抗网络的事件描述生成[J].计算机应用,2021,41(5):1256-1261. 被引量：1
4杨子聪,焦文彬,刘晓东,汪洋.结构化数据到数值型分析文本生成模型[J].计算机系统应用,2022,31(5):246-253. 被引量：1
5李公全,李智国,李卫星,高栋.自然语言生成技术及其在军事领域应用[J].中国电子科学研究院学报,2022,17(10):935-942. 被引量：3
6熊余,王盈,蔡婷,周松,蔡林沁.学生学业述评智能生成模型的构建与实证研究[J].现代远距离教育,2023(1):32-39. 被引量：10
7金皓月,李艳.国内人工智能写作的研究现状分析及启示[J].现代远距离教育,2023(2):19-29. 被引量：13
8夏文雪.人工智能技术在科技期刊发展中的应用研究[J].中国传媒科技,2024(5):141-145. 被引量：1
9丰德恩,张雪英,唐卫,王益鹏,王慕华,渠寒花,李敏.基于知识图谱的冬奥赛事气象服务文本生成方法研究[J].科学技术与工程,2024,24(16):6600-6609.
10肖烨晗.基于自然语言生成技术的人工智能应用[J].科技传播,2019,0(7):155-156. 被引量：3

同被引文献20

1吴焕萍,吕终亮,张华平,罗兵,高健,李笑侃,何国豪,王永超.气象落区文本自动生成研究[J].计算机工程与应用,2014,50(13):247-251. 被引量：8
2李嘉洁,孙涵,华璀,邓树林,王行行,朝鲁门,吴国舟,黄永璘,李莉.基于气象GIS的农业气象情报文本自动化生成技术研究[J].气象与环境科学,2016,39(2):137-143. 被引量：6
3高锋,谢勇,朴美花,李田.气象条件与滑雪运动的关系研究[J].气象灾害防御,2017,24(1):21-25. 被引量：8
4曹娟,龚隽鹏,张鹏洲.数据到文本生成研究综述[J].计算机技术与发展,2019,29(1):80-84. 被引量：12
5符悦,白宇,蔡东风.基于Seq2Seq框架和领域知识图谱的新闻简报生成[J].沈阳航空航天大学学报,2019,36(1):79-89. 被引量：1
6符山,吕艾临,闫树.知识图谱的概念与应用[J].信息通信技术与政策,2019,0(5):10-13. 被引量：11
7于敏,曹学海,邱国鹏.基于空间分析的气象预报文本实时生成研究[J].赤峰学院学报（自然科学版）,2019,35(10):127-130. 被引量：2
8罗军华,林孝松,牟凤云,张莉,徐州.基于CiteSpace的中国公路洪灾研究知识图谱分析[J].科学技术与工程,2020,20(16):6362-6368. 被引量：6
9马忠贵,倪润宇,余开航.知识图谱的最新进展、关键技术和挑战[J].工程科学学报,2020,42(10):1254-1266. 被引量：70
10杭婷婷,冯钧,陆佳民.知识图谱构建技术:分类、调查和未来方向[J].计算机科学,2021,48(2):175-189. 被引量：64

引证文献1

1丰德恩,张雪英,唐卫,王益鹏,王慕华,渠寒花,李敏.基于知识图谱的冬奥赛事气象服务文本生成方法研究[J].科学技术与工程,2024,24(16):6600-6609.

1李玉萍.VR技术在景观设计中的应用研究[J].美与时代（城市）,2023(6):83-85.
2梁燕,易春霞,王光宇.基于编解码网络UNet3+的遥感影像建筑变化检测[J].计算机学报,2023,46(8):1720-1733. 被引量：10
3李强.浅析运营期水电站鱼道工程技术改造施工及运行——以大渡河流域某水电站鱼道为例[J].中国科技期刊数据库工业A,2023(6):28-31.
4王伟,邓小卫,李磊,喻腾.基于γ测井五点反褶积法刻画砂岩型铀矿矿化体形态研究[J].地质论评,2023,69(S01):567-568.
5谢思建.基于名城保护视角的老城控规编制思考--以建瓯老城区控规为例[J].住宅产业,2023(6):59-62. 被引量：1
6熊刚.基于实物期权BS模型的低碳厂房工程投资决策管理分析[J].投资与创业,2023,34(11):13-15.
7孙红梅,牟明明,高磊.故障树分析法的定性和定量分析研究[J].电子产品可靠性与环境试验,2023,41(3):22-26. 被引量：11
8严竞雄.Linux环境下基于gSOAP的WebService应用设计与实现[J].电脑编程技巧与维护,2023(7):56-58. 被引量：1

计算机应用研究

2023年第8期

浏览历史

内容加载中请稍等...

基于层次化结构表示的数据到文本生成方法被引量：1

参考文献1

二级参考文献3

共引文献11

同被引文献20

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于层次化结构表示的数据到文本生成方法 被引量：1

参考文献1

二级参考文献3

共引文献11

同被引文献20

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于层次化结构表示的数据到文本生成方法被引量：1