引入自编码机制对抗网络的文本生成模型

计算机工程与科学 ›› 2020, Vol. 42 ›› Issue (09): 1704-1710.

• 人工智能与数据挖掘 • 上一篇

引入自编码机制对抗网络的文本生成模型

韩虎1,2，孙天岳1，赵启涛1

（1.兰州交通大学电子与信息工程学院,甘肃兰州 730070;

2.甘肃省人工智能与图形图像工程研究中心,甘肃兰州 730070）

收稿日期:2019-11-11 修回日期:2020-02-22 接受日期:2020-09-25 出版日期:2020-09-25 发布日期:2020-09-25
基金资助:
国家社会科学基金(17BXW071)；国家自然科学基金(61562057)；甘肃省科技计划(18JR3RA104）

Generative adversarial networks with autoencoder for text generation

HAN Hu1,2,SUN Tian-yue1,ZHAO Qi-tao1

（1.School of Electronic & Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070;

2.Gansu Provincial Engineering Research Center for

Artificial Intelligence and Graphic & Image Processing,Lanzhou 730070,China）

Received:2019-11-11 Revised:2020-02-22 Accepted:2020-09-25 Online:2020-09-25 Published:2020-09-25

摘要/Abstract

摘要： 自编码模型是一种无监督的学习算法，主要用于数据的降维和特征提取。在对抗神经网络模型基础上引入自编码模型，旨在提高输入数据的特征表示。主要使用前馈神经网络和Seq2seq模型学习原文本特征，将随机数据变为具有特征的数据作为输入，加快训练的速度，提高模型的准确率。同时使用强化学习模型解决反向传播中离散化数据梯度难以下降的问题。模型的鉴别器使用CNN网络和交叉熵模型，使生成的文本具有新颖性。使用BELU评价指标和主观评价的实验结果均表明了该模型的有效性。

关键词: 生成对抗神经网络, 自编码模块, 强化学习, 交叉熵

Abstract: Autoencoder is an unsupervised learning algorithm, mainly used for data dimensionality reduction and feature extraction. Based on adversarial neural network model, autoencoder is introduced to improve the feature representation of input data. Feedforward neural network and Seq2seq model are mainly used to learn the source text features, and the random data are transformed into characteristic data as input, which greatly accelerates the speed and accuracy of training. At the same time, reinforcement learning model is used to solve the problem that the gradient of discretized data is difficult to descend. The discriminator of the model uses CNN network and cross entropy model to make the generated text innovative and novel. In the experimental part, the results of automatic evaluation and subjective evaluation show that the model is effective.

Key words: generative adversarial neural network, autoencoder, reinforcement learning, cross entropy

韩虎, 孙天岳, 赵启涛. 引入自编码机制对抗网络的文本生成模型[J]. 计算机工程与科学, 2020, 42(09): 1704-1710.

HAN Hu, SUN Tian-yue, ZHAO Qi-tao. Generative adversarial networks with autoencoder for text generation[J]. Computer Engineering & Science, 2020, 42(09): 1704-1710.

[1]	庄述鑫, 陈永红, 郝一行, 吴巍炜, 徐学永, 王万元. 对抗环境中基于种群多样性的鲁棒策略生成方法[J]. 计算机工程与科学, 2024, 46(06): 1081-1091.
[2]	曾凡锋, 王春真, 李琛. 基于深浅层特征融合的无监督视频摘要算法研究[J]. 计算机工程与科学, 2023, 45(09): 1602-1610.
[3]	王扬, 陈智斌. 一种求解CVRP的动态图转换模型[J]. 计算机工程与科学, 2023, 45(05): 859-868.
[4]	彭坤彦, 尹翔, 刘笑竹, 李恒宇. 基于粒子群优化和深度强化学习的策略搜索方法[J]. 计算机工程与科学, 2023, 45(04): 718-725.
[5]	李叔敖, 解庆, 马艳春, 刘永坚. 基于路径聚合扩张卷积的图像语义分割方法[J]. 计算机工程与科学, 2021, 43(04): 712-720.
[6]	童钊, 叶锋, 刘碧篮, 邓小妹, 梅晶, 刘宏. 移动边缘计算中多约束下的任务卸载和资源分配算法[J]. 计算机工程与科学, 2020, 42(10高性能专刊): 1869-1879.
[7]	蔡钺, 游进国, 丁家满. 基于近端策略优化与对抗学习的对话生成[J]. 计算机工程与科学, 2020, 42(09): 1680-1689.
[8]	官蕊, 丁家满, 贾连印, 游进国, 姜瑛, . 基于强化学习的多样性文档排序算法[J]. 计算机工程与科学, 2020, 42(09): 1697-1703.
[9]	周碧莹1，王爱平1，费长江2，虞万荣2，赵宝康2. 基于强化学习的卫星网络资源调度机制[J]. 计算机工程与科学, 2019, 41(12): 2134-2142.
[10]	熊炜1,2，冯川1，熊子婕1，王娟1,2，刘敏1,2，曾春艳1,2. 基于CNN的改进行人重识别技术[J]. 计算机工程与科学, 2019, 41(04): 665-672.
[11]	万谦1,2，刘玮1,2，徐龙龙1,2，郭竞知1,2. 基于Q-learning的不确定环境BDI Agent最优策略规划研究[J]. 计算机工程与科学, 2019, 41(01): 166-172.
[12]	宋佳佳，王作为. 基于有效实例的改进U树算法[J]. 计算机工程与科学, 2019, 41(01): 185-190.
[13]	马慧芳1,2，邢玉莹1，王双1，张旭鹏1. 融合词语共现距离和类别信息的短文本特征提取方法[J]. 计算机工程与科学, 2018, 40(09): 1689-1695.
[14]	闫雪飞,李新明,刘东,刘德生,李强. 基于强化学习的体系对抗仿真战役层次指控算法[J]. 计算机工程与科学, 2018, 40(08): 1511-1520.
[15]	王建军,刘玉林. 基于强化学习的自适应中间件在线更新机制研究[J]. J4, 2014, 36(08): 1462-1468.

引入自编码机制对抗网络的文本生成模型

Generative adversarial networks with autoencoder for text generation

PDF

可视化

摘要/Abstract

引用本文

使用本文

相关文章 15

编辑推荐

Metrics

本文评价