单次神经网络结构搜索研究综述

计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (02): 191-203.

单次神经网络结构搜索研究综述

董佩杰,牛新,魏自勉,陈学晖

(国防科技大学计算机学院，湖南长沙 410073)

收稿日期:2021-11-29 修回日期:2022-05-26 接受日期:2023-02-25 出版日期:2023-02-25 发布日期:2023-02-15
基金资助:
国家自然科学基金（61806216）

Review of one-shot neural architecture search

DONG Pei-jie,NIU Xin,WEI Zi-mian,CHEN Xue-hui

(College of Computer Science and Technology,National University of Defense Technology,Changsha 410073,China)

Received:2021-11-29 Revised:2022-05-26 Accepted:2023-02-25 Online:2023-02-25 Published:2023-02-15

摘要/Abstract

摘要： 深度学习技术的快速发展与神经网络结构的创新关系密切。为提升网络结构设计效率，自动化网络结构设计算法—神经网络结构搜索NAS成为近年的研究热点。早期NAS算法通常要对大量候选网络进行训练和评估，带来了巨大的计算开销。通过迁移学习技术，可以加速候选网络的收敛，从而提升网络结构搜索效率。基于权重迁移技术的单次神经网络结构搜索(One-shot NAS)算法以超图为基础，子图之间进行权重共享，提高了搜索效率，但是也面临着协同适应、排序相关性差等挑战性问题。首先介绍了基于权重共享的One-shot NAS算法的相关研究，然后从采样策略、过程解耦和阶段性3个方面对关键技术进行分析梳理，比较分析了典型算法的搜索效果，并对未来的研究方向进行了展望。

关键词: 神经网络结构搜索, 单次神经网络结构搜索, 权重共享, 迁移学习, 深度学习

Abstract: The rapid development of deep learning is closely related to the innovation of neural network structure. To improve the efficiency of network architecture design, Neural Architecture Search (NAS), an automated network architecture design method, has become a research hotspot in recent years. Earlier neural architecture search algorithms in iterative search usually have to train and evaluate a large number of sampled candidate networks, which brings huge computational overhead. Through transfer learning, the convergence of candidate network can be accelerated, thus improving the efficiency of neural architecture search. One-shot NAS based on weight transfer technique is based on super graph, and weights are shared among sub graphs, which improves the search efficiency, but it also faces challenging problems such as co-adaptation and ranking disorder. Firstly, we introduce the research related to one-shot NAS based on weight-sharing, and then analyze the key technologies from three aspects of sampling strategy, process decoupling and phase, compare and analyze the search effect of typical one-shot neural architecture search algorithms, and provide an outlook on the future research direction.

Key words: neural architecture search(NAS);one-shot NAS, weight-sharing;transfer learning;deep learning

董佩杰, 牛新, 魏自勉, 陈学晖. 单次神经网络结构搜索研究综述[J]. 计算机工程与科学, 2023, 45(02): 191-203.

DONG Pei-jie, NIU Xin, WEI Zi-mian, CHEN Xue-hui. Review of one-shot neural architecture search[J]. Computer Engineering & Science, 2023, 45(02): 191-203.

编辑推荐

Metrics

阅读次数

全文

546

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	546

来源	本网站	其他网站

次数	473	73
比例	87%	13%

摘要

359

最新录用	在线预览	正式出版

0	0	359

	来源	本网站

	次数	359
	比例	100%

[1]	丁建平, 李卫军, 刘雪洋, 陈旭. 命名实体识别研究综述[J]. 计算机工程与科学, 2024, 46(07): 1296-1310.
[2]	谭郁松, 王伟, 蹇松雷, 易超雄. 基于异常保持的弱监督学习网络入侵检测模型[J]. 计算机工程与科学, 2024, 46(05): 801-809.
[3]	吉旭瑞, 魏德健, 张俊忠, 张帅, 曹慧. 中文电子病历信息提取方法研究综述[J]. 计算机工程与科学, 2024, 46(02): 325-337.
[4]	邱晓梦, 王琳, 谷文俊, 宋伟, 田浩来, 胡誉. 光流法修正的时序图像语义分割模型[J]. 计算机工程与科学, 2024, 46(01): 102-110.
[5]	崔浩, 万亚平, 钟华, 聂明星, 肖杨. 基于LoRa设备的人体活动识别研究[J]. 计算机工程与科学, 2024, 46(01): 111-121.
[6]	李卓璇, 周亚同. 改进DBNet的电商图像文字检测算法研究[J]. 计算机工程与科学, 2023, 45(11): 2008-2017.
[7]	马志峰, 张浩, 刘劼. 基于深度学习的短临降水预报综述[J]. 计算机工程与科学, 2023, 45(10): 1731-1753.
[8]	马思远, 焦佳辉, 任晟岐, 宋伟. 基于注意力机制的城市多元空气质量数据缺失值填充[J]. 计算机工程与科学, 2023, 45(08): 1354-1364.
[9]	邓姗姗, 黄慧, 马燕. 基于改进Faster R-CNN的小目标检测算法[J]. 计算机工程与科学, 2023, 45(05): 869-877.
[10]	史册, 南新元. 改进InceptionV3与迁移学习的太阳能电池板缺陷识别[J]. 计算机工程与科学, 2023, 45(04): 646-653.
[11]	刘从军, 徐佳陈, 肖志勇, 柴志雷. 基于深度学习的心脏核磁共振图像自动分割算法[J]. 计算机工程与科学, 2022, 44(09): 1646-1654.
[12]	何涛, 施慧莉, 李大亮. 基于深度学习的SAR目标识别DSP设计[J]. 计算机工程与科学, 2022, 44(08): 1357-1363.
[13]	苟淞, 赵绪言, 侯松, 李威. 基于多尺度优化感知网络的口罩检测方法[J]. 计算机工程与科学, 2022, 44(08): 1440-1448.
[14]	刘李漫, 谭龙雨, 彭源, 刘佳. 基于全融合网络的三维点云语义分割[J]. 计算机工程与科学, 2022, 44(05): 862-869.
[15]	卢凯良. 基于可见光视觉图像的路面裂缝识别深度学习方法述评[J]. 计算机工程与科学, 2022, 44(04): 674-685.