神经网络逆设计电化学等离激元光开关
Inverse Design of Electrochemical Plasmon Optical Switching Based on Neural Network
DOI: 10.12677/japc.2024.132037, PDF, HTML, XML, 下载: 41  浏览: 59 
作者: 梁明乾:上海理工大学光子芯片研究院,上海;上海理工大学光电信息与计算机工程学院,上海;张轶楠*:上海理工大学光子芯片研究院,上海
关键词: 逆设计纳米光子学神经网络等离激元光开关Inverse Design Nanophotonics Neural Network Plasmon Optical Switching
摘要: 等离激元产生于光与金属纳米结构的相互作用,其共振特性已成为纳米光子学领域的一个研究重点,基于可调谐等离子体共振的金属纳米结构光开关受到广泛关注。与此同时,如何设计高性能的纳米开关结构也成为一个重要的研究方向,深度学习方法在纳米光子结构的逆设计中展现出强大的应用潜力,可以高效利用巨大的参数空间。本文利用神经网络近似金属纳米结构的光学响应,并通过反向传播来实现纳米结构的逆设计,分析了光栅光开关的性能优势,并对未来研究方向进行了展望。
Abstract: The resonance characteristics of plasmon generated by the interaction between light and metal nanostructures have become a research focus in the field of nanophotonics, and the metal nanostructured optical switches based on tunable plasmon resonance have received extensive attention. At the same time, how to design high-performance nanoswitch structures has become an important research direction, and deep learning methods show strong application potential in the inverse design of nanophoton structures, which can efficiently use huge parameter space. In this paper, neural networks are used to approximate the optical response of metal nanostructures, and inverse design of nanostructures is realized through backpropagation. The performance advantages of grating optical switches are analyzed, and the future research directions are prospected.
文章引用:梁明乾, 张轶楠. 神经网络逆设计电化学等离激元光开关[J]. 物理化学进展, 2024, 13(2): 317-325. https://doi.org/10.12677/japc.2024.132037

1. 引言

近年来,纳米光子学通过操纵光与物质在纳米尺度上的相互作用彻底改变了光学领域。光与金属纳米结构相互作用时引起的表面等离子体共振在光学传感 [1] [2] 、光学纳米天线 [3] [4] 、光子纳米结构 [5] [6] 等领域显示出了广泛的应用前景,表面等离子体极化激元是金属纳米结构与光相互作用时形成的电磁波,能够维持光频率在金属与电介质界面传播。并可以将光限制在纳米尺度上,增强光与物质的相互作用,产生局域场增强效应,使纳米光子元件的运行超出光学衍射极限,为实现超快、节能的等离激元光开关 [7] [8] [9] 提供了可能,我们希望以一种可逆的方式使表面等离子体共振可控,并致力于设计可以在外界刺激下可逆调控的主动等离子体结构,从而实现对光开关的控制。

2. 等离激元光开关

等离激元光开关相比于传统光学开关具有高对比度、高灵敏度、低功耗、易于集成等优势。等离激元是光与贵金属表面自由电子相互作用产生的震荡模式,当光与自由电子集体震荡频率相匹配时,会激发表面等离激元共振,被束缚在亚波长以下的界面附近 [2] ,导致局域场增强。这种共振效应可以极大地增强光与物质的相互作用,实现光透射增强,可以被应用于超快、高效的光开关 [9] ,并通过调控表面等离激元的共振来实现光信号的开关,这是由于表面等离激元的共振效应高度依赖于金属纳米结构的成分、参数及周围环境的折射率。然而由于金属固定的介电常数以及结构的几何稳定性,其共振可调性受到高度限制。因此,若要实现开关可控的主动等离子体结构需要一种可切换状态的材料和在纳米尺度上控制共振的方法。将金属纳米结构与有机聚合物相结合,通过调节周围介质的介电常数可以成功的调控表面等离激元共振效应。因此,对等离激元共振的调控转变成了对其周环境的控制,导电聚合物聚苯胺以其良好的稳定性、低成本、易于生成显示出巨大的优势,它可以作为极薄涂层很好地被沉积在纳米结构表面,并且其厚度易于控制 [10] ,从而被用于金属纳米结构的周围介质,可以通过使用电化学方法改变其导电特性或折射率,从而实现调控等离激元结构开关的目的 [11] [12] [13] 。

等离激元光开关采用的是光栅结构,并涂覆一层极薄的聚苯胺。光子纳米结构的设计以往采用传统的策略,通过全电磁模拟的方法,不断调整结构的几何参数,从而得到符合期望功能的结构。这在很大程度上依赖于设计者的经验,而且随着结构复杂性的增加,计算成本变得昂贵且效率低下,这样的设计过程不是我们所希望的也是不能承受的。此外,传统的设计方法只能寻找部分参数空间的最优结构,很难给出给定参数空间中的最优解。

3. 神经网络逆设计模型

人工神经网络 [14] 是一种受到生物神经系统启发而创建的计算模型,可以模拟和处理复杂的信息和数据,学习结构的功能特征,已在不同的领域应用中取得了卓越的成效并正在改变我们的生活,例如图像分类、语音识别、自然语言处理等。通过建立正向网络模型可以准确预测结构的光学响应,并可以实现纳米光子结构的有效逆设计 [15] [16] [17] [18] 。首先经由电磁模拟涂覆聚苯胺薄膜的金纳米光栅结构,获取足够的数据,聚苯胺的折射率参考文献 [13] 。这些数据由纳米结构的几何参数及与其对应的光学响应组成,然后送入神经网络进行训练。如图1所示在网络中,输入为几何参数,输出为光学响应,例如纳米结构的透射光谱。在训练好由结构几何参数到光学响应的神经网络模型后,通过迭代过程来优化输入结构的几何参数,达到逆设计的目的。在迭代优化的过程中,我们固定权重,将输入的几何参数设置为可训练的变量,同时固定输出为所期望的光谱,通过反向传播不断迭代输入以得到期望的输出。经过若干次迭代后,神经网络给出一个结构的几何参数来重现光谱,有效解决了逆设计过程中的非唯一性问题。这个网络模型可以高度精确地预测纳米结构的光谱响应,也可以逆设计一个期望光谱所对应的纳米结构。

Figure 1. Neural network forward training model

图1. 神经网络正向训练模型

4. 逆设计优化

在这项研究中,我们要设计的是一个涂覆聚苯胺薄膜的金纳米光栅结构,光栅结构可以为入射波提供一个波矢补偿,满足共振条件,我们的目标是用神经网络来模拟这个结构,输入结构参数,输出可见光范围内的采样光谱。我们需要考虑的参数有光栅的宽度、高度、缝宽以及薄膜的厚度,这些因素共同影响着结构的共振特性。宽度范围为400~670 nm,高度范围为50~200 nm,缝宽范围为20~100 nm,薄膜的厚度范围为5~30 nm。这几乎遍历了存在最优结构的参数空间,实现了比传统方法更广泛的研究范围,采用有限时域差分法模拟了5000组不同结构参数的样本,采用400~800 nm范围的平面波光源垂直入射,水平方向设置为周期性边界条件,竖直方向设置为完美匹配层,采集的透射光谱为光栅开关状态下的两组数据,范围为400~800 nm。通过编写脚本语言来控制参数的随机设置、电磁模拟的运行、结果的保存等,这是一个自动化的过程,不需要额外消耗人力。

我们使用深度学习方法来解决模拟计算以及逆设计中的挑战,首先建立一个正向网络模型,以准确即时地预测金纳米光栅结构地透射光谱。以结构的几何参数作为输入并以光谱作为输出在金纳米光栅结构几何参数与透射光谱之间构建一个完全连接网络。在训练过程中,将数据集分割为训练集、测试集、验证集三个部分。将训练集送入网络,利用RMSProp Optimizer算法反向更新权重与偏置来优化网络的性能,其中损失函数被定义为输出光谱与实际光谱的均方误差;验证集是训练集中独立出的一部分数据,不用于模型的训练,而是用于检验网络的性能,对超参数进行优化;测试集是一组全新的数据,既不用于模型训练也不用于超参数选择,它用于最终评估模型的性能。通过电磁模拟获取的5000组数据,按8:1:1的比例分为训练集、验证集、测试集。对于一个模型来说,隐藏层和神经元的个数在一定程度上代表了它对数据的学习能力,但对于某一数据来说并不是隐藏层和神经元的个数越多其学习能力越强,需要根据实际的训练大小,选择验证损失最低的模型,含有4个隐藏层以及每层有200个神经元的网络模型表现出了较为优异的性能,其中学习率为0.009,衰减为0.99。在对数据进行一个完整训练的过程中,将数据分为若干小批次,对每个小批次进行前向传播、计算损失、反向计算梯度、更新权重偏置,完成一个迭代循环。每10次循环作一次验证,使用验证集评估模型性能。训练可以在有限次的迭代循环下迅速收敛,验证损失函数随迭代循环次数的增加而下降。经过700多次训练后,验证损失下降为3.30 × 10−4,之后没有明显下降,训练中损失函数变化如图2(a)所示,权重和偏置被固定和保存。最后,为了评估模型的性能,使用测试集来测试该神经网络预测的准确性。预测了2组在训练集之外的不同结构参数的透射光谱,并与电磁模拟的结果相比较。如图2(b)是预测和模拟的开关状态下的光谱图,预测结果与模拟结果非常接近。虽然模型只训练了5000组样本,但是该网络很好地匹配了光谱尖峰和低谷的特征,用一种近似的方法很好地解决了计算成本昂贵的光学响应问题。

(a) 神经网络正向模型的损失函数(b) 神经网络预测光谱与FDTD模拟结构比较 (c) 神经网络逆向设计光谱与实际光谱比较

Figure 2. Neural network forward prediction and reverse optimization performance

图2. 神经网络正向预测与逆向优化性能

我们期望能由已知的光谱直接得到结构参数,所以建立了一个由光谱到结构参数的逆向神经网络,然而训练结构并不理想,模型的损失非常大。出现这种情况的主要原因是存在严重的非唯一性问题,即不同的结构参数可能会对应相同或相似的光谱响应,导致网络的损失在逆方向上很难收敛 [17] 。即在逆向神经网络的训练过程中,一个期望光谱若有多个对应的结构参数,应用于其中一种结构参数的网络权重在之后的训练中可能会被其他结构参数修改。为了避免逆网络中损失函数难以收敛的问题,可以采用迭代法对正向网络中输入的结构参数进行优化,从而达到逆设计的目的 [16] 。迭代逆网络相比于串联网络结构更加简单,训练时间更短,具有较高的设计效率,其损失也下降更快。在这个迭代优化过程中,固定权重,固定输出为期望的输出,将输入设置为可训练的变量,利用Adam Optimizer算法来优化神经网络的输入,即不断迭代输入,以降低损失函数,直至输出与期望光谱相近的结果,损失被定义为输出光谱与期望光谱的均方误差。在若干次迭代后,神经网络给出一组结构参数来得到期望的光谱。如图2(c)所示我们对这个神经网络模型进行逆设计测试,利用一个实际存在地任意光谱来让神经网络优化结构参数从而产生一个近似的光谱。对于一些形状比较复杂的光谱神经网络也可以轻松解决。

神经网络逆设计可以用来优化在特定波长处透过的结构,如图3(a),图3(b),图3(c)所示是逆设计的在600 nm、650 nm、700 nm处具有较高调制效率的光开关结构的开态和关态透射光谱。三种结构的宽度、高度、缝宽和膜厚参数分别441 nm、196 nm、95 nm、26 nm;530 nm、196 nm、63 nm、27 nm;600 nm、185 nm、29 nm、27 nm。我们选用的金属材料是金,金在可见光范围特别是长波长区域展现出优异的等离子体共振特性,适合产生单波长高效精确的透射光谱。在逆设计开关结构过程中,我们希望最大限度地提高单波长处的透过率,同时最小化其余波长处的透过率,权重已被训练并固定。我们创建了一个期望光谱,并把它与实际输出光谱的均方误差作为损失函数,神经网络经过迭代训练不断使输出光谱接近期望光谱的几何形状。在长波长区域,网络可以逆设计出单波长高透过的结构,而随波长减小,透射峰值明显下,这是由金在短波长处不可避免的强光学损耗引起的。

(a) 600 nm处开关光谱对比 (b) 650 nm处开关光谱对比(c) 700 nm处开关光谱对比 (d) 开关对比度

Figure 3. Switching spectrum inversely designed by neural network and switching contrast

图3. 神经网络逆设计的开关光谱及开关对比度

图3(d)所示为600 nm、650 nm、700 nm开关结构的光开关对比度,定义为γ = (Ion Ioff)/Ion,其中,IonIoff分别为等离激元光栅结构开态和关态下的透射强度。设计的各结构都表现出了较高的光开关对比度。

通过FDTD模拟了涂覆不同状态聚苯胺薄膜的光栅结构的开关波段处的光传输,如图4所示为FDTD模拟的650 nm波段开关的开、关态电场强度分布,图4(a),图4(c),图4(e)为涂覆还原态聚苯胺的光栅结构,图4(b),图4(d),图4(f)为涂覆氧化态聚苯胺的光栅结构。我们可以直观地看到开关状态下光与结构的相互作用强弱,相对于关态,开态情况下表面等离激元激发,增强了光与结构的相互作用,光栅结构狭缝内的光强显著增强,这意味有一个较高的光开关调制范围。

(a) 600 nm开关的开态电场 (b) 600 nm开关的关态电场

(c) 600 nm开关的开态电场 (d) 600 nm开关的关态电场(e) 700 nm开关的开态电场 (f) 700 nm开关的关态电场

Figure 4. Electric field intensity distribution in on and off state at 600 nm, 650 nm and 700 nm

图4. 600 nm、650 nm、700 nm处开关结构的开、关态电场强度分布

为了分析各波段开关光谱在人眼中的颜色,将逆设计的600、625、650、675、700 nm五个不同波段开、关态光谱转换为对应的颜色坐标,并绘制在CIE色度图中,如图5所示。关态下的光谱坐标都趋近于色度图中心区域,即这些光谱整体透过率较低,颜色饱和度较低,接近灰色。而开态情况下,其坐标都处于红色区域,即光谱显示出的颜色主要由长波段的光组成,主要透射光为红光。开态区域点的坐标较为分散,颜色饱和度差异较大,这是因为对于单峰值光谱,颜色饱和度与线宽相关,越窄的线宽代表着更高的饱和度,其坐标位置也就越靠近色度图的边缘。

Figure 5. The positions of the spectra of different wavelength on and off states on the CIE chromaticity diagram

图5. 不同波长开、关态光谱在CIE色度图上的位置

5. 光开关应用与挑战

随着对信息处理的需求越来越高,使得计算速度、能耗和信息密度成为硬件开发的关键考虑因素。电子器件出现了物理上的瓶颈,纳米光子结构成为了可靠的发展途径之一,这是因为光子有着较高的速度和能量效率。用于加速人工智能和深度学习的新硬件架构也迫切需要,像光开关这样的纳米光子结构可以在光子神经网络中作为神经处理单元进行矩阵乘法计算,有着更高的运行速度和能量效率,由于光子的非相互作用特性,可以高效地并行计算。在一个光子神经网络中,系统是无源的,不消耗任何能量。Shen等人 [19] 提出了最早的光子神经网络的实验证明之一,在元音识别方面显示出与64位电子计算机相当的性能。神经网络中的非线性功能可以通过纳米光子结构的光学非线性来实现,但它在实际中的应用仍是一个挑战。

6. 总结与展望

通过将传统的结构设计方法与神经网络逆设计相比较,来体现神经网络的便捷性和准确性。传统的设计过程大多从原有经验出发,对结构材料、参数以及周围介质进行建模,经过电磁模拟仿真得到透射光谱,如不满足目标光谱,则需要依据结构参数对透射光谱峰值强度及位置的可能影响来修改参数,如此循环上述过程,直至获得期望的透射光谱。神经网络是一种多层次的表征学习技术,通过非线性神经元的组合学习数据中深层次的特征,从而建立输入与输出之间的映射关系 [20] 。在神经网络的前向传播过程中,将结构参数输入神经网络,不需要等待过长时间的电磁模拟就可以得到透射光谱,且与模拟的结果比较吻合。在神经网络的逆设计过程中,同样将结构参数输入神经网络,网络根据期望光谱对输入反向迭代优化得到合适的结构参数。再进一步验证逆设计的准确性,通过常规电磁模拟由结构参数获得光谱,与期望光谱比较接近。这说明神经网络是一种便捷、有效的逆设计工具,即便存在多个逆设计参数,也可以针对各种复杂的光谱逆快速设计出符合期望的结构。如图3(a)~(c)中展示的是设计的多个光谱与期望光谱的比较,设计光谱与期望光谱较为接近,这表明神经网络逆设计的方法是准确且可重复的。通过神经网络进行逆设计首先需要获取大量且可靠的前置数据,这虽然消耗了一定的时间和成本,却是一次性的。这意味着在相同的结构系统中解决多个逆设计问题时并不需要过多的时间,只需要改变某些变量,比如期望光谱的形状,就可以得到在不同波长处透过的光谱。

在这项工作中,我们证明了神经网络可以取代成本昂贵的电磁模拟来设计金纳米光栅结构的开关光谱,它避免了我们探究光栅结构参数与其透射光谱内在的物理机制,并以一种极为快速的方式进行结构参数的逆向设计。我们只需要建立一个正向网络模型,即可实现数据驱动的、按需的纳米结构逆设计。这种逆设计方法可以应用于纳米光子学的许多其他领域,允许我们针对不同的方案进行设计。而且,逆设计过程中的反向优化传播具有良好的稳定性,适用于多种逆设计问题。然而,在这一领域我们仍面临着许多困难与挑战,光子纳米结构的小型化与复杂化使得设计的参数增多,可能会受限于机器学习的计算能力;对于纳米光子学逆设计领域,在网络中使用的是光谱或衍射效率等低维数据,限制了可实现的功能,而使用矢量场图等高维数据会受到计算能力和存储能力的限制。纳米光子结构可以为深度学习提供一个全新的平台,拥有更高的速度和效率,有望克服深度学习计算能力的瓶颈。

NOTES

*通讯作者。

参考文献

[1] Mayer, K.M. and Hafner, J.H. (2011) Localized Surface Plasmon Resonance Sensors. Chemical Reviews, 111, 3828-3857.
https://doi.org/10.1021/cr100313v
[2] Schuller, J.A., Barnard, E.S., Cai, W., et al. (2010) Plasmonics for Extreme Light Concentration and Manipulation. Nature Materials, 9, 193-204.
https://doi.org/10.1038/nmat2630
[3] Chen, S., Kang, E.S.H., Shiran Chaharsoughi, M., et al. (2020) Conductive Polymer Nanoantennas for Dynamic Organic Plasmonics. Nature Nanotechnology, 15, 35-40.
https://doi.org/10.1038/s41565-019-0583-y
[4] Karst, J., Floess, M., Ubl, M., et al. (2021) Electrically Switchable Metallic Polymer Nanoantennas. Science, 374, 612-616.
https://doi.org/10.1126/science.abj3433
[5] Lal, S., Link, S. and Halas, N. (2007) Nano-Optics from Sensing to Waveguiding. Nature Photonics, 1, 641-648.
https://doi.org/10.1038/nphoton.2007.223
[6] Ou, J.Y., Plum, E., Jiang, L., et al. (2011) Reconfigurable Photonic Metamaterials. Nano Letters, 11, 2142-2144.
https://doi.org/10.1021/nl200791r
[7] Xu, T., Walter, E.C., Agrawal, A., et al. (2016) High-Contrast and Fast Electrochromic Switching Enabled by Plasmonics. Nature Communications, 7, Article No. 10479.
https://doi.org/10.1038/ncomms10479
[8] Stern, L., Grajower, M. and Levy, U. (2014) Fano Resonances and All-Optical Switching in a Resonantly Coupled Plasmonic-Atomic System. Nature Communications, 5, Article No. 4865.
https://doi.org/10.1038/ncomms5865
[9] Ono, M., Hata, M., Tsunekawa, M., et al. (2020) Ultrafast and Energy-Efficient All-Optical Switching with Graphene-Loaded Deep-Subwavelength Plasmonic Waveguides. Nature Photonics, 14, 37-43.
https://doi.org/10.1038/s41566-019-0547-7
[10] Guiseppi-Elie, A., Pradhan, S.R., Wilson, A.M., et al. (1993) Growth of Electropolymerized Polyaniline Thin Films. Chemistry of Materials, 5, 1474-1480.
https://doi.org/10.1021/cm00034a017
[11] Lu, W., Jiang, N. and Wang, J. (2017) Active Electrochemical Plasmonic Switching on Polyaniline-Coated Gold Nanocrystals. Advanced Materials, 29, Article 1604862.
https://doi.org/10.1002/adma.201604862
[12] Atighilorestani, M., dos Santos, D.P., Jaimes Ruth, F.V.V., et al. (2016) Electrochemical Control of Light Transmission through Nanohole Electrode Arrays. ACS Photonics, 3, 2375-2382.
https://doi.org/10.1021/acsphotonics.6b00607
[13] Kaissner, R., Li, J., Lu, W., et al. (2021) Electrochemically Controlled Metasurfaces with High-Contrast Switching at Visible Frequencies. Science Advances, 7, eabd9450.
https://doi.org/10.1126/sciadv.abd9450
[14] Kim, B., Lee, S. and Kim, J. (2020) Inverse Design of Porous Materials Using Artificial Neural Networks. Science Advances, 6, eaax9324.
https://doi.org/10.1126/sciadv.aax9324
[15] Yao, K., Unni, R. and Zheng, Y. (2019) Intelligent Nanophotonics: Merging Photonics and Artificial Intelligence at the Nanoscale. Nanophotonics, 8, 339-366.
https://doi.org/10.1515/nanoph-2018-0183
[16] Peurifoy, J., Shen, Y., Jing, L., et al. (2018) Nanophotonic Particle Simulation and Inverse Design Using Artificial Neural Networks. Science Advances, 4, eaar4206.
https://doi.org/10.1126/sciadv.aar4206
[17] Liu, D., Tan, Y., Khoram, E., et al. (2018) Training Deep Neural Networks for the Inverse Design of Nanophotonic Structures. ACS Photonics, 5, 1365-1369.
https://doi.org/10.1021/acsphotonics.7b01377
[18] Malkiel, I., Mrejen, M., Nagler, A., et al. (2018) Plasmonic Nanostructure Design and Characterization via Deep Learning. Light: Science & Applications, 7, Article No. 60.
https://doi.org/10.1038/s41377-018-0060-7
[19] Shen, Y., Harris, N., Skirlo, S., et al. (2017) Deep Learning with Coherent Nanophotonic Circuits. Nature Photonics, 11, 441-446.
https://doi.org/10.1038/nphoton.2017.93
[20] LeCun, Y., Bengio, Y. and Hinton, G. (2015) Deep Learning. Nature, 521, 436-444.
https://doi.org/10.1038/nature14539