首页> 中国专利> 使用基于学习的模型加速半导体相关计算

使用基于学习的模型加速半导体相关计算

摘要

本发明提供用于使用针对样本模拟的输出执行针对所述样本的一或多个功能的方法及系统。一种系统包含经配置以用于由包含于工具中的一或多个检测器获取针对样本产生的输出的一或多个计算机子系统,所述工具经配置以在所述样本上执行过程。所述系统还包含由所述一或多个计算机子系统执行的一或多个组件。所述一或多个组件包含基于学习的模型,其经配置以用于使用所获取的输出作为输入执行一或多个第一功能以借此产生针对所述样本的模拟输出。所述一或多个计算机子系统还经配置以用于使用所述模拟输出针对所述样本执行一或多个第二功能。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-21

    授权

    授权

  • 2019-01-11

    实质审查的生效 IPC(主分类):G06N3/08 申请日:20170110

    实质审查的生效

  • 2018-08-31

    公开

    公开

说明书

技术领域

本发明大体上涉及用于使用针对样本模拟的输出针对所述样本执行一或多个功能的方法及系统。

背景技术

以下描述及实例不因其包含于本章节中而被认定为现有技术。

制造半导体装置(例如逻辑及存储器装置)通常包含使用大量半导体制造工艺处理衬底(例如半导体晶片)以形成半导体装置的各种特征及多个层级。举例来说,光刻是涉及将图案从主光罩转印到布置于半导体晶片上的抗蚀剂的半导体制造工艺。半导体制造工艺的额外实例包含(但不限制于)化学机械抛光(CMP)、蚀刻、沉积及离子植入。多个半导体装置可以某一布置制造于单个半导体晶片上且接着分为个别半导体装置。

在半导体制造工艺期间的各种步骤处使用检验过程以检测样本上的缺陷而在制造工艺中驱动较高产率且因此获得较高利润。检验始终为制造半导体装置的重要部分。然而,由于半导体装置的尺寸减小,所以检验对成功地制造可接受半导体装置变得更重要,这是因为较小缺陷可引起装置失效。

缺陷复检通常涉及再检测由检验过程检测为缺陷的缺陷且使用高倍放大光学系统或扫描电子显微镜(SEM)以更高分辨率产生关于所述缺陷的额外信息。因此,在已通过检验检测到缺陷的样本上的离散位置处执行缺陷复检。由缺陷复检产生的缺陷的更高分辨率数据更适合用于确定缺陷的属性,例如轮廓、粗糙度、更准确的大小信息等等。

也在半导体制造工艺期间的各种步骤处使用计量过程以监测且控制所述工艺。计量过程不同于检验过程,因为其不像其中在样本上检测缺陷的检验过程,计量过程用于测量使用目前使用的检验工具无法确定的样本的一或多个特性。举例来说,计量过程用于测量样本的一或多个特性,例如在工艺期间形成于样本上的特征的尺寸(例如,线宽、厚度等等),使得可从所述一或多个特性确定工艺的性能。另外,如果样本的一或多个特性是不可接受的(例如,在特性的预定范围外),那么可使用对样本的一或多个特性的测量来更改工艺的一或多个参数,使得由工艺制造的额外样本具有可接受特性。

计量过程也不同于缺陷复检过程,因为其不像其中由检验检测的缺陷在缺陷复检中重新考虑的缺陷复检过程,计量过程可在未检测到缺陷的位置处执行。换句话说,不像缺陷复检,计量过程在样本上执行的位置可独立于在样本上执行的检验过程的结果。特定来说,可独立于检验结果选择执行计量过程的位置。

用于半导体应用中的常规算法通常将感测数据(即,检测器输出)转变为有用之物。举例来说,在计量及检验的情况中,感测数据用于实现分析及失效的根本原因。在工艺工具的情况中,感测数据通常用于以某种类型的控制回路方式中引导工艺工具。一般来说,我们具有映射此变换的模型。此模型通常由封闭形式解析方程或通常由一系列数值分析步骤求解。这些方法通常是基于基于物理的解决方案(求解麦克斯韦(Maxwell)方程,完成不同通道之间的传感器融合等等)。此类解决方案的实施方案通常涉及大量计算资源(通常被称为图像计算机)。

在关于多传感器融合的一个实例中,在许多检验系统(包含基于光学及电子束的检验系统)中存在传入数据的多个通道。当前算法通常分开处理所有通道且接着最后对数据进行融合或表决。此方法经执行以针对缺陷检测而最大化信噪比(SNR)且简化对发生的事情的理解。因此,一些缺陷检测比较算法在每一通道上分开执行。图像计算机成本因此上涨2.5倍到3倍,这是因为难以在早期组合通道。典型通道的成本可为$75K到$100K。

在第二实例中,算法可用于对准两个图像且对所述两个图像执行内插。通常,此步骤倾向于花费图像计算机成本的40%且在一些情况中FPGA用于实施所述步骤。对准算法还倾向于具有两种类型:更易受向量化但具有有限范围的基于标准低阶归一化互相关(NCC)算法;及对距离更稳健但难以以可向量化形式实施的基于特征的算法。以在计算上便宜的方式组合所述两种算法的方法至今为止没有有效的解决方案。

第三实例是复杂物理模型,例如半导体掩模检验中的近场模拟(薄掩模近似)或尝试使用物理学完成对晶片平面上存在的内容正向模拟的任何方法。7nm及更大的节点的投影表明计算大体上是棘手的,例如对固定计算预算的数天的模拟。

据此,开发用于使用针对样本模拟的输出针对所述样本执行一或多个功能的不具有以上描述的缺点中的一或多者的系统及方法是有利的。

发明内容

各种实施例的以下描述将不以任何方式解释为限制所附权利要求书的标的物。

一个实施例涉及一种经配置以用于使用针对样本模拟的输出针对所述样本执行一或多个功能的系统。所述系统包含一或多个计算机子系统,所述一或多个计算机子系统经配置以用于由包含于工具中的一或多个检测器获取针对样本产生的输出,所述工具经配置以在样本上执行过程。所述系统还包含由所述一或多个计算机子系统执行的一或多个组件。所述一或多个组件包含基于学习的模型,其经配置以用于使用经获取的输出作为输入执行一或多个第一功能以借此产生样本的模拟输出。所述一或多个计算机子系统还经配置以用于使用模拟输出针对样本执行一或多个第二功能。可如本文描述那样进一步配置所述系统。

另一实施例涉及一种用于使用针对样本模拟的输出针对所述样本执行的一或多个功能的计算机实施方法。所述方法包含由包含于工具中的一或多个检测器获取针对样本产生的输出,所述工具经配置以在样本上执行过程。所述方法还包含使用所获取输出作为基于学习的模型的输入执行一或多个第一功能以借此产生样本的模拟输出。所述基于学习的模型包含于由一或多个计算机系统执行的一或多个组件中。另外,所述方法包含使用模拟输出针对样本执行一或多个第二功能。由所述一或多个计算机系统执行所述一或多个第二功能。

可如本文进一步描述那样进一步执行以上描述的方法的步骤中的每一者。另外,以上描述的方法的实施例可包含本文描述的任何其它方法的任何其它步骤。此外,可由本文描述的系统中的任何者执行以上描述的方法。

另一实施例涉及一种存储程序指令的非暂时性计算机可读媒体,所述程序指令可在一或多个计算机系统上执行以用于执行计算机实施方法,所述计算机实施方法用于使用针对样本模拟的输出针对所述样本执行一或多个功能。所述计算机实施方法包含以上描述的方法的步骤。可如本文描述那样进一步配置计算机可读媒体。可如本文进一步描述那样执行计算机实施方法的步骤。另外,针对其可执行程序指令的计算机实施方法可包含本文描述的任何其它方法的任何其它步骤。

附图说明

受益于优选实施例的以下详细描述的所属领域的技术人员将在参考所附图式之后更清楚本发明的进一步优势,其中:

图1及1a是说明如本文描述那样配置的系统的实施例的侧视图的示意图;且

图2是说明存储用于使得计算机系统执行本文描述的计算机实施方法的程序指令的非暂时性计算机可读媒体的一个实施例的框图。

尽管本发明易受各种修改及替代形式的影响,但本发明的特定实施例以图式中的实例方式展示且在本文中详细描述。所述图式可不按比例绘制。然而应明白,图式及其详细描述不希望将本发明限制于所揭示的特定形式,而是相反地,其希望涵盖落于由所附权利要求书界定的本发明的精神及范围内的所有修改、等效物及替代。

具体实施方式

在本文中互换使用的术语“设计”、“设计数据”及“设计信息”通常是指IC的物理设计(布局)及通过复杂模拟或简单几何及布尔(Boolean)运算从物理设计导出的数据。另外,由主光罩检验系统及/或其衍生物获取的主光罩的图像可用作为设计的一或若干“代理”。此主光罩图像或其衍生物可在使用设计的本文描述的任何实施例中充当为设计布局的代替。所述设计可包含在扎法尔(Zafar)等人于2009年8月4日发布的共同拥有的第7,570,796号美国专利及库尔卡尼(Kulkarni)等人于2010年3月9日发布的第7,676,077美国专利中描述的任何其它设计数据或设计数据代理,所述两个专利皆以宛如全文阐述引用的方式并入本文中。另外,设计数据可为标准单元库数据、集成布局数据、用于一或多层的设计数据、所述设计数据的衍生物及全部或部分芯片设计数据。

另外,本文描述的“设计”、“设计数据”及“设计信息”是指由半导体装置设计者在设计过程中产生的信息及数据且因此在将设计印刷于任何物理样本(例如主光罩及晶片)上之前完全可用于本文描述的实施例中。

现在转到图式,应注意图未按比例绘制。特定来说,通常夸大图的部分元件的尺寸以突出所述元件的特性。还应注意,图未按相同比例绘制。已使用相同参考符号指示在一个以上图中展示的可类似地配置的元件。除非本文另外提及,否则描述及展示的元件中的任何者可包含任何合适的商用元件。

一般来说,本文描述的实施例经配置以用于使用基于学习的架构加速针对半导体应用(针对计量、检验及工艺工具)执行的计算。举例来说,一个实施例涉及一种经配置以用于使用针对样本模拟的输出针对所述样本执行的一或多个功能的系统。本文描述的实施例利用新学习算法及卷积神经网络(CNN)以将至今棘手或超昂贵计算问题转变为简单且便宜得多的实施方案。

在一个实施例中,本文描述的实施例的基本原理是深度神经网络,当利用CNN及相对较高效的密实化过程实施时,所述深度神经网络在计算方面比常规算法(尤其对于推理算法来说)便宜一个数量级。在另一实施例中,多传感器融合具有使用本文描述的实施例以更便宜的方式实施的可能性。此外,给定半导体装备工具(包含但不限制于计量、检验、蚀刻、沉积、图案化等等),其中一组传感器收集数据且具有将所述数据映射到利用计算引擎呈现映射(例如,从数据映射到缺陷)的特定目标(例如用于例如本文进一步描述的晶片检验器的缺陷检测)的模型,本文描述的所述实施例提供实施起来便宜2倍到10倍的计算引擎的替代实施方案。

在图1中展示此系统的一个实施例。所述系统包含一或多个计算机子系统(例如,计算机子系统36及计算机子系统102)及由一或多个计算机子系统执行的一或多个组件100。在一些实施例中,针对样本产生的输出包含基于光学的输出。举例来说,所述系统可包含基于光学的工具10。在图1的实施例中,基于光学的工具经配置以用于在所述样本的物理版本上方扫描光或将光引导到所述物理样本且同时检测来自样本的光以借此产生样本的基于光学的输出。基于光学的工具还可经配置以利用多种模式执行扫描(或引导)及检测。

在一个实施例中,样本是晶片。所述晶片可包含所属领域中已知的任何晶片。在另一实施例中,所述样本是主光罩。所述主光罩可包含所属领域中已知的任何主光罩。

在图1中展示的系统的实施例中,基于光学的工具10包含经配置以将光引导到样本14的照明子系统。所述照明子系统包含至少一个光源。举例来说,如图1中所展示,所述照明子系统包含光源16。在一个实施例中,所述照明子系统经配置以将光以一或多个入射角引导到样本,所述一或多个入射角可包含一或多个斜角及/或一或多个法向角。举例来说,如图1中所展示,将来自光源16的光以倾斜入射角引导通过光学元件18且接着通过透镜20到样本14。所述倾斜入射角可包含任何合适的倾斜入射角,其可取决于(例如)样本的特性而不同。

基于光学的工具可经配置以在不同时间以不同入射角将光引导到样本。举例来说,基于光学的工具可经配置以更改照明子系统的一或多个元件的一或多个特性,使得可将光以不同于图1中展示的入射角引导到样本。在一个此实例中,基于光学的工具可经配置以移动光源16、光学元件18、及透镜20,使得以不同倾斜入射角或法向(或接近法向)入射角将光引导到样本。

在一些例子中,基于光学的工具可经配置以同时以一个以上入射角将光引导到样本。举例来说,所述照明子系统可包含一个以上照明通道,所述照明通道中的一者可包含图1中展示的光源16、光学元件18及透镜20且另一照明通道(未展示)可包含可不同或相同地配置的类似元件或可包含至少一光源及可能的例如本文进一步描述的组件一或多个其它组件。如果与其它光同时将此光引导到样本,那么以不同入射角引导到样本的光的一或多个特性(例如,波长、偏光等等)可为不同的,使得由于以不同入射角照明样本导致的光可在检测器处彼此区别开。

在另一例子中,照明子系统可仅包含一个光源(例如,图1中展示的光源16)且来自所述光源的光可由照明子系统的一或多个光学元件(未展示)分离到不同光学路径中(例如,基于波长、偏光等等)。接着,可将不同光学路径中的每一者中的光引导到样本。多个照明通道可经配置以同时或在不同时间处将光引导到样本(例如,当使用不同照明通道循序照明样本时)。在另一例子中,相同照明通道可经配置以在不同时间以不同特性将光引导到样本。举例来说,在一些例子中,光学元件18可配置为光谱滤波器且可以各种不同方式改变所述光谱滤波器的性质(例如,通过置换出所述光谱滤波器),使得可在不同时间将不同波长的光引导到样本。照明子系统可具有用于将具有不同或相同特性的光以不同或相同入射角循序或同时引导到样本的所属领域中已知的任何其它合适的配置。

在一个实施例中,光源16可包含宽带等离子体(BBP)光源。以此方式,由所述光源产生且被引导到样本的光可包含宽带光。然而,光源可包含任何其它合适的光源,例如激光器。所述激光器可包含所属领域中已知的任何合适的激光器且可经配置以产生具有所属领域中已知的任何合适的一或若干波长的光。另外,所述激光器可经配置以产生是单色或接近单色的光。以此方式,所述激光器可为窄带激光器。光源还可包含产生具有多个离散波长或波段的光的多色光源。

来自光学元件18的光可由透镜20聚焦于样本14上。尽管透镜20在图1中展示为单个折射光学元件,但应了解,实际上透镜20可包含将来自光学元件的光组合聚焦到样本的数个折射及/或反射光学元件。图1中展示且本文描述的照明子系统可包含任何其它合适的光学元件(未展示)。此类光学元件的实例包含(但不限制于):偏光组件、光谱滤波器、空间滤波器、反射光学元件、切趾器、分束器、光圈及可包含所属领域中已知的任何此类合适的光学元件的类似者。另外,基于光学的工具可经配置以基于待用于基于光学的输出产生的照明类型更改照明子系统的元件中的一或多者。

基于光学的工具还可包含经配置以使得将光扫描于样本上方的扫描子系统。举例来说,基于光学的工具可包含样本14在检验期间安置于其上的载物台22。扫描子系统可包含可经配置以移动样本使得可将光扫描于样本上方的任何合适的机械及/或机器人组合件(包含载物台22)。另外或替代地,基于光学的工具可经配置以使得基于光学的工具的一或多个光学元件执行光在样本上方的某种扫描。可以任何合适的方式(例如以蛇形路径或螺旋路径)在样本上方扫描光。

基于光学的工具进一步包含一或多个检测通道。一或多个检测通道中的至少一者包含检测器,其经配置以检测归因于工具对样本的照明的来自样本的光且响应于所述检测到的光产生输出。举例来说,图1中展示的基于光学的工具包含两个检测通道,一个由集光器24、元件26及检测器28形成且另一个由集光器30、元件32及检测器34形成。如图1中所展示,两个检测通道经配置以在不同集光角度下收集且检测光。在一些例子中,两个检测通道经配置以检测散射光,且所述检测通道经配置以检测在不同角度下从样本散射的光。然而,检测通道中的一或多者可经配置以检测来自样本的另一类型的光(例如,反射光)。

如图1中所进一步展示,两个检测通道经展示定位于纸张的平面中且照明子系统还经展示定位于纸张的平面中。因此,在此实施例中,两个检测通道定位于(例如,居中于)入射平面中。然而,检测通道中的一或多者可定位于入射平面外部。举例来说,由集光器30、元件32及检测器34形成的检测通道可经配置以收集及检测从入射平面散射出的光。因此,此检测通道通常可被称为“侧”通道,且此侧通道可居中于大体上垂直于入射平面的平面中。

尽管图1展示包含两个检测通道的基于光学的工具的实施例,但所述基于光学的工具可包含不同数目的检测通道(例如,仅一个检测通道或两个或两个以上检测通道)。在一个此例子中,由集光器30、元件32及检测器34形成的检测通道可如以上描述那样形成一个侧通道,且基于光学的工具可包含形成为定位于入射平面的相对侧上的另一侧通道的额外检测通道(未展示)。因此,基于光学的工具可包含检测通道,所述检测通道包含集光器24、元件26及检测器28且所述检测通道居中于入射平面中且经配置以在散射角度(垂直于样本表面或接近垂直于样本表面)下收集且检测光。因此,此检测通道通常可称为“顶部”通道,且基于光学的工具还可包含如以上描述那样配置的两个或两个以上侧通道。因而,基于光学的工具可包含至少三个通道(即,一个顶部通道及两个侧通道),且所述至少三个通道中的每一者具有其本身的集光器,所述集光器中的每一者经配置以在与其它集光器中的每一者不同的散射角度下收集光。

如以上所进一步描述,包含于基于光学的工具中的检测通道中的每一者可经配置以检测散射光。因此,图1中展示的基于光学的工具可经配置以用于样本的暗场(DF)输出产生。然而,基于光学的工具还可或替代地包含经配置以用于样本的亮场(BF)输出产生的检测通道。换句话说,基于光学的工具可包含经配置以检测从样本镜面反射的光的至少一个检测通道。因此,本文描述的基于光学的工具可经配置以仅用于DF输出产生、仅用于BF输出产生或用于DF及BF输出产生两者。尽管集光器中的每一者在图1中展示为单个折射光学元件,但应了解集光器中的每一者可包含一或多个折射光学元件及/或一或多个反射光学元件。

一或多个检测通道可包含所属领域中已知的任何合适的检测器。举例来说,检测器可包含光电倍增管(PMT)、电荷耦合装置(CCD)、时延积分(TDI)相机及所属领域中已知的任何其它合适的检测器。检测器还可包含非成像检测器或成像检测器。以此方式,如果检测器是非成像检测器,那么所述检测器中的每一者可经配置以检测散射光的某些特性(例如强度)但不可经配置以根据成像平面内的位置来检测此类特性。因而,由包含于基于光学的工具的检测通道中的每一者中的检测器中的每一者产生的输出可为信号或数据,但并非图像信号或图像数据。在此类例子中,计算机子系统(例如计算机子系统36)可经配置以从检测器的非成像输出产生样本的图像。然而,在其它例子中,检测器可配置为经配置以产生图像信号或图像数据的成像检测器。因此,基于光学的工具可经配置而以数种方式产生本文描述的基于光学的输出。

应注意,图1在本文中经提供以大体上说明可包含于本文描述的系统实施例中或可产生由本文描述的系统实施例使用的基于光学的输出的基于光学的工具的配置。显而易见,本文描述的基于光学的工具配置可经更改以如设计商用基于光学的工具时通常执行那样优化基于光学的工具的性能。另外,本文描述的系统可使用现存基于光学的工具(例如,通过将本文描述的功能增加到现存基于光学的工具)实施,所述工具例如购自加利福尼亚州米尔皮塔斯市的科磊公司(KLA-Tencor,Milpitas,Calif)的29xx/39xx及Puma 9xxx系列工具。针对一些此类系统,本文描述的实施例可提供为基于光学的工具的任选功能(例如,除基于光学的工具的其它功能外)。替代地,本文描述的基于光学的工具可“从头”设计以提供全新基于光学的工具。

基于光学的工具的计算机子系统36可以任何合适的方式(例如,经由一或多个传输媒体,其可包含“有线”及/或“无线”传输媒体)耦合到基于光学的工具的检测器,使得计算机子系统可接收由检测器在扫描样本期间产生的输出。计算机子系统36可经配置以使用检测器的输出执行本文进一步描述的数个功能。

图1中展示的计算机子系统(以及本文描述的其它计算机子系统)还可在本文中被称为计算机子系统。本文描述的计算机子系统或系统中的每一者可采取各种形式,包含个人计算机系统、图像计算机、大型主计算机系统、工作站、网络设备、因特网设备或其它装置。一般来说,术语“计算机系统”可广义地经界定以涵盖具有执行存储器媒体中的指令的一或多个处理器的任何装置。计算机子系统或系统还可包含所属领域中已知的任何合适的处理器,例如并行处理器。另外,计算机子系统或系统可包含具有高速处理及软件的计算机平台(作为独立或网络工具)。

如果系统包含一个以上计算机子系统,那么不同计算机子系统可彼此耦合,使得图像、数据、信息、指令等等可在计算机子系统之间传送,如本文进一步所描述。举例来说,计算机子系统36可通过任何合适的传输媒体(可包含所属领域中已知的任何合适的有线及/或无线传输媒体)耦合到由图1中的虚线展示的计算机子系统102。此类计算机子系统中的两者或两者以上还可有效地由共享计算机可读存储媒体(未展示)耦合。

尽管所述工具在以上描述为基于光学或光的工具,但所述工具可为基于电子束的工具。举例来说,在一个实施例中,针对样本产生的输出包含基于电子束的输出。在图1a中展示的一个此实施例中,基于电子束的工具包含耦合到计算机子系统124的电子柱122。还如图1a中所展示,电子柱包含经配置以产生通过一或多个元件130聚焦到样本128的电子的电子束源126。所述电子束源可包含(例如)阴极源或发射器尖端,且一或多个元件130可包含(例如)枪透镜、阳极、射束限制孔、闸阀、射束电流选择孔、物镜及扫描子系统,以上全部可包含所属领域中已知的任何此类合适的元件。

从样本返回的电子(例如,次级电子)可通过一或多个元件132聚焦到检测器134。一或多个元件132可包含(例如)扫描子系统,所述扫描子系统可为包含于元件130中的相同扫描子系统。

电子柱可包含所属领域中已知的任何其它合适的元件。另外,所述电子柱可如以下专利中描述那样进一步经配置:2014年4月4日颁予江(Jiang)等人的第8,664,594号美国专利、2014年4月8日颁予小岛(Kojima)等人的第8,692,204号美国专利、2014年4月15日颁予古本斯(Gubbens)等人的第8,698,093号美国专利及2014年5月6日颁予麦克唐纳(MacDonald)等人的第8,716,662号美国专利,所述专利以宛如全文阐述引用的方式并入本文中。

尽管电子柱在图1a中展示为经配置使得电子以倾斜入射角引导到样本且以另一倾斜角从样本散射,但应了解,可以任何合适的角度将电子束引导到样本且从样本散射电子束。另外,基于电子束的工具可经配置以如本文进一步描述那样使用多个模式产生样本的基于电子束的输出(例如,具有不同照明角度、集光角度等等)。基于电子束的工具的多个模式可在工具的任何输出产生参数方面不同。

计算机子系统124可耦合到检测器134,如以上所描述。检测器可检测从样本的表面返回的电子,借此形成样本的基于电子束的输出。基于电子束的输出可包含任何合适的基于电子束的输出,例如图像。计算机子系统124可经配置以使用由检测器134产生的输出针对样本执行本文进一步描述的一或多个功能。计算机子系统124可经配置以执行本文描述的任何额外步骤。可如本文描述那样进一步配置包含在图1a中展示的基于电子束的工具的系统。

应注意,图1在本文中经提供以大体上说明可包含于本文描述的实施例中的基于电子束的工具的配置。如同以上描述的基于光学的工具,本文描述的基于电子束的工具配置可经更改以如设计商用基于电子束的工具时通常执行那样优化基于电子束的工具的性能。另外,本文描述的系统可使用现存基于电子束的工具(例如,通过将本文描述的功能增加到现存基于电子束的工具)实施,所述工具例如购自科磊公司的eSxxx及eDR-xxxx系列工具。针对一些此类系统,本文描述的实施例可提供为基于电子束的工具的任选功能(例如,除系统的其它功能外)。替代地,本文描述的基于电子束的工具可“从头”设计以提供全新基于电子束的工具。

尽管所述工具在以上描述为基于光学或基于电子束的工具,但所述工具可为基于离子束的工具。此工具可如图1a中所展示那样配置,除电子束源可由所属领域中已知的任何合适的离子束源替代外。另外,所述工具可为任何其它合适的基于离子束的工具,例如包含于商用聚焦离子束(FIB)系统、氦离子显微镜(HIM)系统及次级离子质谱(SIMS)系统中的基于离子束的工具。

如以上所提及,工具经配置以用于在样本的物理版本上方扫描能量(例如,光或电子),借此产生所述样本的物理版本的实际图像。以此方式,所述工具可经配置为“实际”工具,而非“虚拟”系统。举例来说,在图1中展示的存储媒体(未展示)及计算机子系统102可配置为“虚拟”系统。特定来说,存储媒体及计算机子系统并非基于光学的工具10的部分且不具有用于处置样本的物理版本的任何能力。换句话说,在配置为虚拟系统的系统中,所述系统的一或多个“检测器”的输出可为先前由实际工具的一或多个检测器产生且存储于虚拟系统中的输出,且在“扫描”期间,虚拟系统可回放存储的输出就好像样本正被扫描一样。以此方式,利用虚拟系统扫描样本可显得与利用实际系统扫描物理样本一样,而实际上“扫描”涉及以与扫描样本相同的方式简单回放样本的输出。在2012年2月28日颁予巴斯卡尔(Bhaskar)等人的共同让渡的第8,126,255号美国专利及2015年12月29日颁予达菲(Duffy)等人的第9,222,895号美国专利中描述配置为“虚拟”检验系统的系统及方法,所述两个专利皆以宛如全文阐述引用的方式并入本文中。可如这些专利中描述那样进一步配置本文描述的实施例。举例来说,可如这些专利中描述那样进一步配置本文描述的一或多个计算机子系统。另外,可如达菲的以上参考专利中描述那样执行将一或多个虚拟系统布置为中央计算及存储(CCS)系统。本文描述的永久性存储机构可具有分布式计算及存储(例如CCS架构),但本文描述的实施例不限制于所述架构。

如以上所进一步提及,工具可经配置以利用多个模式产生样本的输出。一般来说,“模式”可由用于针对样本产生输出的工具的参数值或用于产生样本的图像的输出界定。因此,不同的模式可在工具的输出产生(例如,成像)参数中的至少一者的值方面不同。举例来说,在基于光学的工具的一个实施例中,多个模式中的至少一者使用照明的光的至少一个波长,所述波长不同于用于多个模式中的至少另一者的照明的光的至少一个波长。所述模式可在用于不同模式的如本文进一步描述的照明波长方面不同(例如,通过使用不同光源、不同光谱滤波器等等)。在另一实施例中,多个模式中的至少一者使用工具的照明通道,所述照明通道不同于用于多个模式的至少其它者的工具的照明通道。例如,如以上所提及,所述工具可包含一个以上照明通道。因而,不同照明通道可用于不同模式。

在一个实施例中,过程包含检验过程。举例来说,本文描述的基于光学及电子束的工具可配置为检验工具。在另一实施例中,过程包含缺陷复检过程。举例来说,本文描述的基于光学及电子束的工具可配置为缺陷复检工具。在另一实施例中,所述过程包含计量过程。举例来说,本文描述的基于光学及电子束的工具可配置为计量工具。特定来说,在本文中描述且在图1及1a中展示的工具的实施例可在一或多个参数方面进行修改以提供不同输出产生能力(其取决于其将用于的应用)。在一个此实例中,如果图1中展示的工具将用于缺陷复检或计量而非用于检验,那么其可经配置以具有较高分辨率。换句话说,图1及1a中展示的工具的实施例描述可以所属领域的技术人员将明白的数种方式进行调整以产生具有或多或少适合用于不同应用的不同输出产生能力的工具的工具的一些通用配置及各种配置。

在另一实施例中,过程包含制造工艺。举例来说,所述系统可包含经配置以在样本上执行一或多个制造工艺的半导体制造工具。在一个此实例中,如图1中所展示,所述系统包含可耦合到计算机子系统102及/或本文描述的系统的任何其它元件的半导体制造工具106。所述半导体制造工具可包含所属领域中已知的任何合适的半导体制造工具及/或腔室,例如光刻轨道、蚀刻腔室、化学机械抛光(CMP)工具、沉积腔室、剥离或清洁腔室及类似者。另外,半导体制造工具可包含经配置以产生样本的输出的(例如)本文进一步描述的一或多个检测器(未在图1中展示)。可包含于本文描述的实施例中的合适的半导体制造工具的实例在2005年5月10日颁予莱维(Levy)等人的第6,891,627号美国专利中描述,所述专利以宛如全文阐述引用的方式并入本文中。此本文专利还描述可包含于或耦合到半导体制造工具且可如本文进一步描述那样产生输出的各种检测器的实例。可如此专利中描述那样进一步配置本文描述的实施例。

一或多个计算机子系统经配置以用于由包含于工具中的一或多个检测器获取针对样本产生的输出,所述工具经配置以在样本上执行过程。可使用本文描述的输出产生工具中的一者(例如,通过将光或电子束引导到样本且检测来自所述样本的光或电子束)执行获取输出。以此方式,可使用物理样本本身及某种类型的输出产生(例如,成像)硬件执行获取输出。然而,获取输出不必包含使用成像硬件成象样本。举例来说,另一系统及/或方法可产生输出且可在一或多个存储媒体(例如本文描述的虚拟检验系统或本文描述的另一存储媒体)中存储产生的输出。因此,获取输出可包含从输出已存储于其中的存储媒体获取输出。

由计算机子系统(例如,计算机子系统36及/或计算机子系统102)执行的组件(例如图1中展示的组件100)包含基于学习的模型104。一或多个组件可由计算机子系统以任何合适方式执行。所述模型经配置以使用所得输出作为输入执行一或多个第一功能以借此产生样本的模拟输出。一或多个第一功能可包含本文描述的第一功能中的任何者。模拟的输出可包含本文描述的可如本文进一步描述那样产生的模拟输出中的任何者。可如本文描述那样进一步配置所述模型。所述一或多个计算机子系统进一步经配置以用于使用模拟输出针对样本执行一或多个第二功能。一或多个第二功能可包含本文进一步描述的第二功能中的任何者。

在另一实施例中,基于学习的模型包含机器学习模型。机器学习通常可界定为为计算机提供在无需明确编程的情况下学习的能力的一种人工智能(AI)。机器学习着重于可教示计算机成长且在暴露于新数据时作出改变的计算机程序的开发。换句话说,机器学习可界定为“给予计算机在无需明确编程的情况下学习的能力”计算机科学的子领域。机器学习探索可从数据学习且对数据作出预测的算法的研究及构造—此类算法通过通过从样本输入建立模型而作出驱动数据的预测或决策而克服遵循严格静态程序指令。

可如杉山(Sugiyama)、摩根·考夫曼(Morgan Kaufmann)的“统计机器学习概论(Introduction to Statistical Machine Learning)”2016第534页、杰巴拉(Jebara)的“判别式、生成性及模仿性学习(Discriminative,Generative,and Imitative Learning)”MIT论文2002,第212页及汉德(Hand)等人的“数据挖掘原理(自适应计算及机器学习)(Principles of Data Mining(Adaptive Computation and Machine Learning))”MIT出版社,2001第578页中描述那样进一步执行本文描述的机器学习,所述参考以宛如全文阐述引用的方式并入本文中。可如这些参考中描述那样进一步配置本文描述的实施例。

在一个实施例中,基于学习的模型包含深度学习模型。一般来说,“深度学习”(也被称为深度结构化学习、分层学习或深度机器学习)是基于尝试模型化数据中的高阶抽象概念的一组算法的机器学习的分支。在简单情况中,存在两组神经元:一个接收输入信号且另一个发送输出信号。当输入层接收输入时,其将输入的修改版本传递到下一层。在深度网络中,输入与输出之间存在许多层(且所述层并非由神经元构成但以此方式思考是有帮助的),从而允许算法使用由多个线性及非线性变换组成的多个处理层。

深度学习是基于学习数据的表示方法的机器学习方法的更广泛家族的部分。观察(例如,图像)可以许多方式表示,例如每像素的强度值的向量,或以更抽象的方式表示,如一组边缘、特定形状的区域等等。一些表示方法在简化学习任务(例如,面部识别或面部表情识别)方面比其它表示方法更好。深度学习的前景中的一者是利用有效算法替代手工特征进行无人监督或半监督特征学习及分层特征提取。

在此领域中的研究尝试作出更好的表示方法且产生从大规模的未标记数据学习这些表示方法的模型。部分表示方法受神经科学中进步的启发且松散地基于神经系统中的处理及通信模式的信息的解译,例如尝试界定各种刺激与大脑中的相关联的神经响应之间的关系的神经编码。

各种深度学习架构(例如深度神经网络、卷积深度神经网络、深度信念网络及递归式神经网络)已应用于如计算机视觉、自动语音识别、自然语言处理、音频识别及生物信息学的领域,其中其已经展示而对各种任务产生先进技术结果。

在另一实施例中,基于学习的模型包含神经网络。举例来说,所述模型可为深度神经网络,所述深度神经网络具有根据已馈入所述模型以训练所述模型的数据模型化世界的一组权重。神经网络通常可界定为计算方法,所述计算方法基于松散地模型化生物大脑利用由轴突连接的生物神经元的相对较大的丛集解决问题的方法的神经单元的相对较大集合。每一神经单元与许多其它神经单元连接,且链接在其对经连接的神经单元的激活状态的影响中是加强或抑制的。这些系统是自我学习且经训练的而非经明确编程且在其中解决方案或特征检测难以以传统计算机程序表达的领域中有突出表现。

神经网络通常由多个层组成,且信号路径从前贯穿到后。神经网络的目的是用于以与人类大脑相同的方式解决问题,尽管若干神经网络更抽象。现代神经网络项目通常与几千到几百万神经单元及数百万连接一起工作。神经网络可具有所属领域中已知的任何合适的架构及/或配置。

在另一实施例中,基于学习的模型包含卷积神经网络(CNN)。举例来说,本文描述的实施例可利用深度学习概念,例如CNN,来解决通常是棘手的表示转换问题(例如,再现)。模型可具有所属领域中已知的任何CNN配置或架构。

在另一实施例中,基于学习的模型包含深度神经网络。举例来说,所述模型可经配置以具有深度学习架构,其中所述模型可包含执行数个算法或转换的多个层。一般来说,模型中的层数目是不重要的且依赖于使用情况。出于实际目的,包含于模型中的层的合适范围是从2个层到数十个层。可如本文描述那样以其它方式配置深度神经网络。在此实施例中,基于学习的模型可配置为如克里泽夫斯基(Krizhevsky)等人的“具有深度卷积神经网络的图像网络分类(ImageNet Classification with Deep Convolutional NeuralNetworks)”NIPS,2012第9页中描述的深度CNN(DCNN),所述参考以宛如全文阐述引用的方式并入本文中。可如此参考中描述那样进一步配置本文描述的实施例。

在额外实施例中,基于学习的模型包含鉴别模型。鉴别模型(也被称为条件模型)是在机器学习中用于模型化未观察到的变量y对观察到的变量x的相依性的一类模型。在概率框架内,此通过模型化可用于从x预测y的条件概率分布P(y|x)而完成。鉴别模型(相对于生成模型)不允许我们从x及y的联合分布产生样本。然而,针对例如不需要联合分布的分类及回归的任务,鉴别模型可产生优越性能。另一方面,生成模型通常比鉴别模型在表达复杂学习任务中的相依性方面更灵活。另外,大多数鉴别模型固有地受监督且无法容易地扩展到不受监督的学习。特定应用细节最终指示选择鉴别模型相较于选择生成模型的合适性。可如由克里泽夫斯基的以上并入的参考中描述那样进一步配置鉴别模型。以此方式,本文描述的实施例可将鉴别类型的深度学习网络用于本文描述的应用(分类或回归目的)。

在一些实施例中,基于学习的模型包含生成模型。“生成”模型通常可界定为本质是概率性的模型。换句话说,“生成”模型并非执行正向模拟或基于规则的方法的模型,且因而涉及产生实际输出(针对其产生模拟输出)的过程的物理模型不是必要的。相反,如本文进一步描述,可基于一组合适的训练数据学习生成模型(其中可学习其参数)。可如张(Zhang)等人于2016年6月7日申请的第15/176,139号美国专利申请案中描述那样进一步配置所述生成模型,所述申请案以宛如全文阐述引用的方式并入本文中。可如此专利申请案中描述那样进一步配置本文描述的实施例。以此方式,本文描述的实施例可使用深度学习网络,例如用于本文描述的应用(分类或回归目的)的深度生成网络。

在一个实施例中,基于学习的模型包含深度生成模型。举例来说,所述模型可经配置以具有深度学习架构,其中所述模型可包含执行数个算法或转变的多个层。一般来说,生成模型的一侧或两侧上的层数目是不重要的且依赖于使用情况。出于实际目的,两侧上的层的合适范围是从2个层到数十个层。

在另一实施例中,基于学习的模型经配置以用于使用增加取样滤波器的卷积。举例来说,当以完全卷积化方式采用DCNN时,在DCNN的连续层处执行的最初针对图像分类设计的最大池化层及减少取样(“跨步(striding)”)的重复组合可导致具有显著减少的空间分辨率的特征映射。为了克服此障碍且有效地产生密集特征映射,减少取样操作器可从DCNN的最后几个最大池化层移除且反之在随后卷积层中增加取样滤波器,从而导致以较高采样率计算的特征映射。

滤波器增加取样相当于在非零滤波器分接头之间插入孔(法语中的“trous”)。此技术在信号处理方面具有悠久历史,最初针对方案中的无抽样小波变换(还称为“algorithme à trous”)的有效计算开发。因此,术语带孔卷积通常用作为使用增加取样滤波器的卷积的简约表达法。之前已在DCNN的背景内容中使用此理念的各种特点。实际上,可由带孔卷积的组合恢复完整分辨率特征映射,此更密集地计算特征映射,接着是响应于初始图像尺寸的特征的简单双线性插入。此方案供应在密集预测任务中使用反卷积层的简单但有力的替代方案。相较于使用较大滤波器的规则卷积,带孔卷积有效地允许扩大滤波器的视野而无需增加参数数目或计算量。可如在陈(Chen)等人的“DeepLab:具有深度卷积网络、Atrous卷积及完全连接CRF的语义图像分割(DeepLab:Semantic Image Segmentationwith Deep Convolutional Nets,Atrous Convolution,and Fully Connected CRFs)”arXiv:1606.00915v2,2016年6月2日第14页中描述那样进一步配置基于学习的模型的此实施例,所述参考以宛如全文阐述引用的方式并入本文中。

以此方式,本文描述的实施例可经配置以用于有效密实化过程。特定来说,在不同应用(例如,缺陷检测、CAD再现)中,图像级分析可转变为像素级分类问题。由CNN处理围绕图像的每一像素界定的局部区域(图块),从而产生与所述像素(图块)相关联的分类分数。完整图像分析可包含针对每一像素重复此操作,以产生尺寸等于输入图像的分数映射(所述分数映射同时提供“何物”及“何处”信息)。不幸的是,此直截了当的作法大体上是无效的(归因于重叠图块)。已实施由陈的以引用的方式并入的参考启发的方法。已由带孔卷积替代卷积核及池化操作。在新设置中,图像经处理作为滑动窗且完全重新使用(摊销)关于重叠图块的操作。

本文描述的实施例可或可不经配置以用于训练本文描述的基于学习的模型。举例来说,另一方法及/或系统可经配置以产生经训练的基于学习的模型,所述模型接着可由本文描述的实施例存取及使用。

在一个实施例中,计算机子系统经配置以用于利用从一或多个非基于学习的算法产生的结果训练基于学习的模型,且在由基于学习的模型执行一或多个第一功能之前执行所述训练。以此方式,计算机子系统可在基于学习的模型执行一或多个第一功能之前训练所述模型,且可利用经训练的基于学习的模型执行所述一或多个第一功能。举例来说,本文描述的实施例可使用较慢的卷积算法作为在训练基于较快学习的模型期间使用的教示方法(所以无需人类介入来注释事件)。较慢的卷积算法可为任何目前使用的算法,例如用于执行一或多个功能(例如,缺陷检测、分类、验证等等)的非基于学习的算法。用于训练基于较快学习的模型的较慢卷积算法的结果可基于一或多个第一功能进行选择。举例来说,如果一或多个第一功能包含缺陷检测,那么接着非基于学习的算法可包含常规缺陷检测算法。相比来说,如果一或多个第一功能包含缺陷分类,那么接着非基于学习的算法可包含常规缺陷分类算法。可由具有完全平行的系统的先前存在的较慢算法训练基于学习的模型。

以此方式,本文描述的实施例可包含训练系统及推理系统。所述推理系统实施起来可比训练系统快一个数量级。举例来说,如本文进一步描述,本文描述的基于学习的模型可比常规算法更快。因此,所述训练算法可比经训练的基于学习的模型更慢。在一个此实例中,所得系统通常将为具有参数(比普通计算便宜一个数量级)的前馈神经网络。

在另一实施例中,一或多个计算机子系统经配置以用于使用母网络预先训练基于学习的模型且训练所述预先训练的基于学习的模型,且在由基于学习的模型执行一或多个第一功能之前执行所述预先训练及训练。以此方式,计算机子系统可在基于学习的模型执行一或多个第一功能之前训练所述模型,且可利用经训练的基于学习的模型执行所述一或多个第一功能。举例来说,可通过在训练时间时改变输入并且从母网络学习而将稳健性引入到系统内。特定来说,母网络可用于通过从对一组不同但相关图像预先训练的网络中继承权重(及/或基于学习的模型的任何其它参数)加速训练过程。所述不同但相关图像可包含(例如)具有不同于将针对其执行一或多个功能的样本的类型的一类型的样本的图像。在一个此实例中,所述不同但相关图像可为针对一个晶片类型而将针对不同晶片类型执行一或多个功能。在本文描述的实施例中,重点是通过有效地在训练上花费更多时间以在实际推理期间本质上消除某些循序步骤而在运行时间期间加速推理。

在一些实施例中,一或多个计算机子系统经配置以用于监督利用用户提供的信息训练基于学习的模型,且在由基于学习的模型执行一或多个第一功能之前执行训练。以此方式,计算机子系统可在基于学习的模型执行一或多个第一功能之前训练所述模型,且可利用经训练的基于学习的模型执行所述一或多个第一功能。举例来说,可利用用户输入训练本文描述的基于学习的模型。所述用户输入可包含(例如)用户提供的缺陷分类。然而,用户提供的信息可包含关于基于学习的模型的可用于训练基于学习的模型的任何其它合适的信息。可以任何合适的方式(例如,通过通过耦合到一或多个计算机子系统的用户接口接收信息)获取所述用户提供的信息。

在另一实施例中,计算机子系统经配置以用于产生样本的合成数据且使用所述合成数据训练基于学习的模型。举例来说,本文描述的实施例可由其它方法扩充以使得用于训练的数据组更丰富。举例来说,训练实例可经扩充有包含噪声的人工实例以使得训练更具一般性。在一个此实例中,可基于物理知识加入单独训练实例以借此注入模型化噪声或甚至是可插入到图像内的缺陷结构,尽管所述缺陷结构可能未物理地出现于训练样本中。在巴斯卡尔等人于2016年12月29申请的第15/394,790号美国专利申请案中提供例如本文描述的可用于产生合成数据且使用合成数据训练模型的方法及系统的实例,所述专利申请案以宛如全文阐述引用的方式并入本文中。可如此专利申请案中描述那样进一步配置本文描述的实施例。

在另一实施例中,基于学习的模型经配置以用于使用获取的输出作为第一输入且使用用于样本的信息作为第二输出执行一或多个第一功能。举例来说,本文描述的实施例可包含神经网络,所述神经网络在利用CNN(例如,如由克里泽夫斯基在以上并入的参考中所描述)执行时可以更便宜的方式组合前端中的信息的通道,这是因为所述神经网络学习各种输入通道与所要输出结果之间的表示映射。由发明者执行的模型化已展示在基于电子束的裸片到数据库检测的情况中增加3个通道的计算花费仅为单个通道的成本的约15%到20%。此外,神经网络通常不具有分支及其它回路且因此通常快得多。

在一个此实施例中,用于样本的信息包含样本的设计数据。举例来说,本文描述的实施例可使用基于学习的模型的输入,所述输入包含样本的图像及/或图像数据或信号以及样本的设计数据。所述设计数据可包含CAD及/或从所述设计数据模拟的图像,例如配准的再现CAD图像。所述图像可与如本文进一步描述的设计数据一起使用。

在一些此类实施例中,基于学习的模型经配置以基于所述设计数据更改一或多个第一功能。举例来说,基于学习的模型可以其认为合适的方式(相对于将其视为再现/减去的常规方式)学习使用设计数据,从而作出稳健比较(例如,适应性阈值化)。在一个此实例中,在于一或多个第一功能中执行的缺陷检测的情况中,设计数据可用于利用样本的不同部分中的基于设计数据确定的一或多个参数(例如,阈值)执行缺陷检测。可通过基于学习的模型以任何合适的方式(例如,基于训练数据组及用于根据所述训练数据组执行一或多个功能的参数)学习用于在样本的不同部分中执行的一或多个功能的参数。

本文描述的实施例可经配置使得单个网络架构本质上在检验情况(例如,电子束检验)中解决三种不同使用情况:单个图像检测、分类及裸片到数据库检验。举例来说,在另一实施例中,一或多个第一功能包含将输出中的像素标记为与缺陷相关联或不与缺陷相关联。在额外实施例中,一或多个第一功能包含识别在样本上检测到的缺陷的分类。在一些实施例中,一或多个第一功能包含产生用于样本的参考,且一或多个第二功能包含将所述参考与输出作比较且基于所述比较的结果检测样本上的缺陷。最后一个使用情况是信息的额外通道是如何几乎不改变计算负担的实例,因为大多数成本来自是输入通道的下游的权重或参数。基于学习的模型还可以其认为合适的方式(相对于将其视为再现/减去的常规方式)学习使用设计数据,从而作出稳健的比较(例如,适应性阈值化)。这些步骤的全部可由基于学习的模型“在后台”一举执行。本文描述的实施例的优势就在于此。

将输出中的像素标记为与缺陷相关联或不与缺陷相关联可包含产生输出中的像素的分数,例如无缺陷分数(SND)及缺陷分数(SD)。像素的SND可因此表示所述像素处无缺陷的概率分数而像素的SD可表示所述像素处的缺陷的概率分数。将输出中的像素标记为与缺陷相关联或不与缺陷相关联可包含单个图像检测(SID),可如巴斯卡尔等人于2016年11月16日申请的第15/353,210号美国专利申请案中描述那样执行单个图像检测(SID),所述专利申请案以宛如全文阐述引用的方式并入本文中。可如此专利申请案中描述那样进一步配置本文描述的实施例。

在另一实施例中,一或多个第一功能包含将输出的至少一部分与参考对准。举例来说,本文描述的实施例可提供更快的对准。特定来说,两个图像之间的对准(许多检验算法的重要部分)可通过本文描述的实施例更快地完成。基本做法大体上可为相同的,例如使用若干已知较慢算法训练具有对准图像的基于学习的模型。在此情况中,我们可有意旋转且完成仿射变换以综合地从单个图像产生许多训练实例。用于训练基于学习的模型的“实况”可利用常规归一化互相关(NCC)算法、分层减少取样图像及基于特征的显著点算法获取。换句话说,可使用由常规较慢算法产生的结果且所述结果可被认为是“实况”。以此方式,本文描述的实施例可使用常规对准算法(例如NCC或特征提取或任何此方法)训练基于学习的模型,所述算法可通过利用已知偏移、旋转等等综合地转变图像输入而扩充。所以,举例来说,为了对准两个图像,典型做法是使用NCC,其获取图像A及模板B且执行逐像素卷积操作(偏移通过对准搜索,因此窗可为5像素乘5像素以考虑5像素的偏移)。接着,针对峰值检查所得图像C以识别在其中出现最大值的偏移。执行对准的另一方式是通过“特征提取或显著特征检测”。举例来说,特征及显著特征(例如隅角)可通过一些对准算法提取且接着用于使得图像彼此对准。所以,总的来说,在训练期间,我们可使用较慢算法,如NCC或显著点检测,来产生多个人工错位且训练基于学习的模型以检测所述错位。基于学习的模型学习复杂参数,包含其针对精插补需要做的事。基于学习的模型将具有更少的参数且更快,因为其为深度神经网络或本文描述的另一基于学习的模型。此模型可为关于生成做法(例如,如在以上以引用的方式并入的张的参考专利申请案),但所述算法通常寻找简单仿射变换(dx、dy、drotation或dwrap)。

在另一实施例中,一或多个第二功能包含基于模拟输出检测样本上的缺陷。举例来说,可使用本文描述的基于学习的模型加速额外算法。在一个实例中,可使用本文描述的实施例加速由购自科磊公司的一些商用检验系统使用的激光DF HLAT算法。举例来说,在一些DF检验工具中存在多个(例如,三个)通道。本文描述的实施例可经配置以利用常规HLAT算法教示本文描述的基于学习的模型、扩充HLAT算法以使得系统稳健且接着使用更便宜的系统进行推理。典型GPU具有7TFLOPS的数据,而常规CPU具有2到3TFLOPS的数据。为了推理目的,在无用于直方图的昂贵分支及回路的情况下,可能实现2.5倍的最大值且潜在地具有10倍加速。

在一些实施例中,由一或多个检测器针对样本产生的输出包含在多个模式中产生的输出。举例来说,本文描述的系统通常具有多传感器输入,例如(但不限制于)CCD显微镜成像系统的RGB,电子束复检及检验中的多个视角、激光扫描检验系统情况中的多个集光器及BBP检验器情况中的图块的多个循序收集。此系统的计算由等于其感测输入(RGB)的因子膨胀或由抓取物(N个图块)的循序本质延迟。此类系统是由本文描述的实施例替代的候选者。举例来说,本文描述的实施例可包含基于学习的模型(例如神经网络或本文描述的其它基于学习的模型),其在利用CNN(例如,如由克里泽夫斯基在以上并入的参考中所描述)执行时可以更便宜的方式组合前端中的信息的通道,这是因为基于学习的模型学习各种输入通道与所要输出结果之间的表示映射。由发明者执行的模型化已展示在基于电子束的裸片到数据库检测的情况中增加3个通道的计算花费仅为单个通道的成本的约15%到20%。此外,基于学习的模型(例如神经网络)通常不具有分支及其它回路且因此通常快得多。

在一个此实例中,在多视角电子束图像的情况中,相较于使得相同算法在所有不同通道上平行执行,基于学习的模型可经训练以在输入通道本身处融合数据且将仅导致15%的额外成本(相对于3通道的300%)。在另一此实例中,在用于在大体上成本敏感市场中操作的激光扫描系统的多个集光器的情况中,计算的多个平行通道将仅在训练时期期间使用(使用例如HLAT算法)且将由在推理期间用于缺陷检测的基于学习的模型替代。

在另一实施例中,一或多个计算机子系统经配置以用于由包含于额外工具中的一或多个额外检测器获取针对额外样本产生的额外输出,所述额外工具经配置以用于在额外样本上执行过程,所述基于学习的模型经配置以用于使用获取的额外输出作为输入执行一或多个第一功能以借此针对额外样本产生模拟输出,且一或多个计算机子系统经配置以用于使用所述模拟输出针对额外样本执行一或多个第二功能。举例来说,本文描述的实施例可配置为包含可在机器的一些家族之间共享使得系统的相对较昂贵的训练部分可在一些平台上摊销的多个GPU及CPU的集中系统。所述工具及额外工具可为相同类型(例如,相同做法及模型)。因此,检测器及额外检测器可具有相同配置。输出及额外输出还可为相同类型(例如,输出及额外输出两者可为图像信号)。以此方式,一旦已如本文描述那样训练基于学习的模型,那么所述基于学习的模型可用于使用仅由工具或多个工具产生的输出针对样本执行一或多个第一功能。

除了以上描述的一或多个第二功能外,一或多个第二功能可取决于一或多个第一功能而不同。举例来说,如果一或多个第一功能包含缺陷检测,那么一或多个第二功能可包含基于一或多个第一功能的结果产生样本的检验结果及/或使用所述缺陷检测的结果执行一或多个额外功能。一或多个第二功能还可使用常规(或非基于学习的算法及/或方法)执行。举例来说,如果所述一或多个第一功能包含缺陷检测,那么一或多个第二功能可包含使用非基于学习的方法及/或算法执行的缺陷分类。然而,可使用基于学习的模型执行一或多个第二功能。因此,可利用不同基于学习的模型针对样本执行不同功能,所述模型中的每一者可如本文描述那样进行训练及/或配置。在一个此实例中,一或多个第一功能可包含利用第一基于学习的模型执行的缺陷检测,且一或多个第二功能可包含利用第二基于学习的模型执行的缺陷分类。

本文描述的额外实施例可经配置以用于利用多个输入数据组的基于机器学习的配方优化。举例来说,本文进一步描述的实施例可经配置以用于使用许多输入数据组的自动配方优化,且可能具有最小用户介入。

在用于配方优化的目前使用的方法及系统中,用户执行初始配方的设置且在一个晶片或至多在一些晶片上执行所述初始配方。通常复检且分类小于100%的缺陷。目前使用的自动分类技术仅取决于缺陷复检图像(例如,SEM图像),且未运算缺陷复检图像(例如,SEM图像)与检验图像(例如,光学图像)之间的相关分数。目前使用的方法无法处理大量数据组。

目前使用的方法及系统因此具有大量缺点。举例来说,目前使用的方法缺少统计数据,尤其为如果缺陷十分难以捕捉且仅若干复检的缺陷实际上是受关注的缺陷(DOI)。另外,优化仅在若干晶片上执行,因为在更多晶片上完成优化是非常费时的。配方有时还经错误优化,因为未执行或未在足够实例上执行缺陷复检图像与检验图像的相关性(例如,SEM与光学图像相关性)。

在一个实施例中,一或多个计算机子系统经配置以用于利用从一或多个非基于学习的算法产生的结果训练基于学习的模型,在由基于学习的模型执行一或多个第一功能之前执行所述训练,且从一或多个非基于学习的算法产生的结果包含缺陷分类结果。举例来说,本文描述的实施例可经配置以用于产生将用于获得大体上稳定的干扰抑制分类符的许多数据。可如本文进一步描述那样在此实施例中执行训练。可如本文进一步描述那样产生缺陷分类结果。

在一个此实施例中,通过以下操作产生缺陷分类结果:在另一样本上执行热扫描以借此检测其它样本上的缺陷;复检检测的缺陷的至少一部分;且使用所述复检的至少结果分类检测的缺陷的至少所述部分。举例来说,检验输出可与子像素准确性图块的设计数据对准以设计随后将SEM图像与光学图像对准的对准或界定围绕缺陷的用于运算局部属性或甚至获得新属性的大体上较小的区域。可如库尔卡尼等人的以上参考专利中描述那样执行将检验输出与设计数据对准。一旦检验输出已与设计数据对准,那么缺陷复检图像还可与设计数据对准。因此,设计数据可充当为检验输出及缺陷复检输出的共同参考且将所述两个输出与共同参考对准,借此使得两个输出彼此对准。局部及新属性可包含接近缺陷定位(例如,处于与缺陷相同的位置及/或与缺陷相邻)的设计的缺陷及/或图案化特征的属性。另外,热扫描可在样本上执行,且可复检所报告的位点。“热”扫描通常可界定为其中使用大体上较低的阈值(例如,由检验系统针对样本产生的输出的噪声底限处或或附近的阈值)检测样本上的缺陷的过程。在复检期间,测试及参考图像经收集且用于运算不同图像(例如,通过从其对应测试图像减去参考图像)。将缺陷复检图像与设计对准。通过使用设计坐标,可将缺陷图像与检验图像准确地重叠。

在一些此类实施例中,由用户执行分类检测的缺陷的至少一部分。举例来说,用户可分类部分缺陷以产生用于基于学习的模型的学习数据组以处理数据。在另一实例中,用户可分类所有缺陷以产生学习数据组。用户可使用任何合适的方法及/或系统以任何合适的方式执行分类检测的缺陷的至少一部分。替代地,可在图块图像上执行深度学习以分类缺陷。举例来说,基于学习的模型(例如本文描述中的一者)可经配置且训练以分类样本上的缺陷。

在另一此实施例中,一或多个第一功能包含预测哪些利用输出检测的缺陷是DOI。举例来说,一旦基于学习的模型足够稳定,那么其将预测哪些由检验检测的缺陷最可能是DOI。可如本文进一步描述那样执行预测利用输出检测的哪个缺陷是DOI。

在一个此实施例中,基于从输出确定的缺陷属性执行所述预测。在另一此实施例中,基于输出执行所述预测。在另一此实施例中,基于从输出产生的图像执行所述预测。举例来说,基于学习的模型可使用缺陷复检及/或检验工具中的缺陷属性或图像数据(包含测试、参考及/或不同图像)。以此方式,如本文进一步描述的训练的基于学习的模型可用于执行许多晶片及晶片批次中的缺陷的自动分类。

在一个实施例中,基于学习的模型经配置以基于针对在多个批次中的多个样本产生的检验过程的结果而产生用于样本的所述检验过程的干扰滤波的分类符,且检验过程的结果包含图像特性、缺陷属性或其组合。举例来说,本文描述的实施例可经配置以用于获得大体上稳定的配方优化参数。在一个此实例中,图像特性以及缺陷属性可从许多晶片及许多晶片批次中的缺陷收集。基于学习的模型可用于基于允许找出大体上稳定的属性及大体上可靠的阈值设置的此大量数据而产生用于干扰滤波的分类符。图像特性可包含可从由检验产生的输出确定的任何基于图像的输出的任何特性。缺陷属性可以任何合适的方式确定且可包含任何合适缺陷属性。

在另一实施例中,基于学习的模型经配置以基于针对多个批次中的多个样本产生的检验过程的结果而产生用于检测样本的检验过程的缺陷的差分滤波器,且检验过程的结果包含图像特性、缺陷属性或其组合。举例来说,本文描述的实施例可经配置以用于获得大体上稳定的配方优化参数。特定来说,基于学习的模型可用于运算优化差分滤波器以检测缺陷且将此信息连同优化分类符及取样策略一起返回馈入到检验系统。图像特性可包含可从由检验产生的输出确定的任何基于图像的输出的任何特性。缺陷属性可以任何合适的方式确定且可包含任何合适缺陷属性。

以上描述的实施例相比目前使用的方法及系统具有数个优势。举例来说,我们将不必花时间查看与基于学习的模型可查看的图块图像一样多的图块图像。本文描述的实施例还可在现存软件中实施,例如购自科磊公司的Klarity软件或在可收集且观看光学图块图像及SEM图像的情况下作为此软件的补充。此外,由于在例如Klarity的软件中可用的大量数据(例如,数百晶片而非仅工具上的一个晶片),所以可作出用于线内分类符及阈值设置的统计学上有意义的预测且可识别大体上稳定的缺陷属性。在检验期间使用本文描述的新基于学习的模型将改进检验对关键(重要)DOI的敏感度。找出关键DOI可为检验工具的用户节省数百万美元。

以上描述的系统中的每一者的实施例中的每一者可共同组合成一个单个实施例。

另一实施例涉及一种用于使用针对样本模拟的输出针对所述样本执行一或多个功能的计算机实施方法。所述方法包含由包含于工具中的一或多个检测器获取针对样本产生的输出,所述工具经配置以在样本上执行过程。所述方法还包含使用所得输出作为基于学习的模型的输入执行一或多个第一功能以借此产生样本的模拟输出。所述基于学习的模型包含于由一或多个计算机子系统执行的一或多个组件中。另外,所述方法包含使用模拟输出针对样本执行一或多个第二功能。由所述一或多个计算机子系统执行所述一或多个第二功能。

可如本文进一步描述那样执行方法的步骤中的每一者。所述方法还可包含可由本文描述的系统、计算机子系统、组件及/或模型执行的任何其它步骤。可根据本文描述的实施例中的任何者分别配置一或多个计算机系统、一或多个组件及模型,例如计算机子系统102、组件100及模型104。另外,可由本文描述的系统实施例中的任何者执行以上描述的方法。

额外实施例涉及一种存储程序指令的非暂时性计算机可读媒体,所述程序指令可在一或多个计算机系统上执行以用于执行计算机实施方法,所述计算机实施方法用于使用针对样本模拟的输出针对所述样本执行一或多个功能。在图2中展示一个此实施例。特定来说,如图2中所展示,非暂时性计算机可读媒体200包含可在计算机系统204上执行的程序指令202。所述计算机实施方法可包含本文描述的任何方法的任何步骤。

实施例如本文描述的方法的程序指令202可存储于计算机可读媒体200上。所述计算机可读媒体可为存储媒体,例如磁盘或光盘、磁带或所属领域中已知的任何其它合适的非暂时性计算机可读媒体。

程序指令可以各种方式中的任何者实施,包含基于程序的技术、基于组件的技术及/或面向对象的技术等等。举例来说,程序指令可根据需要使用ActiveX控件、C++对象、JavaBeans、微软基础类别(“MFC”)、SSE(串流SIMD扩展)或其它技术或方法论实施。

计算机系统204可根据本文描述的实施例中的任何者配置。

所属领域的技术人员鉴于此描述将明白本发明的各种方面的进一步修改及替代实施例。举例来说,本发明提供用于使用针对样本模拟的输出针对所述样本执行一或多个功能的方法及系统。据此,本描述将解译为仅为阐释性的且是为了教示所属领域的技术人员实施本发明的一般方式的目的。应了解,本文展示及描述的本发明的形式将被视为当前优选实施例。所属领域的技术人员将在受益于本文发明的描述之后明白,元件及材料替代本文说明及描述的元件及材料,可颠倒部件及过程,且可单独利用本发明的某些特征。在不违背所附权利要求书中描述的本发明的精神及范围的情况下对本文描述的元件作出改变。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号