搭配Hadoop巨量储存架构 半导体设备提高生产效能
|
半导体制程迈入20奈米以下技术节点后,良率、生产周期及成本管控的挑战更加艰钜;新式Hadoop资料储存架构可让半导体厂以更低成本达成巨量资料储存,进而利用深入的统计分析实现更精准有效的设备管理,提高产线运作效率。 近年来,为收集更多感测器资料,长时间保留资料,并加以有效运用,制造商面对不断加重的挑战。例如最先进晶圆厂的工具感测器和故障侦测生产资料库,保留资料1至3个月需要20?30兆位元组的储存容量。随着产业转移至20奈米以下技术制造和新世代工具,情况将加剧。 收集和储存资料,对于达到必要的良率、生产周期时间和成本至关重要,但这只是资料问题的一部分。另外更重要的是,如何经由快速及具成本效益来分析这些资料,改善机台的效能和工厂产出的良率即时的资料分析,对于找出最佳化机会、大幅加快目前的速度,具绝对关键性影响。 所幸资料管理、资料分析技巧和预测技术的演进,为半导体产业提供满足这些需求、具有前景的全新解决方案。 传统感测器储存 无法处理巨量资料 感测器及统计资料所使用的分析软体,必须使用一或多个工具、特定时间范围、感测器、统计资料、配方表、批量、晶圆组合等构成的述词,进行资料库查询。但目前的资料储存策略,以述词查询巨量资料(Big Data)集,无法获得最佳结果。因此,资料大规模成长导致严重问题,影响感测器资料的储存,也无法有效执行分析查询。 首当其冲的问题是,要将来自数百或甚至数千个工具的资料传送到中央储存系统,需有高效能的储存系统。但以目前的储存技术与价位,要储存数百TB的资料,将大幅提高晶圆厂级设备工程解决方案(EES)的基础设施成本。以400兆位元组的企业级中央储存系统为例,每兆位元组所需成本,是具备类似备援功能同等级本机附加储存的四倍之多。 第二个问题是,多数感测器资料的结构与储存,都采用传统关联式的列与栏方式。但资料容量暴增后,这项方式却无法随着最新故障侦测、预测及产能分析应用程式扩充,达到所需效能等级。运用传统关联式资料处理技术处理大量资料,成本将高得惊人,严重影响新世代应用的投资报酬率。 Hadoop有效处理巨量资料 过去几年里,资料管理技术方面的进展,为社交媒体、零售及财务等须管理大量资讯的产业开启可能性,能以更有效率的方式,管理感测器及其他半导体制造资料。举例来说,其中一个解决方案是Apache Hadoop,这是一种开放源码软体架构,用于储存及处理分散于硬体商品丛集上的大量资料。其概念可兼顾大量资料储存,同时以更低的成本,加速完成资料处理。此开放源码软体平台,主要包含Hadoop分散式档案系统(HDFS)和运算架构,可于分散式档案系统上平行运算。Hadoop分散式档案系统,可从数十扩充到数千台伺服器商品,将庞大资料集大范围散布至本机附加储存,大幅降低储存成本。 查询资料时,运算架构将于大量资料节点上平行处理资料,将扫描大量资料集所需处理时间缩至最短;Hadoop平台上还有其他辅助技术,可协助有效执行资料消化、储存、运用结构化的查询语言(SQL)查询资料,提供安全性和类似企业资料处理需求。 Hadoop 资料储存,可解决目前制造环境的多项问题。首先Hadoop分散式档案系统,可加入低成本的储存装置扩充资料储存,因此成本仅为集中系统资料储存成本的四分之一。其次,拥有较大的资料储存,制造作业可保留及查询的资料集,比传统集中储存库时间更长、范围更大。目前有些自动化和设备工程系统公司提出要求,希望能查询最长达两年的资料,其中所牵涉的问题从变异控管,转变为更深入的资料分析。 |








