1. 서 론
반도체 제조 산업은 고도의 미세 공정 기술과 대규모 투자를 통해 발전해 왔으며, 공정 안정성과 제품 수율 확보가 경쟁력의 핵심 요소로 인식된다(Park et al., 2018). 특히 반도체 공정 중 화학기상증착(CVD, Chemical Vapor Deposition)은 기판 위에 균일한 박막을 형성하는 과정으로, 온도, 압력, 반응 가스 유량, 전력 등 센서 변수의 미세한 변동이 최종 품질에 치명적 영향을 줄 수 있다. 따라서 CVD 공정 내의 극미세 이상을 조기에 탐지하여 품질 향상을 도모하기 위한 연구가 활발히 진행 중이다(Baek et al., 2021).
과거에는 통계적 공정관리 기법(SPC)과 전문가의 경험적 판단을 주로 사용했으나, 반도체 기술의 발전으로 센서 데이터의 양과 복잡성이 급격히 증가하면서 기존 방법만으로는 복합적 데이터를 효과적으로 분석하기 어려워졌다(Chen, 2018; Patel et al., 2024). 이에 따라 인공지능(AI)과 빅데이터 분석 기법이 제조 현장에 활발히 도입되고 있으며, Isolation Forest, One-Class SVM, k-NN 등 다양한 머신러닝 기반 이상탐지 기법들이 사용되고 있다(Liu et al., 2008). 그러나 이러한 기법들은 센서 간의 복잡한 상호작용을 충분히 반영하지 못해 복합 제조 환경에서 성능이 제한적이다(Cho and Baek, 2012).
최근 상관관계를 효과적으로 학습할 수 있는 그래프 신경망(GNN)이 주목받고 있다. 본 연구는 이러한 GNN의 특성을 활용하여 국내 주요 반도체 제조 기업의 실제 CVD 공정 데이터에 이상탐지 모델을 적용하고, 성능을 검증하였다. 구체적으로 3개월 동안 FDC 시스템을 통해 수집된 데이터를 활용하여 비지도학습 기반 GNN 모델을 적용하였으며, 기존의 Isolation Forest, One-Class SVM, k-NN 알고리즘 등과 성능 비교를 진행하였다. 성능 평가는 F-1 Score, Precision, Recall의 지표로 이루어졌으며, 근본 원인을 시각화하여 현장 엔지니어의 이해도와 실제 현장에서 품질경영 개선 성과를 함께 도출하였다.
본 연구의 의의는 다음과 같다. 첫째, 센서 간 복잡한 관계를 그래프 구조로 명시적으로 모델링하여 기존 방법의 한계를 극복하였다. 둘째, 실제 산업 데이터를 활용한 실증적 연구로, 현장 적용 가능성을 제시하였다. 셋째, 성능 향상 및 근본 원인 시각화를 통해 품질경영과 스마트 제조 현장에 실질적인 시사점과 기여를 제공하였다.
2. 이론적 배경 및 선행 연구
2.1 반도체 CVD 공정과 센서 데이터
반도체 제조 공정 중 화학기상증착(CVD, Chemical Vapor Deposition)은 기판(웨이퍼) 위에 반응 가스를 공급하여 원하는 물질을 박막 형태로 증착하는 핵심 단계이다(Chen et al., 2020). 증착되는 박막의 두께, 균일도, 조성 등을 정밀하게 제어해야 하므로, 공정 환경(온도, 압력 등)에 대한 엄격한 관리가 필요하다. 일반적으로 CVD 공정은 반응 챔버 내에 반응 가스를 투입하고, 고온·저압 또는 고온·고압 상태에서 기판 표면에 화학반응을 유도하여 박막을 형성하는 절차로 이루어진다(Ha et al., 2024). 이 과정에서 사용되는 반응 가스의 종류, 챔버 온도, 반응 시간, 가스 유량 등의 변수가 서로 유기적으로 작용하여 최종 박막 특성이 결정된다. CVD 공정에서 수집되는 센서 데이터는 온도(챔버 내부·벽면 온도, 히터 온도 등), 압력(반응 챔버 내부 압력), 가스 유량(특정 반응 가스 혹은 캐리어 가스 유량), 전력(플라즈마 CVD의 경우 전극 전력), 그 외 장비 동작 상태나 밸브 상태 등으로 다양하다. 이러한 데이터는 초 단위 혹은 그 이하의 세밀한 간격으로 기록되며, 다변량·시계열 형태로 축적된다(Ha et al., 2024). 이러한 센서 데이터는 개별적으로도 의미가 있지만, 실제 공정 환경에서는 센서 간 상관관계가 매우 중요한 역할을 한다. 예를 들어 압력이 낮아지면 가스 유량이나 온도 제어에 변동이 생길 수 있으며, 이러한 변화가 공정 불량의 초기 징후로 작용한다(Baek and Kim, 2023). 따라서 센서 데이터를 단순히 개별 차원으로 모니터링하는 것만으로는 이상탐지 정확도가 떨어질 수 있고, 센서 간 상호작용까지 고려해야 보다 정밀한 결함 예측이 가능해진다(Baek, 2024).
반도체 제조 현장에서는 보통 FDC(Fault Detection and Classification) 시스템을 사용하여 공정 데이터를 모니터링하고 기본적인 통계 분석을 수행한다. FDC 시스템은 주로 공정 변수가 관리 한계를 벗어나는지 여부를 확인하거나, 사전에 정의된 규칙 기반으로 이상신호를 감지하는 방식으로 운영되는 경우가 많다(Chen, 2018; Patel et al., 2024). 그러나 기존 FDC 방식은 통계적 관리도 또는 단순 임계값 판단에 주로 의존해, 센서 간 상호작용이 복잡하게 얽힌 상황에서 발생하는 미세한 이상 징후를 놓칠 수 있다. 특히 고차원·시계열 데이터를 통합적으로 분석하여 이상 패턴을 조기에 감지하고 원인을 추적하는 데에는 한계가 존재한다(Ha et al., 2024).
2.2 이상탐지(Anomaly Detection)의 개념 및 기존 방법
이상탐지란 정상 데이터 패턴과 현저히 다른 샘플(또는 이벤트)을 식별하는 과정을 말한다(Breuning et al., 2000; Wu et al., 2021). 반도체 공정에서는 불량 사태를 미연에 방지하거나 품질 저하를 최소화하기 위해 이상징후를 조기에 감지하는 것이 핵심이다. 기존에 활용하고 있는 통계적 공정관리(SPC)는 통계적 기법과 관리 차트를 이용하여 제조 공정의 품질을 관리하고 이상을 탐지하는 전통적이고 널리 사용되는 기법이다(Chen et al., 2018). SPC는 공정 데이터의 변동성을 통계적으로 분석하여 이상 상태가 발생했을 때 관리 차트의 설정된 관리 한계를 벗어나는지를 판단하는 방법론이다. 단순한 공정 상태 모니터링 및 명확한 통계적 근거를 기반으로 하여 반도체 제조 현장에서도 폭넓게 사용되어 왔다. 하지만 최근의 반도체 제조 공정은 다변량 특성, 센서 데이터 간 복잡한 상호작용 및 시계열적 변동성 증가로 인해, 전통적 SPC 기법이 갖는 근본적인 한계를 드러내고 있다. 구체적으로, SPC는 단일 변수 또는 소수의 관리 변수에 초점이 맞추어져 있어 여러 센서 간 복잡한 상호작용을 포착하기 어렵고, 정적인 관리 한계를 사용하기 때문에 동적이고 미세한 변화가 잦은 현대적 제조 공정 환경에서는 높은 오진(False Positive)과 미탐(False Negative)의 문제를 자주 초래한다(Seo et al., 2021).
기술의 발전에 따라 보다 복잡한 데이터 구조와 높은 차원을 다룰 수 있는 머신러닝 및 딥러닝 기반 접근이 늘어나고 있다. 실제 제조 현장에서 널리 사용되고 있는 기존의 대표적인 이상 탐지 기법은 Isolation Forest, One-Class SVM, k-NN 기반 이상탐지, Local Outlier Factor, Autoencoder, DBSCAN 등이 있다(Baek and Lee, 2022).
Isolation Forest는 트리 기반의 분리 방식으로 빠르게 이상을 판별할 수 있으며, 노이즈와 결측치에 비교적 강인하다는 장점이 있다(Liu et al., 2008).그러나 데이터 분포가 복잡할 경우 세밀한 조정이 어렵고, 근본 원인 분석에 한계가 있다. One-Class SVM은 정상 데이터만을 이용해 경계를 형성하는 방식으로 이상 라벨이 부족한 상황에서도 사용이 가능하며, 계산 절차가 비교적 단순하다(Schölkopf et al., 2001; Baek and Kim, 2023). 그러나 고차원 시계열 데이터에서 커널 선택과 파라미터 조정이 어렵고, 센서 간의 관계를 반영하기 힘들다(Park et al., 2018). k-NN 기반 이상탐지는 개념이 단순하고 별도의 학습 과정 없이 거리 기반으로 이상을 판단할 수 있으며, 민감도 조절이 가능하다(Angiulli and Pizzuti, 2002; Cohen et al., 2024). 다만 데이터의 크기가 커질수록 탐색 비용이 증가하고, 복잡한 시계열 관계를 반영하는 데 한계가 있다. LOF(Local Outlier Factor)는 국소 밀도 차이를 활용하여 지역적 이상을 포착할 수 있으며, 비교적 간단하게 구현 가능하다(Breunig et al., 2000). 하지만 대규모 데이터에서 계산량이 커지며, 시계열 연결성과 그래프 구조 해석이 부족하다. Autoencoder는 재구성 오차를 기반으로 이상을 판단하여 직관적인 결과를 제공하며, 비선형적인 패턴 학습에 유리하다(Zong et al., 2018). 그러나 센서 간 상호작용이나 채널 간 관계를 직접적으로 반영하지 못하며, 양불 정보가 전무한 상황에서는 과적합 위험이 존재한다. DBSCAN은 밀도 기반으로 클러스터와 이상치를 자동으로 구분할 수 있으며, 임의의 형태의 클러스터 탐지가 가능하고 라벨이 없는 상황에서도 적용이 가능하다(Ester et al., 1996; Choi et al., 2022). 그러나 매개변수 설정에 민감하고, 고차원 시계열 데이터나 대규모 그래프 환경에서는 확장성이 떨어진다.
이와 같은 다양한 딥러닝·머신러닝 기법들은 제조 공정 전반에 걸쳐 적용이 시도되고 있으나, 센서 간 관계 구조를 명시적으로 반영하기가 쉽지 않으며, 데이터를 고차원 시계열 형태로 볼 때 오탐지와 미탐지 사이의 균형이 어렵다는 지적이 있다. 이로 인해 현실 산업 현장에서는 여러 알고리즘을 혼합하거나, 전처리 및 후처리 단계를 추가하여 최적화하는 형태로 운영되는 경우가 많다(Lee and Kim, 2022).
2.3 그래프 신경망(GNN, Graph Neural Network) 기반 근본 원인 시각화
그래프 신경망(GNN)를 활용해 센서 간 상호관계를 모델링하면, 단순 경고를 넘어서 어느 센서가 이상 상태를 주도하고 있는지를 시각적으로 확인할 수 있다(Deng and Hooi, 2021). 특히 센서 식별자(SVID, Status Variable Identifier)를 노드로 표현하고, 센서 간 인과관계나 물리적·통계적 연관성을 엣지로 연결하면, 이상 현상이 어떤 경로를 통해 다른 센서들에게 전파되고 있는지를 한눈에 파악할 수 있다(Hasan et al., 2024).
근본 원인 시각화 기법은 GNN이 내부적으로 학습한 메시지 패싱 과정을 바탕으로, 노드(센서) 임베딩과 엣지(센서 간 관계)의 가중치를 사용자 친화적으로 풀어낸 결과물이다(Wu et al., 2022). 노드의 색상이나 크기는 모델이 추정한 이상 기여도, 혹은 Attention 메커니즘을 적용한 경우 그 중요도 등을 반영하며, 엣지 두께나 방향은 센서 간 상호작용의 세기 혹은 방향성을 시사할 수 있다. 예컨대 노드가 붉은색으로 크게 표시되어 있다면, 공정 엔지니어나 품질 관리 담당자는 해당 센서를 먼저 점검해 문제가 되는 파라미터(온도, 압력 등)를 즉각적으로 확인할 수 있다.
이처럼 근본 원인 시각화를 적용하면 이상 징후가 단발적으로 끝나는지, 또는 여러 센서를 연쇄적으로 거치면서 전체 공정에 파급효과를 미치는지 쉽게 파악할 수 있다. 이는 기존에 단순 경보 신호나 지표 수치만 제공하던 FDC 시스템의 제한점을 보완하여, 사용자가 문제 지점을 한눈에 식별하고 신속히 대처하도록 돕는 장점을 지닌다. 실제 운영 환경에서는 이러한 그래프를 실시간으로 업데이트하거나, 시간 순서대로 스냅샷을 생성해 이상 현상이 발생·확산·완화되는 과정을 단계적으로 추적하는 방식으로 확장할 수 있다(Ha et al., 2021).
다만 그래프 네트워크 기반 시각화를 실제 공정에 도입할 때는, 센서 노드와 엣지 구성 방식에 대한 사전 정의가 중요하다(Wu et al., 2022). 물리적 연결관계나 상관계수 임계값 등을 토대로 그래프를 구성할 수 있으나, 공정별 특성과 센서 설계가 천차만별이므로, 각 환경에 맞는 기준을 적용해야 한다. 또한 그래프가 복잡해지면 시각적 해석이 어려워질 수 있으므로, 센서 중요도나 이상점수에 따라 노드를 적절히 필터링·강조하는 인터랙티브 시각화 기법을 병행하는 방안도 고려할 수 있다. 결과적으로, GNN으로 학습된 그래프 구조를 이용해 이상 발생 원인을 시각화하는 접근법은 센서 간 역학관계를 직관적으로 보여주어, 현장 엔지니어가 단순히 불량 발생을 인지하는데 그치지 않고 ‘왜, 어디에서, 어떻게 문제를 일으키는가’를 깊이 이해하게 만들어 준다(Wu et al., 2022). 다음 장에서는 이러한 GNN 기반 이상탐지 및 시각화 개념을 실제 반도체 CVD 공정 데이터에 적용하고, 주요 알고리즘과의 성능 비교 결과를 제시한다.
3. 사례 연구
3.1 사례 연구 단계
본 논문에서는 비지도학습 기반 그래프 신경망을 활용한 이상탐지 AI 솔루션이 반도체 CVD 공정의 다차원·시계열 데이터를 통합적으로 분석하여 이상 패턴을 조기에 감지하고 원인을 추적할 수 있는지 확인하고자 한다. 실제 현장 센서 데이터 수집 및 분석 환경을 구축하여 기존 반도체 제조 CVD 공정 라인에 적용하였다. 기존의 반도체 제조 현장에서는 공정 엔지니어들이 이상 여부를 통계적 관리기법 및 경험 기반으로 개별적으로 판단하는 방식이었으나, 본 연구에서 적용한 그래프 신경망 기반의 이상탐지 AI 솔루션을 통해 자동화된 센서 데이터 분석 및 실시간 이상 검출이 가능해졌다. 이를 통해 기존 방식에 비해 더욱 정확하고 신속한 이상 탐지와 근본 원인 분석(RCA, Root Cause Analysis)이 이루어져 제조 공정의 불량률 감소, 품질 관리 효율성 향상과 같은 효과를 얻을 수 있었다. 본 사례 연구는 Table 1과 같이 4단계 접근 방법을 설정하여 진행하였다.
본 연구의 사례를 통해 그래프 신경망을 활용한 AI 이상 탐지 기술이 실제 제조 현장의 복잡한 센서 데이터 처리 및 품질 관리 대응을 위한 효율적이고 신뢰할 수 있는 방법임을 입증하였으며, 향후 유사한 제조 공정의 AI 솔루션 적용 및 확산을 위한 실증적 근거를 제공하였다.
3.2 CVD 공정 데이터 수집 및 분석
본 연구는 국내 주요 반도체 제조 기업인 A사의 실제 생산 공정에서 약 3개월 동안 운영된 화학기상증착(CVD) 공정 장비에서 FDC 시스템을 통해 수집된 데이터를 사용하였다. 데이터 수집 과정에서 활용된 센서들은 온도, 압력, 가스 유량, 전력 등을 포함하는 13개의 핵심 상태 변수 식별자로 구성되어 있으며, 각 센서는 초 단위로 연속적인 시계열 데이터로 이뤄져 있다. 데이터는 장비 엔지니어의 의견 및 공정 영향도 분석을 통해 총 10,000개의 샘플 웨이퍼 데이터를 확보하였으며, 샘플 웨이퍼 데이터는 정상 웨이퍼 그룹과 불량 웨이퍼 그룹 그리고 부품 교체(PM, Preventive Maintenance) 후 정상 웨이퍼 그룹으로 이뤄져 있다.
본 논문에서 사용된 데이터는 반도체 제조 산업의 민감성과 국가 핵심 기술 보호 정책에 따라 대외비로 관리되는 실제 제조 공정 데이터로서, 상세한 센서 구성과 각 센서의 세부적인 수치 및 공정 파라미터에 대한 정보는 보안 유지 목적상 공개할 수 없음을 밝힌다.
이렇게 확보된 데이터는 본 연구의 비지도학습 기반 그래프 신경망 이상탐지 모델의 설계, 학습 및 성능 검증을 위한 목적으로 제한적으로 사용되었다. 수집된 10,000개의 샘플 웨이퍼 데이터 중 현장 공정 엔지니어의 판정과 라벨링 과정을 거쳐 정상 샘플 웨이퍼 2,000개와 불량 샘플 웨이퍼 1,000개로 총 3,000개의 웨이퍼를 선별하였다. 선별된 정상 샘플 웨이퍼 2,000개는 부품 교체 전후 정상 웨이퍼 데이터로 각각 1,000개씩 구성되어 있다. 10,000개의 샘플 데이터는 이상탐지 AI 솔루션을 개발하는데 사용되었고, 선별된 총 3,000개의 웨이퍼는 성능을 평가하는데 사용되었다.
3.3 이상탐지 AI 솔루션 적용
본 연구에서는 반도체 공정 장비의 실시간 센서 데이터를 분석하여 공정 이상 및 생산품 불량을 판정하기 위하여 비지도 학습 기반 그래프 신경망을 활용한 이상탐지 솔루션을 적용하였다. 이를 위해 공정 센서 데이터와 사전 정보를 활용한 학습 및 평가 과정을 아래와 같이 설계하였다.
우선, 학습 과정의 입력으로 도메인 기반 공정 센서 데이터의 사전 정보와 선별된 정상 데이터 군집을 활용하였다. 센서 데이터 간의 상호작용 관계에 대한 사전 정보를 초기값으로 설정하고, 이를 학습 과정에서 교호 관계를 추출하는 데 반영하였다(Ha et al., 2021). 학습 단계에서는 LSTM(Long Short-Term Memory) 계층을 활용하여 센서 데이터의 시간적 상태 변화를 고려한 특징을 Embedding 단계에서 추출하였다(Lee and Kim, 2022). 이후 추출된 센서 데이터의 특징과 센서 간 교호 관계 정보를 Attention 메커니즘과 결합하여 입력된 센서 데이터를 복원하였다. 본 모델은 초기 그래프 구성 시 사전 정의된 센서 연결 관계를 기반으로 약식 엣지를 설정하되, 학습 과정에서는 Attention Weight를 통해 각 센서 간 관계의 중요도를 동적으로 추출하였다. 이때 학습된 Self-Attention Weight는 센서 간의 실질적인 영향도를 정량화하며, 센서 간 정보 교환을 조절하는 핵심 가중치로 작동한다. 이를 통해 단순 통계적 연관이 아닌 시간적, 구조적 연관 기반의 설명 가능한 센서 네트워크가 구성된다. 또한, 불필요한 엣지를 제거하고 의미 있는 센서 관계만을 학습하도록 설계하여 이 과정에서 입력 데이터와 복원 데이터 간의 복원 오차를 최소화하는 방향으로 모델을 학습하였다(Zong et al., 2018).
이상 탐지 및 이상 모니터링 과정에서는 학습 데이터에 대한 복원 오차의 최대값을 기준으로 Threshold를 설정하여 신규 발생 데이터의 복원 오차가 이를 넘어가면 이상으로 판정하였다. 이는 일반적으로 정상 데이터가 이상 데이터에 비해 비약적으로 많은 반도체 제조 공정에 활용될 수 있도록 오랜 기간 축적된 정상 데이터와 다른 것을 이상으로 탐지하는 One-Class Classification의 일환으로 상대적으로 불량 데이터가 적은 환경에서도 높은 성능을 가질 수 있도록 한다(Baek at al., 2021).
3.4 AI 솔루션 분석 성능 비교 검증
본 연구에서 적용한 GNN 모델의 성능을 평가하기 위해 선별한 3,000개의 샘플 웨이퍼 데이터로 타 이상탐지 기법들과의 성능 비교 실험을 수행하였다. 본 연구에서는 실제 이상탐지 알고리즘의 성능을 평가하기 위해 사용되는 F-1 Score, 정밀도(Precision), 재현율(Recall) 세 가지 성능지표를 채택하였다(Kundu R., 2022).
• 정밀도(Precision)는 실제로 이상이 아닌 데이터를 잘못 이상으로 분류하는 비율(위양성, False Positive)을 최소화하는 능력을 의미하며, 이는 불필요한 공정 중단이나 자원 낭비를 줄이는 데 중요하다.
• 재현율(Recall)은 실제 이상 데이터를 얼마나 잘 탐지하는지(위음성, False Negative 최소화)를 나타내며, 이는 불량의 조기 발견과 품질 리스크 예방에 직결된다.
• F-1 Score는 Precision과 Recall의 조화평균으로, 두 지표의 균형을 평가한다. 특히 F-1 Score는 불균형 데이터 환경에서 단순 정확도(Accuracy)보다 훨씬 신뢰도 높은 품질관리 성과 지표로 인정받는다. 이는 한쪽 지표가 과도하게 높거나 낮을 때 발생할 수 있는 해석상의 오류를 방지하고, 실제 제조 현장에서의 품질경영적 의사결정에 적합한 판단 기준을 제공한다.
이처럼 불량을 놓치지 않는 것(Recall)과 불필요한 오경보를 줄이는 것(Precision) 모두 중요한 품질 경영적 실효성을 검증할 수 있도록 타 이상탐지 기법들과의 성능을 비교 검증하였으며 결과는 Table 2와 같다.
GNN은 F-1 Score 0.906, Precision 0.953, Recall 0.864로 우수한 성능을 보였으며, 이는 채택한 그래프 신경망 모델의 이상 탐지가 효과적으로 작동했음을 시사한다. Isolation Forest와 One-Class SVM, k-NN, LOF 등의 머신러닝 기반 이상탐지 기법들도 비교적 높은 성능을 보였으나, 센서 간 복잡한 상호작용을 고려하지 못하는 한계로 인해 GNN에 비해 낮은 성능을 나타냈다. Autoencoder는 F-1 Score 0.753으로 예상보다 낮은 성능을 보였으며, 주요 원인은 반도체 공정 데이터의 복잡한 시간적 의존성과 센서 간 상호작용을 단일 잠재 공간에 효과적으로 인코딩하지 못했기 때문이라 할 수 있다(Zong et al., 2018). 이는 latent vector의 크기 같은 주요 하이퍼파라미터의 설정 및 데이터 특성을 너무 잘 추출하는 문제로 발생한 현상으로 보인다. 데이터 밀도 기반으로 군집 분석하는 DBSCAN도 낮은 점수를 보였다. 이는 시계열 데이터 특성상 많은 노이즈들이 발생하는데, 노이즈와 이상치의 구분을 단순 데이터 밀도로 분석한 결과로 판단된다(Ester et al., 1996; Choi et al., 2022). 반면 실제로 이상탐지에서도 가장 우수한 성능을 보인 GNN은 센서 간의 복잡한 상관관계와 인과관계를 효과적으로 반영할 수 있다(Wu et al., 2022).
3.5 이상 탐지 및 이상 근본 원인 시각화
본 연구에서는 AI 솔루션의 현장 적용 효과를 보여주기 위해, 이상탐지 결과 및 근본 원인을 시각화하였다. 총 10,000개의 센서 데이터를 분석하여 이상 센서를 식별하고, 해당 센서와의 연결 관계를 통해 이상 원인의 전파 경로를 시각적으로 표현하였다. Figure 2는 정상 웨이퍼(1,000개), 불량 웨이퍼(1,000개), 부품 교체(PM) 후 정상 웨이퍼(1,000개)를 대상으로 수행한 이상 탐지 결과를 나타낸다. x축은 웨이퍼 생산 순서를, y축은 센서별 이상 점수(Anomaly Score)를 의미한다. 각 점은 SVID_01~SVID_13로 구분되는 센서를 나타내며, 빨간 실선은 정규화된 임계값(Threshold=1)을 기준으로 이상 여부를 판단한다. 이 결과, 정상 웨이퍼는 대부분 임계값 이하의 점수를 보여 정상으로 분류되었고, 불량 웨이퍼는 다수의 센서 점수가 임계값을 초과해 이상으로 분류되었다. 특히 SVID_02, SVID_03, SVID_04는 높은 이상 점수를 나타내며, 실제 현장에서 교체된 센서(PM 대상)와 일치하였다.
이는 AI 솔루션이 단순 탐지를 넘어, 실제 공정의 품질 문제를 설명 가능하게 진단하는 AI 시스템으로 작동함을 의미한다. 이러한 특성을 바탕으로 이상 기여도가 높은 센서를 기준으로 PM 우선순위 설정, 주요 센서 집중 모니터링 및 경고 체계 연계, 품질 리스크 최소화 및 자원 배분 최적화와 같은 전략적 활용이 가능하다(Park and Kim, 2024).
Figure 3은 센서 간의 상관관계 및 이상 전파 경로를 그래프 형태로 시각화한 예시이다. 중심 노드인 SVID_03은 붉은색으로 크게 표시되며, 이는 해당 센서가 이상 발생의 핵심 원인임을 나타낸다. 이 노드를 중심으로 주황색 노드(SVID_02, SVID_04)가 연결되어 있으며, 이는 이상이 주변 센서로 확산되고 있음을 보여준다. 반면, 파란색의 작은 노드들은 영향력이 낮거나 후속 전이된 센서로 해석된다. 이와 같은 시각화는 공정 엔지니어가 문제 원인과 전파 경로를 직관적으로 이해하도록 돕고, 데이터 기반의 신속한 의사결정 및 공정 최적화를 가능하게 한다(Wu et al., 2022; Hasan et al., 2024).
3.6 현장 적용에 따른 품질경영 성과
본 연구에서 적용된 GNN 기반 이상탐지 AI 솔루션의 현장 적용 사례는 제조 공정에서 다음과 같은 품질 개선을 통한 경영 성과를 창출하였다. 첫째, 장비 다운타임 감소 효과이다. 기존에는 불량을 인지하는 데 평균 38일이 소요되어 해당 기간 동안 장비 운영 효율성과 생산성이 저하되었으나, AI 솔루션 적용 이상 발생 즉시 실시간 탐지가 가능해지면서 이를 1시간 이내로 단축시켰다. 이는 장비 가동률을 높이고 생산 현장의 운영 효율성을 극대화한 것이다. 둘째, 엔지니어 진단 시간 절감 측면이다. 기존 방식에서는 불량 원인을 분석하는 데 평균 7일이 소요되었으나, AI 솔루션 도입 이후 2시간으로 단축되었다. 특히 엔지니어의 업무 구성을 살펴보면, 기존의 센서 데이터 수집과 분석 업무가 전체 업무의 90%를 차지하였으나, AI 솔루션 도입 이후 수집과 분석 업무가 10%로 축소되고 실질적인 문제 대응 업무가 90%로 확대됨으로써 엔지니어의 생산적 업무 집중도가 크게 향상되었다. 마지막으로, 품질 관리 비용 절감 효과이다. 기존 방식에서는 발생한 불량으로 인해 약 수십억 원의 품질 손실 비용이 발생하였으나, AI 솔루션 적용 후에는 불량으로 인한 품질 손실 비용이 백만 원대로 급격히 감소하여 비용 절감을 실현하였다. 이는 품질경영 관점에서 품질 비용의 획기적인 절감을 의미하며, 기업의 경쟁력 강화와 수익성 개선에 직접적으로 기여할 수 있음을 확인하였다. 결론적으로 본 연구의 AI 기반 이상탐지 및 근본 원인 시각화 솔루션은 제조 공정의 품질 관리 효율성을 높이고, 현장에서 발생하는 문제를 신속하고 정확하게 해결할 수 있도록 지원하여 전반적인 품질경영 성과를 실질적으로 향상시킨 것으로 평가된다(Park et al., 2024).
4. 연구 결과 및 시사점
본 연구는 실제 반도체 제조 현장의 CVD 공정 데이터에 비지도학습 기반의 그래프 신경망을 활용한 이상탐지 모델을 적용한 사례를 분석하였다. 실제 현장 적용 결과, 본 모델은 F-1 Score 0.906, Precision 0.953 으로 기존 알고리즘 대비 우수한 성능을 보였으며, 특히 센서 간의 인과관계를 직관적으로 제시하여 품질 관리 효율성을 높일 수 있었다. 이러한 구조는 단순 경보 중심 이상탐지를 넘어 설명 가능한 AI의 한 형태로서의 GNN의 응용을 보여준다(Hasan et al., 2024). 또한 고차원 센서 네트워크 내 구조적 상호작용을 학습함으로써 품질 관리의 정확도와 실시간 대응 능력을 강화하였다(Wu et al., 2022). 기존 이상탐지 연구와 달리 본 연구는 센서 간 복잡한 상관관계를 자동으로 학습하여 이상을 탐지하고, 시각적 근본 원인 분석을 통해 설명 가능한 AI로 공정 엔지니어에게 직관적이고 조치 가능한 인사이트를 제공한다는 점에서 독창적 가치를 지닌다.
본 연구의 주요 시사점은 다음과 같다. 첫째, 센서 간 관계를 동적 그래프로 모델링하는 새로운 접근법을 제안하였다. 둘째, 시계열 데이터 이상탐지와 그래프 구조를 결합한 하이브리드 아키텍처를 개발하였다. 셋째, 이상 상황을 빠르게 탐지하고 근본 원인을 명확히 시각화함으로써 설명 가능한 AI로 현장 대응 시간을 단축시키는데 기여하였다. 넷째, 이론적 접근에서 벗어나 실제 제조 현장에 적용된 사례를 제공하여 현장 적용 결과 불량률, 장비 다운타임과 같은 실질적인 비용 절감과 같은 실질적인 비즈니스 영향을 제시하였다. 다만, 본 연구의 한계점으로는 비지도학습 특성상 미세한 이상 패턴을 정상으로 학습할 위험이 있으며, 데이터의 결측치나 노이즈로 인해 잘못된 센서 관계를 학습할 가능성이 존재한다. 또한, 현장 엔지니어의 활용성을 높이기 위한 시각화 방안에 대한 연구가 부족하였다. 이러한 한계를 극복하기 위한 향후 연구는 다음과 같다.
첫째, 비지도학습과 준지도학습(Semi-supervised Learning)을 결합한 하이브리드 이상탐지 시스템을 개발하여 미세 이상 탐지 성능을 강화할 필요가 있다. 둘째, 데이터 품질이 이상탐지 성능에 미치는 영향을 정량적으로 평가하고, 이를 개선하기 위한 데이터 전처리 표준 프로세스를 정립하는 연구가 요구된다. 셋째, 현장 엔지니어의 활용성을 높이기 위한 인터랙티브 근본 원인 시각화 시스템과 사용자 친화적인 인터페이스 개발이 필요하다.