제조 데이터 특성 기반 AI 모델 추천 연구: 양자 신경망 기반 컨텍스트 밴딧을 활용한 메타 러너 기술 개발
직책: 연구 책임자
기간: 2025.03-2028.02
연구 필요성
- 제조 기업은 인공지능 모델 도입을 위해, 공정 데이터에 다수의 인공지능 모델을 테스트하는 Model-Driven AI 구축 과정을 거친다. 이 과정에서 두 가지 문제가 발생하는데, 첫 번째는 데이터의 품질 문제이다. 공정 데이터는 불량 데이터의 수가 매우 부족한 Class Imbalance 문제, 계측되는 데이터의 분포가 변화하는 Data Drift 현상 등의 문제로 인공지능 모델 성능이 하락한다. 두 번째는 테스트해야 하는 인공지능 모델의 수가 기하급수적으로 많아지는 문제이다. 또한, 모델 학습을 위해 요구되는 컴퓨팅 자원은 점점 높아져 최적화된 인공지능 모델 도입에 어려움을 겪는다.
- 데이터 품질 문제를 해결하기 위해 최근 Data-Driven AI 연구가 활발히 진행되고 있다. 예를 들어, 많은 양의 타 도메인 데이터를 사전 학습하여 성능을 향상하는 Transfer Learning 연구, 특정 도메인을 다른 도메인에 효과적으로 활용하기 위한 Domain Adaptation 등의 연구가 진행되고 있다. 이를 통해, 데이터의 품질 문제를 해결할 수 있었지만, 여전히 높은 컴퓨팅 자원을 요구하는 다수의 인공지능 모델들을 반복적으로 테스트해야 하는 한계가 존재한다.
- 제조 환경에서는 다른 제품 및 공정이라도 데이터의 특성을 공유하고 있는 경우가 많다. 따라서, 데이터의 특성을 고려하여 최적화된 인공지능 모델을 구성하는 Data Property-Driven AI 연구가 필요하다. 제조 Data Property는 정형 데이터에서는 변수의 수, 데이터 양, 입력 변수들의 다중공선성 정도, Data Drift/Shfit, 결측치 및 이상치 비율, 선행 공정 불확실성 등이 포함되며, 이미지와 같은 비정형 데이터에서는 이미지 및 불량의 크기, 불량의 위치 변화 여부 등이 있을 수 있다. Data Property가 인공지능 모델 성능에 미치는 영향들을 정보화하는 연구를 통해, 제조 기업이 새로운 데이터에 강건한 인공지능을 구축할 때 모든 인공지능 모델을 테스트하는 낭비를 방지할 수 있다
연구 목표
본 과제는 Data Property를 고려하여 최적화된 인공지능 모델을 구축하는 메타 러너 기술 개발을 목표로 한다. 이를 통해, 기업이 특정 데이터에 최적화된 인공지능 모델을 도입하고자 할 때 수많은 인공지능 모델 중 성능이 우수한 혹은 가장 적합한 모델을 사전에 예측할 수 있다. 또한, 우수한 성능을 보일 것으로 예측되는 모델들의 구조가 유사한 경우, 모델 간 유사도 연구를 통해 경량화된 단일 모델로 재구성하는 연구를 진행한다.
몬테카를로 기반 공정 데이터 생성 시뮬레이터 개발: 메타 러너 개발을 위해 다양한 Data Property가 반영된 공정 데이터 생성이 가능한 시뮬레이터가 필요하다. 이 과정에서 실제 제조 데이터와 제조 현장의 불확실성과 복잡성을 효과적으로 모사할 수 있도록 몬테카를로 기법을 활용한다.
활용 방안 및 기대 효과
Transfer Learning, Domain Adaption 등 데이터 중심의 정보 활용에서 나아가, Data Property와 인공지능 모델 중심의 정보 활용을 통해 우수한 성능을 보일 것으로 예측되는 인공지능 모델을 사전에 예측하여, 제조 기업의 인공지능 도입을 활성화한다.
본 연구에서 제안하는 메타 러너 학습 방식은 인공지능 모델뿐만 아니라 데이터 결측치 대치, 클래스 불균형을 위한 Resampling 기법 등 데이터 전처리 방법이 효과적일지 사전에 예측하는 연구에도 활용될 수 있다.
본 연구에서는 연산량 최적화를 위해 양자컴퓨팅을 활용한 Quantum Machine Learning 적용을 시도한다. 이는 국방, 금융 등 연산량 최적화가 필요한 다른 산업에도 적용을 기대할 수 있다.
본 연구에서는 구축한 인공지능 모델의 신뢰성과 안정성을 검증하는 Trustworthy AI 연구를 진행한다. 이는 신뢰성과 안정성이 중요한 다른 산업에도 적용을 기대할 수 있다.