고압 다이캐스팅을 위한 데이터 레이크 구축

본 소개 글은 MDPI에서 발행한 ["Towards a Data Lake for High Pressure Die Casting"] 논문의 연구 내용입니다.

Figure 1. Network layout and technology stack from the HDPC cell to the storage solution
Figure 1. Network layout and technology stack from the HDPC cell to the storage solution

1. 개요:

  • 제목: Towards a Data Lake for High Pressure Die Casting (고압 다이캐스팅을 위한 데이터 레이크 구축)
  • 저자: Maximilian Rudack, Michael Rath, Uwe Vroomen, Andreas Bührig-Polaczek
  • 출판 연도: 2022
  • 게재 저널/학회: Metals
  • 키워드: 고압 다이캐스팅(HPDC); 데이터 레이크; 생산 인터넷; 인더스트리 4.0; 디지털 파운드리; OPC UA; Node-Red; MinIO

2. 초록

고압 다이캐스팅(HPDC) 공정은 높은 수준의 자동화를 특징으로 하므로 데이터가 풍부한 생산 기술을 나타냅니다. 인더스트리 4.0 및 생산 인터넷(IoP)과 같은 개념에서 공정 데이터 활용이 제품 품질 및 생산성 향상에 기여할 수 있다는 것은 잘 알려져 있습니다. 이 연구에서는 HPDC를 위한 데이터 레이크를 통해 데이터 관리를 가능하게 하는 개념과 초기 구현 단계를 제시합니다. 우리의 목표는 정적 및 동적 공정 변수를 수집, 전송 및 저장할 수 있는 시스템을 설계하는 것이었습니다. 측정값은 HPDC 셀 내의 OPC UA(Open Platform Communication Unified Architecture)를 기반으로 하는 여러 데이터 소스에서 발생하며 Node-Red 및 Apache Kafka에서 구현된 스트리밍 파이프라인을 통해 전송됩니다. 데이터는 MinIO 객체 스토리지를 기반으로 하는 HPDC용 데이터 레이크에 연속적으로 저장됩니다. 초기 테스트에서 구현된 시스템은 안정적이고 유연하며 확장 가능한 것으로 입증되었습니다. 표준 소비자 하드웨어에서 분당 수천 건의 측정을 처리할 수 있습니다. 시각적 프로그래밍 언어인 Node-Red를 사용하면 데이터 처리 파이프라인을 신속하게 재구성하고 배포할 수 있습니다.

3. 연구 배경:

연구 주제 배경:

HPDC 공정은 비철금속 합금으로 니어넷셰이프(near net shape) 금속 부품을 주조하는 데 사용되는 불연속 영구 주형 기반 생산 기술입니다. 주로 자동차 산업에서 사용되며 높은 생산량과 HPDC 셀 내의 복잡한 상호 연결된 하위 시스템(열 조절, 분사, 진공, 도징 등)을 포함합니다. 이러한 시스템은 PLC(Programmable Logic Controller)에 의해 제어됩니다.

선행 연구 현황:

OPC UA [1,2]와 같은 인터페이스의 가용성이 증가함에 따라 연구는 표준 데이터 수집 시스템에 비해 더 세분화된 데이터를 처리하는 방향으로 전환되고 있습니다[3,4]. 데이터 분석 평가는 생산성과 품질을 높일 수 있는 잠재력으로 인식되고 있습니다[5,6]. 기존 연구에서는 최신 데이터 분석 방법을 활용하기 위한 데이터 인프라의 필요성을 강조합니다.

연구 필요성:

데이터 분석을 적용하기 전에 기계, 공정 및 제품 데이터[7]를 수집, 처리, 저장 및 사용할 수 있도록 하는 데이터 인프라가 필요합니다. 데이터 웨어하우스 및 데이터 레이크[8,9]를 포함하는 이러한 인프라를 OLAP(Online Analytical Processing)라고 합니다. 데이터 파이프라인은 이 데이터를 수집하고 구성하는 데 중요합니다[10,11].

4. 연구 목적 및 연구 질문:

연구 목적:

HPDC를 위한 데이터 레이크를 가능하게 하는 개념과 초기 구현 단계를 제시합니다. 여기에는 기계에서의 데이터 수집과 데이터 파이프라인을 사용한 클라우드로의 효율적인 전달이 포함됩니다.

핵심 연구:

HPDC 셀 내의 여러 OPC UA 기반 데이터 소스에서 정적 및 동적 공정 변수를 수집, 전송 및 저장하는 시스템을 설계합니다. 이 연구는 데이터 파이프라인 설계와 성능에 중점을 둡니다.

5. 연구 방법

이 연구는 실제 구현 및 테스트 접근 방식을 사용했습니다.

  • 연구 설계: 데이터 파이프라인 및 데이터 레이크 아키텍처 개발.
  • 데이터 수집: 데이터는 RWTH 아헨 대학교 Foundry-Institute의 500t 수평 냉각 챔버 HPDC 기계(DAK450-40 Vacural) 셀 내의 PLC에 연결된 5개의 OPC UA 서버에서 수집되었습니다. PLC는 다음을 포함합니다.
    • PLC HPDC 기계
    • PLC 셀 개조 센서
    • PLC 도징 + 퍼니스
    • PLC 스프레이 헤드
    • 실시간 측정 시스템
  • 데이터 파이프라인 구현:
    • 에지 서버: Raspberry Pi 4 Model B는 HPDC 셀 내의 별도 네트워크에 액세스하기 위한 에지 서버로 사용되었습니다.
    • 데이터 수집 및 처리: Node-Red v2.0.6 [12,13]은 에지 서버에서 OPC UA 서버로부터 데이터를 수집하는 데 사용되었습니다.
    • 메시지 브로커: Kubernetes 클러스터 v1.19.10 [16,17]의 Docker 컨테이너 [15]에서 실행되는 Apache Kafka v2.6.0 [14]이 클라우드의 메시지 브로커로 사용되었습니다.
    • 데이터 저장소: MinIO 객체 스토리지 버전 2021-11-24T23:19:33Z [18]이 데이터 레이크 역할을 했습니다.
    • 클라우드 처리: 클라우드의 두 번째 Node-Red 인스턴스는 Kafka에서 MinIO로의 데이터 전송을 처리했습니다.
  • 분석 방법: 파이프라인의 성능을 평가하기 위해 광범위한 부하 테스트가 수행되었습니다. 측정 항목에는 처리량, 대기 시간 및 메시지 순서가 포함되었습니다. 예비 테스트에서는 OPC UA 서버의 데이터 생성 빈도를 결정했습니다.
  • 연구 범위: HPDC 셀을 클라우드에 연결하는 데이터 파이프라인에 중점.

6. 주요 연구 결과:

주요 연구 결과 및 제시된 데이터 분석:

  • 기능적 데이터 아키텍처가 구현되었습니다(그림 1).
  • 데이터 추출, 처리 및 메타데이터 주입을 위한 Node-Red 흐름이 개발되었습니다(그림 2, 그림 3, 그림 4).
  • 부하 테스트를 통해 파이프라인의 기능이 입증되었습니다(그림 5).
  • 예비 테스트를 통해 OPC UA 서버의 동작이 특성화되었습니다(그림 6).
  • 파이프라인은 지연 없이 초당 약 300개의 메시지를 처리할 수 있으며 최대 처리량은 분당 약 700개의 메시지입니다.
  • 대기 시간은 초당 300개 메시지를 초과하는 처리량과 함께 증가했습니다(그림 8).
  • 메시지 순서가 정량화되어 부하 테스트 중에 증가 및 정체 상태를 보였습니다(그림 7).
  • 데이터 파이프라인은 "serverTimestamp"[19]에서 데이터를 수집하여 테스트했습니다.
Figure 2. Segment of the flow to access the data from the machine PLC
Figure 2. Segment of the flow to access the data from the machine PLC
Figure 5. Part of the overall architecture used for load testing.
Figure 5. Part of the overall architecture used for load testing.
Figure 6. Response to subscriptions to the current time of the OPC UA servers depending on various requested frequencies.
Figure 6. Response to subscriptions to the current time of the OPC UA servers depending on various requested frequencies.
Figure 8. Dependence of latency on throughput measured in five load tests conducted in identical setups.
Figure 8. Dependence of latency on throughput measured in five load tests conducted in identical setups.

그림 이름 목록:

  • 그림 1. HDPC 셀에서 스토리지 솔루션까지의 네트워크 레이아웃 및 기술 스택.
  • 그림 2. 머신 PLC에서 데이터에 액세스하기 위한 흐름의 세그먼트.
  • 그림 3. 메시지 브로커에 연결하는 에지 서버의 컴파운딩 흐름.
  • 그림 4. 메시지 브로커를 데이터 레이크와 연결하는 클라우드의 컴파운딩 흐름.
  • 그림 5. 부하 테스트에 사용된 전체 아키텍처의 일부.
  • 그림 6. 다양한 요청 빈도에 따른 OPC UA 서버의 현재 시간에 대한 구독 응답.
  • 그림 7. 동일한 설정에서 5번의 부하 테스트에 대한 시간 종속 메트릭.
  • 그림 8. 동일한 설정에서 수행된 5번의 부하 테스트에서 측정된 처리량에 대한 대기 시간의 종속성.

7. 결론:

주요 결과 요약:

개발된 데이터 파이프라인 및 기술 스택은 HPDC 사용 사례에 충분하며 상당한 양의 데이터를 처리할 수 있고 확장할 여지가 있습니다. 이 시스템은 확장성이 뛰어나고 조정 가능하며 여러 PLC가 OPC UA를 통해 데이터를 제공하는 다른 사용 사례로 이전할 수 있습니다.

연구 결과 요약.

이 연구는 HPDC를 위한 데이터 파이프라인의 실현 가능성을 입증했습니다. 파이프라인은 실용적이고 민첩한 개발을 지원합니다.

연구의 학문적 의의

이 연구는 데이터 관리를 위한 실용적인 솔루션을 제공함으로써 HPDC에서 인더스트리 4.0 및 IoP 개념 구현에 기여합니다.

연구의 실질적인 의미

이 시스템을 통해 공정 데이터를 수집하고 저장할 수 있으므로 제품 품질 및 생산성 향상을 위한 데이터 기반 개선의 길이 열립니다. 향후 작업에는 상호 운용성을 위한 의미 체계 메타데이터 개발과 시각 정보 통합이 포함됩니다. 데이터 정제를 위해 청동, 은, 금 데이터 계층의 개념이 도입되었습니다.

8. 참고 문헌:

  • [1] OPC Unified Architecture. Available online: https://opcfoundation.org (accessed on 6 January 2022).
  • [2] Mahnke, W.; Leitner, S.H.; Damm, M. OPC Unified Architecture; Springer Science & Business Media: Berlin, Germany, 2009.
  • [3] Rix, M.; Kujat, B.; Meisen, T.; Jeschke, S. An agile information processing framework for high pressure die casting applications in modern manufacturing systems. Procedia CIRP 2016, 41, 1084–1089.
  • [4] Pennekamp, J.; Glebke, R.; Henze, M.; Meisen, T.; Quix, C.; Hai, R.; Gleim, L.; Niemietz, P.; Rudack, M.; Knape, S.; et al. Towards an infrastructure enabling the internet of production. In Proceedings of the 2019 IEEE International Conference on Industrial Cyber Physical Systems (ICPS), Taipei, Taiwan, 6–9 May 2019; pp. 31-37.
  • [5] Dai, H.N.; Wang, H.; Xu, G.; Wan, J.; Imran, M. Big data analytics for manufacturing internet of things: opportunities, challenges and enabling technologies. Enterp. Inf. Syst. 2020, 14, 1279–1303.
  • [6] Rath, M.; Gannouni, A.; Luetticke, D.; Gries, T. Digitizing a Distributed Textile Production Process using Industrial Internet of Things: A Use-Case. In Proceedings of the 2021 4th IEEE International Conference on Industrial Cyber-Physical Systems (ICPS), Victoria, BC, Canada, 10-12 May 2021; pp. 315-320.
  • [7] Lee, J.Y.; Yoon, J.S.; Kim, B.H. A big data analytics platform for smart factories in small and medium-sized manufacturing enterprises: An empirical case study of a die casting factory. Int. J. Precis. Eng. Manuf. 2017, 18, 1353–1361.
  • [8] Chen, K.Y.; Wu, T.C. Data warehouse design for manufacturing execution systems. In Proceedings of the IEEE International Conference on Mechatronics (ICM'05), Taipei, Taiwan, 10–12 July 2005; pp. 751-756.
  • [9] Hai, R.; Geisler, S.; Quix, C. Constance: An intelligent data lake system. In Proceedings of the 2016 International Conference on Management of Data, San Francisco, CA, USA, 26 June–1 July 2016; pp. 2097–2100.
  • [10] Lipp, J.; Rath, M.; Rudack, M.; Vroomen, U.; Bührig-Polaczek, A. Flexible OPC UA Data Load Optimizations on the Edge of Production. In Enterprise Information Systems, Proceedings of the 22nd International Conference (ICEIS 2020), Virtual Event, 5–7 May 2020; Revised Selected Papers; Springer: Cham, Switzerland, 2020; pp. 43–61.
  • [11] Raj, A.; Bosch, J.; Olsson, H.H.; Wang, T.J. Modelling Data Pipelines. In Proceedings of the 2020 46th Euromicro Conference on Software Engineering and Advanced Applications (SEAA), Portoroz, Slovenia, 26–28 August 2020; pp. 13–20.
  • [12] Node-Red. Available online: https://nodered.org (accessed on 6 January 2022).
  • [13] Nicolae, A.; Korodi, A. Node-Red and OPC UA Based Lightweight and Low-Cost Historian with Application in the Water Industry. In Proceedings of the 2018 IEEE 16th International Conference on Industrial Informatics (INDIN), Porto, Portuga, 18–20 July 2018; pp. 1012–1017.
  • [14] Apache Kafka. Available online: https://kafka.apache.org (accessed on 6 January 2022).
  • [15] Docker. Available online: https://www.docker.com (accessed on 6 January 2022).
  • [16] Kubernetes. Available online: https://kubernetes.io (accessed on 6 January 2022).
  • [17] Burns, B.; Grant, B.; Oppenheimer, D.; Brewer, E.; Wilkes, J. Borg, omega, and kubernetes. Commun. ACM 2016, 59, 50–57.
  • [18] MinIO. Available online: https://min.io (accessed on 6 January 2022).
  • [19] OPC UA Foundation. OPC Unified Architecture—Part 4: Services, version 1.05; OPC UA Foundation: Scottsdale, AZ, USA, 2021.

9. 저작권:

  • 본 자료는 "Maximilian Rudack, Michael Rath, Uwe Vroomen, Andreas Bührig-Polaczek"의 "Towards a Data Lake for High Pressure Die Casting" 논문을 기반으로 합니다.
  • 논문 출처: https://doi.org/10.3390/met12020349

본 자료는 위 논문을 소개하기 위해 작성되었으며, 상업적 목적으로 무단 사용하는 것을 금합니다. Copyright © 2025 CASTMAN. All rights reserved.