高圧ダイカストのためのデータレイクに向けて

この紹介論文は、MDPI が発行した論文「Towards a Data Lake for High Pressure Die Casting」の研究内容です。

Figure 1. Network layout and technology stack from the HDPC cell to the storage solution
Figure 1. Network layout and technology stack from the HDPC cell to the storage solution

1. 概要:

  • タイトル: Towards a Data Lake for High Pressure Die Casting (高圧ダイカストのためのデータレイクに向けて)
  • 著者: Maximilian Rudack, Michael Rath, Uwe Vroomen, Andreas Bührig-Polaczek
  • 出版年: 2022
  • 掲載ジャーナル/学会: Metals
  • キーワード: 高圧ダイカスト(HPDC); データレイク; インターネットオブプロダクション; インダストリー4.0; デジタルファウンドリ; OPC UA; Node-Red; MinIO

2. 要約

高圧ダイカスト (HPDC) プロセスは、高度な自動化を特徴としているため、データが豊富な生産技術です。 インダストリー 4.0 や Internet of Production (IoP) などの概念から、プロセス データの利用が製品の品質と生産性の向上に貢献できることはよく知られています。 この研究では、HPDC のデータ レイクを介したデータ管理を可能にするための概念と、その実装の最初のステップを紹介します。 私たちの目標は、静的および動的なプロセス変数を取得、送信、および保存できるシステムを設計することでした。 測定値は、HPDC セル内の OPC UA (Open Platform Communication Unified Architecture) に基づく複数のデータ ソースから取得され、Node-Red および Apache Kafka で実装されたストリーミング パイプラインを介して送信されます。 データは、MinIO オブジェクト ストレージに基づく HPDC 用のデータ レイクに連続的に保存されます。 初期テストでは、実装されたシステムは信頼性が高く、柔軟性があり、スケーラブルであることが証明されました。 標準的なコンシューマー ハードウェアでは、1 分あたり数千件の測定値を処理できます。 ビジュアル プログラミング言語である Node-Red を使用すると、データ処理パイプラインを迅速に再構成および展開できます。

3. 研究背景:

研究テーマの背景:

HPDC プロセスは、非鉄合金からニアネットシェイプの金属部品を鋳造するために使用される、不連続な永久金型ベースの生産技術です。 主に自動車産業で使用され、大量生産と、HPDC セル内の複雑な相互接続されたサブシステム (温度調節、スプレー、真空、ドージングなど) が含まれます。 これらのシステムは、プログラマブル ロジック コントローラー (PLC) によって制御されます。

先行研究の状況:

OPC UA [1,2] などのインターフェースの可用性が高まるにつれて、研究は、標準的なデータ収集システムと比較して、より詳細な粒度でデータを処理する方向にシフトしています[3,4]。 データ分析評価は、生産性と品質を向上させる可能性を秘めていると認識されています[5,6]。 既存の研究では、最新のデータ分析手法を利用するためのデータ インフラストラクチャの必要性が強調されています。

研究の必要性:

データ分析を適用する前に、機械、プロセス、および製品データ[7] を収集、処理、保存、および利用できるようにするデータ インフラストラクチャが必要です。 データ ウェアハウスやデータ レイク[8,9] を含むこのインフラストラクチャは、オンライン分析処理 (OLAP) と呼ばれます。 データ パイプラインは、このデータを収集して整理するために重要です[10,11]。

4. 研究目的と研究課題:

研究目的:

HPDC 用のデータ レイクを可能にするための概念と、その実装の最初のステップを提示すること。 これには、マシンでのデータ収集と、データ パイプラインを使用したクラウドへの効率的な転送が含まれます。

主要な研究:

HPDC セル内の複数の OPC UA ベースのデータ ソースから静的および動的プロセス変数を取得、送信、および保存するシステムを設計します。 この研究は、データ パイプラインの設計とそのパフォーマンスに焦点を当てています。

5. 研究方法

この研究では、実際の実装とテスト アプローチを採用しました。

  • 研究デザイン: データ パイプラインとデータ レイク アーキテクチャの開発。
  • データ収集: データは、RWTH アーヘン大学の Foundry-Institute にある 500t 水平コールド チャンバー HPDC マシン (DAK450-40 Vacural) セル内の PLC に接続された 5 つの OPC UA サーバーから収集されました。 PLC には以下が含まれます。
    • PLC HPDC マシン
    • PLC セル レトロフィット センサー
    • PLC ドージング + ファーネス
    • PLC スプレーヘッド
    • リアルタイム測定システム
  • データ パイプラインの実装:
    • エッジ サーバー: Raspberry Pi 4 Model B は、HPDC セル内の個別のネットワークにアクセスするためのエッジ サーバーとして使用されました。
    • データ取得と処理: Node-Red v2.0.6 [12,13] は、エッジ サーバーで OPC UA サーバーからデータを収集するために使用されました。
    • メッセージ ブローカー: Kubernetes クラスター v1.19.10 [16,17] 上の Docker コンテナー [15] で実行されている Apache Kafka v2.6.0 [14] が、クラウド内のメッセージ ブローカーとして使用されました。
    • データ ストレージ: MinIO オブジェクト ストレージ バージョン 2021-11-24T23:19:33Z [18] がデータ レイクとして機能しました。
    • クラウド処理: クラウド内の 2 番目の Node-Red インスタンスは、Kafka から MinIO へのデータ転送を処理しました。
  • 分析方法: パイプラインのパフォーマンスを評価するために、広範な負荷テストが実施されました。 測定項目には、スループット、レイテンシ、およびメッセージの順序付けが含まれていました。 予備テストでは、OPC UA サーバーのデータ生成頻度を決定しました。
  • 研究範囲: HPDC セルをクラウドに接続するデータ パイプラインに焦点を当てています。

6. 主要な研究結果:

主要な研究結果と提示されたデータ分析:

  • 機能的なデータ アーキテクチャが実装されました (図 1)。
  • データ抽出、処理、およびメタデータ挿入のための Node-Red フローが開発されました (図 2、図 3、図 4)。
  • 負荷テストにより、パイプラインの機能が実証されました (図 5)。
  • 予備テストにより、OPC UA サーバーの動作が特徴付けられました (図 6)。
  • パイプラインは、遅延なしに 1 秒あたり約 300 件のメッセージを処理でき、最大スループットは 1 分あたり約 700 件のメッセージでした。
  • レイテンシは、1 秒あたり 300 メッセージを超えるスループットとともに増加しました (図 8)。
  • メッセージの順序付けが定量化され、負荷テスト中に増加とプラトーが見られました (図 7)。
  • データパイプラインは、「serverTimestamp」[19] からデータを収集することによってテストされました。
Figure 2. Segment of the flow to access the data from the machine PLC
Figure 2. Segment of the flow to access the data from the machine PLC
Figure 5. Part of the overall architecture used for load testing.
Figure 5. Part of the overall architecture used for load testing.
Figure 6. Response to subscriptions to the current time of the OPC UA servers depending on various requested frequencies.
Figure 6. Response to subscriptions to the current time of the OPC UA servers depending on various requested frequencies.
Figure 8. Dependence of latency on throughput measured in five load tests conducted in identical setups.
Figure 8. Dependence of latency on throughput measured in five load tests conducted in identical setups.

図のリスト:

  • 図 1. HDPC セルからストレージ ソリューションまでのネットワーク レイアウトとテクノロジー スタック。
  • 図 2. マシン PLC からのデータにアクセスするためのフローのセグメント。
  • 図 3. メッセージ ブローカーに接続するエッジ サーバー上の複合フロー。
  • 図 4. メッセージ ブローカーをデータ レイクに接続するクラウド内の複合フロー。
  • 図 5. 負荷テストに使用される全体的なアーキテクチャの一部。
  • 図 6. さまざまな要求頻度に応じた、OPC UA サーバーの現在時刻へのサブスクリプション応答。
  • 図 7. 同一の設定での 5 回の負荷テストの時間依存メトリック。
  • 図 8. 同一の設定で実施された 5 回の負荷テストで測定されたスループットに対するレイテンシの依存性。

7. 結論:

主要な調査結果の要約:

開発されたデータ パイプラインとテクノロジー スタックは、HPDC のユース ケースに十分であり、大量のデータを処理でき、拡張の余地があります。 このシステムは、拡張性が高く、調整可能であり、複数の PLC が OPC UA を介してデータを提供する他のユース ケースに転送できます。

研究結果の要約。

この研究は、HPDC 用のデータ パイプラインの実現可能性を実証しました。 パイプラインは、実用的でアジャイルな開発をサポートします。

研究の学術的意義

この研究は、データ管理のための実用的なソリューションを提供することにより、HPDC におけるインダストリー 4.0 および IoP の概念の実装に貢献します。

研究の実用的な意味

このシステムにより、プロセス データの収集と保存が可能になり、製品の品質と生産性の向上に向けたデータ駆動型の改善への道が開かれます。 今後の作業には、相互運用性のためのセマンティック メタデータの開発と視覚情報の統合が含まれます。 データ リファインメントのために、ブロンズ、シルバー、ゴールドのデータ層の概念が導入されています。

8. 参考文献:

  • [1] OPC Unified Architecture. Available online: https://opcfoundation.org (accessed on 6 January 2022).
  • [2] Mahnke, W.; Leitner, S.H.; Damm, M. OPC Unified Architecture; Springer Science & Business Media: Berlin, Germany, 2009.
  • [3] Rix, M.; Kujat, B.; Meisen, T.; Jeschke, S. An agile information processing framework for high pressure die casting applications in modern manufacturing systems. Procedia CIRP 2016, 41, 1084–1089.
  • [4] Pennekamp, J.; Glebke, R.; Henze, M.; Meisen, T.; Quix, C.; Hai, R.; Gleim, L.; Niemietz, P.; Rudack, M.; Knape, S.; et al. Towards an infrastructure enabling the internet of production. In Proceedings of the 2019 IEEE International Conference on Industrial Cyber Physical Systems (ICPS), Taipei, Taiwan, 6–9 May 2019; pp. 31-37.
  • [5] Dai, H.N.; Wang, H.; Xu, G.; Wan, J.; Imran, M. Big data analytics for manufacturing internet of things: opportunities, challenges and enabling technologies. Enterp. Inf. Syst. 2020, 14, 1279–1303.
  • [6] Rath, M.; Gannouni, A.; Luetticke, D.; Gries, T. Digitizing a Distributed Textile Production Process using Industrial Internet of Things: A Use-Case. In Proceedings of the 2021 4th IEEE International Conference on Industrial Cyber-Physical Systems (ICPS), Victoria, BC, Canada, 10-12 May 2021; pp. 315-320.
  • [7] Lee, J.Y.; Yoon, J.S.; Kim, B.H. A big data analytics platform for smart factories in small and medium-sized manufacturing enterprises: An empirical case study of a die casting factory. Int. J. Precis. Eng. Manuf. 2017, 18, 1353–1361.
  • [8] Chen, K.Y.; Wu, T.C. Data warehouse design for manufacturing execution systems. In Proceedings of the IEEE International Conference on Mechatronics (ICM'05), Taipei, Taiwan, 10–12 July 2005; pp. 751-756.
  • [9] Hai, R.; Geisler, S.; Quix, C. Constance: An intelligent data lake system. In Proceedings of the 2016 International Conference on Management of Data, San Francisco, CA, USA, 26 June–1 July 2016; pp. 2097–2100.
  • [10] Lipp, J.; Rath, M.; Rudack, M.; Vroomen, U.; Bührig-Polaczek, A. Flexible OPC UA Data Load Optimizations on the Edge of Production. In Enterprise Information Systems, Proceedings of the 22nd International Conference (ICEIS 2020), Virtual Event, 5–7 May 2020; Revised Selected Papers; Springer: Cham, Switzerland, 2020; pp. 43–61.
  • [11] Raj, A.; Bosch, J.; Olsson, H.H.; Wang, T.J. Modelling Data Pipelines. In Proceedings of the 2020 46th Euromicro Conference on Software Engineering and Advanced Applications (SEAA), Portoroz, Slovenia, 26–28 August 2020; pp. 13–20.
  • [12] Node-Red. Available online: https://nodered.org (accessed on 6 January 2022).
  • [13] Nicolae, A.; Korodi, A. Node-Red and OPC UA Based Lightweight and Low-Cost Historian with Application in the Water Industry. In Proceedings of the 2018 IEEE 16th International Conference on Industrial Informatics (INDIN), Porto, Portuga, 18–20 July 2018; pp. 1012–1017.
  • [14] Apache Kafka. Available online: https://kafka.apache.org (accessed on 6 January 2022).
  • [15] Docker. Available online: https://www.docker.com (accessed on 6 January 2022).
  • [16] Kubernetes. Available online: https://kubernetes.io (accessed on 6 January 2022).
  • [17] Burns, B.; Grant, B.; Oppenheimer, D.; Brewer, E.; Wilkes, J. Borg, omega, and kubernetes. Commun. ACM 2016, 59, 50–57.
  • [18] MinIO. Available online: https://min.io (accessed on 6 January 2022).
  • [19] OPC UA Foundation. OPC Unified Architecture—Part 4: Services, version 1.05; OPC UA Foundation: Scottsdale, AZ, USA, 2021.

9. 著作権:

  • この資料は、「Maximilian Rudack, Michael Rath, Uwe Vroomen, Andreas Bührig-Polaczek」による「Towards a Data Lake for High Pressure Die Casting」という論文に基づいています。
  • 論文の出典: https://doi.org/10.3390/met12020349

この資料は、上記の論文を紹介するために作成されたものであり、商業目的での無断使用を禁じます。 Copyright © 2025 CASTMAN. All rights reserved.