Factors Analysis and Prediction in Die-casting Process for Defects Reduction
本技術概要は、Pavee Siriruk氏およびTitiwetaya Yaikratok氏による学術論文「Factors Analysis and Prediction in Die-casting Process for Defects Reduction」に基づいています。この論文は、IEOM Society Internationalが発行する「Proceedings of the International Conference on Industrial Engineering and Operations Management (2022)」に掲載されました。


キーワード
- Primary Keyword: ダイカスト 欠陥予測
- Secondary Keywords: 機械学習, 予測保全, ポロシティ, 要因分析, 決定木, HDD部品
エグゼクティブサマリー
- 課題: HDD部品のダイカスト工程で発生し、後工程でしか検出できない外面ポロシティ欠陥を削減する必要がある。
- 手法: 実際の製造ラインから収集した機械パラメータデータを用いて、複数の機械学習アルゴリズム(決定木、ロジスティック回帰、ランダムフォレスト)の予測性能を比較評価した。
- 重要なブレークスルー: 決定木アルゴリズムが91.18%の精度を達成し、不良品(NG)と良品(OK)の両方を予測できる唯一の有効なモデルであることが判明した。
- 結論: 圧力解放や高速射出に関連する特定の機械パラメータを監視・制御することが、ポロシティ欠陥の削減に直結する。
課題:なぜこの研究がHPDC専門家にとって重要なのか
高精度が要求されるHDD(ハードディスクドライブ)部品の製造において、ダイカスト工程で発生する外面ポロシティは長年の課題です。この種の欠陥は、製造元での検査技術の限界から100%検出することが難しく、顧客の製造プロセスで発覚することが少なくありません。エンドユーザーにおけるHDDの故障は、顧客の重要な情報損失につながり、デジタルストレージ市場での競争力を著しく低下させる危険性をはらんでいます。
サプライチェーン全体でこの問題は議論されてきましたが、検査方法の改善は多額の投資を必要とし、製品価格の上昇につながるため、顧客にとって受け入れがたい選択肢でした。そこで本研究では、検査を強化するのではなく、欠陥の発生そのものを制御するために、生産データと機械パラメータの関係性を解明するというアプローチが提案されました。インダストリー4.0の進展に伴い、機械から得られる多次元データを活用し、欠陥発生を予測・防止する技術の確立が急務となっています。
アプローチ:研究手法の解明
本研究では、HDD部品(モーターベースプレート)を製造するダイカストラインに焦点を当てました。研究チームは、以下の手法でデータ収集と分析を行いました。
- データ収集: プロトタイプとして設定された1台のダイカストマシンから、5ヶ月間にわたって実生産データを収集しました。金型温度、各種温度、立ち上がり時間、速度、速度、タイムスタンプなど、35項目の機械パラメータが製品ごとにリアルタイムで記録されました。
- データ統合: 各鋳造品はシリアル番号で管理され、機械パラメータデータと、最終のVMI(目視検査)ステーションで記録された欠陥データ(OK/NG)が紐付けられました。
- データセットの準備: 当初141,000件収集されたデータセットから、重複や欠損データを除去するデータクレンジングを行い、最終的に92,000件のデータセットをモデリングに使用しました。
- 分析モデル: 応答変数(出力)がOK/NGの2値分類であるため、教師あり学習の分類手法が用いられました。具体的には、決定木(DT)、ロジスティック回帰(LR)、ランダムフォレスト(RF)の3つのアルゴリズムを適用し、その予測性能を比較評価しました。
ブレークスルー:主要な研究結果とデータ
本研究は、ダイカストにおけるポロシティ欠陥の予測と要因特定に関して、2つの重要な発見をもたらしました。
発見1:ポロシティ欠陥に最も影響を与える5つの重要パラメータの特定
特徴量重要度分析(Extra Tree Classifier)により、35項目の機械パラメータのうち、どのパラメータがポロシティ欠陥の発生に最も強く寄与しているかが明らかになりました。
Table 2によると、最も影響が大きかったのは「Factor 26(圧力解放関連)」で、スコアは0.053でした。これに続いて、「Factor 3」(スコア0.049)、「Factor 27」(スコア0.047)、「Factor 8」(スコア0.043)、「Factor 16」(スコア0.042)が上位を占めました。これらの結果は、圧力解放、高速射出、充填圧力に関連するパラメータが、ポロシティ欠陥を制御する上で極めて重要であることを示唆しています。
発見2:決定木(DT)アルゴリズムによる優れた欠陥予測性能
3つの機械学習アルゴリズムの性能を比較した結果、決定木(DT)が最も実用的な予測モデルであることが判明しました。
論文の本文によると、ロジスティック回帰(LR)とランダムフォレスト(RF)の精度(Accuracy)は95.85%と非常に高い数値を示しましたが、Figure 5とFigure 6の混同行列が示すように、これらのモデルは不良品(Porosity)を一件も予測できず、すべて良品(OK)と分類してしまいました。これは、データセット内の不良品の割合が極端に少ない「不均衡データ」が原因です。
一方で、決定木(DT)は精度91.18%を達成し、さらに重要なことに、Figure 4が示すように、不良品を28件正しく予測することに成功しました。不良品と良品の両方をバランス良く予測する能力を示すG-mean値は、DTのみが0.28という有効な値を記録し、LRとRFは0.00でした(Table 3)。この結果から、実際の生産現場で「不良を見逃さない」という観点において、決定木が最も信頼性の高いアルゴリズムであると結論付けられました。
R&Dおよび製造オペレーションへの実践的示唆
本研究の結果は、ダイカスト製品の品質向上と生産性向上を目指す専門家にとって、具体的なアクションにつながる知見を提供します。
- プロセスエンジニア向け: 本研究は、「Factor 26(圧力解放関連)」や「Factor 3(高速射出関連)」などの特定のプロセスパラメータを調整することが、外面ポロシティ欠陥の削減に直接貢献する可能性を示唆しています。これらのパラメータを重点的に監視し、最適化することで、品質の安定化が期待できます。
- 品質管理チーム向け: 決定木モデルは、特定のパラメータの組み合わせが不良品を発生させるリスクを予測できます。Figure 4に示されたモデルの予測能力は、重点的に検査すべき製品ロットを特定するための新たな基準となり得ます。これにより、検査リソースを効率的に配分し、不良品の流出リスクを低減できます。
- 設計エンジニア向け: ポロシティの原因として「不適切なランナー」も指摘されていることから、本研究で特定された重要パラメータの変動に対してロバストな(影響を受けにくい)製品設計や湯流れ方案を検討することが、初期設計段階での品質確保に有効であると考えられます。
論文詳細
Factors Analysis and Prediction in Die-casting Process for Defects Reduction
1. 概要:
- Title: Factors Analysis and Prediction in Die-casting Process for Defects Reduction
- Author: Pavee Siriruk, Titiwetaya Yaikratok
- Year of publication: 2022
- Journal/academic society of publication: IEOM Society International (Proceedings of the International Conference on Industrial Engineering and Operations Management)
- Keywords: Big Data Analytics, Classification, Defects Prediction, Machine Learning, Predictive Maintenance.
2. 抄録:
欠陥削減は、製造業において常に取り組まれている継続的改善のテーマである。インダストリー4.0へと世界が移行している現代においても、このトピックが時代遅れになることはなく、より良い成果を達成するための新しいアプローチが導入されているに過ぎない。本研究は、ハードディスクドライブ(HDD)部品製造会社のダイカストプロセスにおける欠陥削減を目的とし、鋳造品に発生する欠陥に対する様々な機械パラメータの影響に焦点を当てる。予測保全アプローチと機械学習を導入し、適切なデータモデリング手法を決定した。 - 最も関連性の高い独立変数は、特徴量重要度法によって特定できる。 - 決定木(DT)は、他の分類手法の中で最も良い結果を示した。 - 決定木アルゴリズムにより、91.18%の精度が得られた。 しかし、ラベル付きデータの比率は、今後の研究のために見直しと最適化が必要であり、また、最良の予測結果を得るためには、現場の生産結果を主題専門家(SME)と共に実際に確認し続けることも必要である。
3. 序論:
予測保全(PdM)は、多くの産業分野で広く利用されており、その主な共通目標は、計画外のダウンタイムを削減し、生産性を向上させ、無駄や不要なスクラップを減らし、最終的には企業の収益向上に繋げることである。本研究は、HDDのデジタルストレージ産業におけるモーターベースプレート製造(3次サプライヤー)、特にダイカストプロセスに焦点を当てる。ここでは様々な種類の欠陥が発生するが、本研究では外面のポロシティ欠陥にのみ注力する。この種の欠陥は、検査技術の限界により製造元で100%検出することができず、顧客のプロセスを通過した後に発見され、顧客の製造(HDD)において多くの品質問題に影響を与えてきた。サプライチェーンマネジメント(SCM)の観点から、この問題は多階層のサプライヤー間で長らく議論されてきた。検査方法の改善は巨額の投資を必要とし、上流の工場での販売価格を上昇させるが、顧客はまだこのコストを吸収する準備ができていない。そのため、検査プロセスを改善する代わりに、欠陥と機械パラメータの関係を見つけ出し、欠陥の発生をより良く制御する方法を導き出すための、多階層の生産データ分析という第2のシナリオが提案された。
4. 研究概要:
研究トピックの背景:
HDD部品のダイカスト工程で発生する外面ポロシティ欠陥は、後工程で品質問題を引き起こす主要因となっている。検査強化にはコストがかかるため、データ分析による発生原因の特定と制御が求められている。
従来研究の状況:
予測保全の分野では、決定木、ロジスティック回帰、ランダムフォレストなど、様々な機械学習アルゴリズムが多くの産業で適用されてきた。特にランダムフォレストは近年最も人気のあるアルゴリズムの一つとして、高い精度を示す多くの成功事例がある。
研究の目的:
HDD部品のダイカストプロセスにおける欠陥を削減するため、鋳造品の欠陥を引き起こす機械パラメータを特定し、予測保全のための適切なデータモデリング手法を決定すること。
研究の核心:
実際の生産データを用いて、決定木(DT)、ロジスティック回帰(LR)、ランダムフォレスト(RF)の3つの機械学習モデルを構築し、ポロシティ欠陥の予測性能を比較評価する。また、特徴量重要度分析により、欠陥発生に最も寄与する機械パラメータを特定する。
5. 研究方法論
研究デザイン:
実際の製造現場におけるケーススタディ。プロトタイプ機から収集した時系列の機械データと、最終検査で得られた品質データを統合し、教師あり学習による分類モデルを構築する。
データ収集と分析方法:
- データ収集: 1台のダイカストマシンから5ヶ月間にわたり、35項目の機械パラメータデータをリアルタイムで収集。最終検査でポロシティ欠陥の有無を記録。
- データ前処理: 収集した141,000件のデータから重複・欠損データを除去し、92,000件のデータセットを作成。
- 分析手法: Pythonを使用し、特徴量重要度分析(Extra Tree Classifier)を実施。分類アルゴリズムとして決定木、ロジスティック回帰、ランダムフォレストを適用し、混同行列、精度、G-mean値などを用いて性能を評価する。
研究対象と範囲:
HDD部品(モーターベースプレート)のダイカスト工程で発生する17種類の欠陥のうち、「外面ポロシティ」に限定して分析を行う。データは1台のプロトタイプ機から収集されたものとする。
6. 主要な結果:
主要な結果:
- 特徴量重要度分析により、ポロシティ欠陥に最も影響を与える要因は「Factor 26(圧力解放関連)」であり、そのスコアは0.053であった。
- 3つのアルゴリズムを比較した結果、決定木(DT)が91.18%の精度を達成し、かつ不良品と良品の両方を予測できる唯一のモデルであった(G-mean = 0.28)。
- ロジスティック回帰(LR)とランダムフォレスト(RF)は、より高い精度(95.85%)を示したが、不良品を全く予測できず(G-mean = 0.00)、実用的ではなかった。
図の名称リスト:
- Figure. 1 General framework of machine learning
- Figure 2. Confusion matrix
- Figure. 3 Comparing score of feature importance analysis results
- Figure. 4 Confusion Metrix of DT
- Figure. 5 Confusion Metrix of LR
- Figure. 6 Confusion Metrix of RF
7. 結論:
特徴量重要度分析の結果、ダイカスト製品の外面に発生するポロシティ欠陥に最も寄与する要因は「Factor 26(圧力解放関連)」であり、次いで「Factor 3(高速関連)」、「Factor 27(圧力解放関連)」、「Factor 8(高速関連)」、「Factor 16(充填圧力関連)」であることが結論付けられた。G-mean値を考慮した場合、決定木(DT)アルゴリズムが最良の予測結果を示し、このアルゴリズムによって91.18%の精度が得られた。しかし、生データ内の不良(NG)データの割合が極端に低いという懸念点がある。したがって、今後の研究では、不均衡データセットの見直しと最適化が必要である。また、現場の専門家(SME)と共に最前線の生産結果を実際に確認し続けることも、最も適切で堅牢な予測モデルを得るために依然として必要である。
8. 参考文献:
- Aliyan E., Aghamohammadi M., Kia M., Heidari A., Shafie-khah, M., & Catalão J. P., Decision tree analysis to identify harmful contingencies and estimate blackout indices for predicting system vulnerability. Electric Power Systems Research, 178, 106036, 2020.
- Amihai I., Gitzel R., Kotriwala A. M., Pareschi D., Subbiah S., & Sosale G., An industrial case study using vibration data and machine learning to predict asset health. In 2018 IEEE 20th Conference on Business Informatics (CBI) vol. 1, pp. 178-185, IEEE, July 2018.
- Behera S., Choubey A., Kanani C. S., Patel Y. S., Misra R., & Sillitti A., Ensemble trees learning based improved predictive maintenance using IIoT for turbofan engines, In Proceedings of the 34th ACM/SIGAPP Symposium on Applied Computing, pp. 842-850, April 2019.
- Bukhsh Z. A., Saeed A., Stipanovic I., & Doree A. G., Predictive maintenance using tree-based classification techniques: A case of railway switches, Transportation Research Part C: Emerging Technologies, vol.101, pp. 35-54, 2019.
- Canizo M., Onieva E., Conde A., Charramendieta S., & Trujillo S., Real-time predictive maintenance for wind turbines using Big Data frameworks, In 2017 ieee international conference on prognostics and health management (icphm), pp. 70-77, IEEE, June 2017.
- Carvalho T. P., Soares F. A., Vita, R., Francisco R. D. P., Basto J. P., & Alcalá S. G., A systematic literature review of machine learning methods applied to predictive maintenance. Computers & Industrial Engineering, 137, 106024, 2019.
- Chen X., Van Hillegersberg J., Topan E., Smith S. & Roberts M., Application of data-driven models to predictive maintenance: Bearing wear prediction at TATA steel, Expert Systems with Applications, 186, 115699, 2021.
- Durbhaka Gopi Krishna, and Barani Selvaraj, Predictive maintenance for wind turbine diagnostics using vibration signal analysis based on collaborative recommendation approach, 2016 International Conference on Advances in Computing, Communications and Informatics (ICACCI), IEEE, 2016.
- Hsu J. Y., Wang Y. F., Lin K. C., Chen M. Y., & Hsu J. H. Y., Wind turbine fault diagnosis and predictive maintenance through statistical process control and machine learning. Ieee Access, vol. 8, 23427-23439, 2020.
- Kaparthi, Shashidhar, and Daniel Bumblauskas, Designing predictive maintenance systems using decision tree-based machine learning techniques, International Journal of Quality & Reliability, Management, 2020.
- Kim Ji Soo, Jun Kim, and Ju Yeon Lee, Die-Casting Defect Prediction and Diagnosis System using Process Condition Data, Procedia Manufacturing, vol. 51, pp.359-364, 2020.
- Kolokas N., Vafeiadis T., Ioannidis D. & Tzovaras D, Forecasting faults of industrial equipment using machine learning classifiers, In 2018 Innovations in Intelligent Systems and Applications (INISTA), pp. 1-6, IEEE, July 2018.
- Lasisi, Ahmed and Nii Attoh-Okine, Principal components analysis and track quality index: A machine learning approach, Transportation Research Part C: Emerging Technologies, vol. 91, pp. 230-248, 2018.
- Liao Haitao, Wenbiao Zhao, and Huairui Guo, Predicting remaining useful life of an individual unit using proportional hazards model and logistic regression model, RAMS'06. Annual Reliability and Maintainability Symposium, 2006, IEEE, 2006.
- Wu Z., Lin W., Zhang Z., Wen A., & Lin L., An ensemble random forest algorithm for insurance big data analysis. In 2017 IEEE International Conference on Computational Science and Engineering (CSE) and IEEE International Conference on Embedded and Ubiquitous Computing (EUC), vol. 1, pp. 531-536, July 2017.
- Mathew V., Toby T., Singh V., Rao B. M., & Kumar M. G., Prediction of Remaining Useful Lifetime (RUL) of turbofan engine using machine learning. In 2017 IEEE International Conference on Circuits and Systems (ICCS), pp. 306-311, IEEE, December 2017.
- Nourian-Avval, Ahmad, and Ali Fatemi., Fatigue life prediction of cast aluminum alloy based on porosity characteristics, Theoretical and Applied Fracture Mechanics 109: 102774, 2020.
- Park Sangwoo, Kim Changgyun, and Sekyoung Youm., Establishment of an IoT-based smart factory and data analysis model for the quality management of SMEs die-casting companies in Korea, International Journal of Distributed Sensor Networks 15.10, 1550147719879378, 2019.
- Phillips J., Cripps E., Lau J. W., & Hodkiewicz M. R., Classifying machinery condition using oil samples and binary logistic regression, Mechanical Systems and Signal Processing, vol.60, pp. 316-325, 2015.
- Prytz R., Nowaczyk S., Rögnvaldsson T., & Byttner S., Predicting the need for vehicle compressor repairs using maintenance records and logged vehicle data, Engineering applications of artificial intelligence, vol. 41, pp. 139-150, 2015.
- Rai R., Tiwari, M. K., Ivanov, D., & Dolgui, A., Machine learning in manufacturing and industry 4.0 applications, J. of Production Research, 2021.
- Rønsch G. Ø., Kulahci M., & Dybdahl M., An investigation of the utilisation of different data sources in manufacturing with application in injection moulding, International Journal of Production Research, pp. 1-18, 2021.
- Su C. J., & Huang S. F, Real-time big data analytics for hard disk drive predictive maintenance, Computers & Electrical Engineering, vol. 71, pp. 93-101, 2018.
- Zhang Zhongju, and Pengzhu Zhang, Seeing around the corner: an analytic approach for predictive maintenance using sensor data. "Journal of Management Analytics 2.4, pp. 333-350, 2015.
専門家Q&A:トップ質問への回答
Q1: なぜこの研究では、一般的に高性能とされるランダムフォレスト(RF)よりも決定木(DT)が優れていると結論付けられたのですか?
A1: 精度(Accuracy)だけを見ると、RF(95.85%)はDT(91.18%)より高く見えます。しかし、本研究のデータセットは良品が圧倒的に多く、不良品が極端に少ない「不均衡データ」でした。その結果、RFとロジスティック回帰(LR)は不良品を一件も予測できず、すべてを良品と判断してしまいました。一方、DTは不良品と良品の両方を予測する能力があり、そのバランスを示すG-mean値が唯一有効な数値(0.28)を示しました。実際の製造現場では不良品を見逃さないことが最も重要であるため、DTが最も実用的なモデルと評価されました。
Q2: ポロシティ欠陥に最も影響を与えた「Factor 26」とは、具体的にどのようなパラメータですか?
A2: 論文では「Factor 26 (pressure releasing factor)」と記述されており、圧力解放に関連するパラメータであることが示唆されています。ダイカストプロセスにおいて、圧力解放のタイミングや速度は、溶湯内に巻き込まれたガスが製品外部へ排出されるか、内部に残留するかに大きく影響します。このパラメータがポロシティ形成の最大の要因であったという結果は、固化プロセス中のガス管理が品質確保において極めて重要であることを裏付けています。
Q3: この研究は1台の機械からのデータのみを使用していますが、その結果は他の機械にも一般化できますか?
A3: 本研究はプロトタイプとして設定された1台の機械から5ヶ月間のデータを収集しており、その期間内のプロセス変動を代表しているとされています。しかし、機械ごとの個体差や経年劣化も考慮する必要があるため、このモデルを他の機械に直接適用する際には注意が必要です。モデルを一般化するためには、複数の機械からデータを収集し、モデルを再学習または調整することが推奨されます。この研究は、そのための強力な第一歩と言えます。
Q4: データセットの不均衡問題について言及されていますが、これを解決するための今後のアプローチはありますか?
A4: 論文の結論部分で、今後の課題として不均衡データセットの見直しと最適化が必要であると指摘されています。これを解決する一般的な手法としては、オーバーサンプリング(少数派である不良品データを複製して増やす)やアンダーサンプリング(多数派である良品データを減らす)、あるいはSMOTEのような合成データ生成技術を用いて、モデルが不良品の特徴をより効果的に学習できるようにデータバランスを調整することが考えられます。これにより、予測精度をさらに向上させることが期待できます。
Q5: この予測モデルを実際の生産ラインに導入する際の注意点は何ですか?
A5: 論文では、モデルの予測結果を現場の専門家(Subject-Matter Expert, SME)と共に継続的に検証することの重要性が強調されています。モデルはあくまでデータに基づいた予測であり、原材料のロット変動や金型の摩耗など、データに含まれていない新たな要因が発生する可能性があります。そのため、モデルの予測と実際の生産結果を定期的に照らし合わせ、モデルを更新・メンテナンスしていくプロセスが、実用化において不可欠です。
結論:より高い品質と生産性への道筋
HDD部品のダイカスト工程におけるポロシティ欠陥という深刻な課題に対し、本研究は機械学習を用いたダイカスト 欠陥予測の有効性を明確に示しました。特に、決定木アルゴリズムが、圧力解放や高速射出といった重要パラメータを基に、不良品の発生を実用的なレベルで予測する上で最も優れたアプローチであることが明らかになりました。この知見は、従来の検査に依存した品質管理から、データ駆動型の予防的な品質管理へと移行するための重要な道筋を示しています。
CASTMANでは、最新の業界研究を応用し、お客様の生産性と品質の向上を支援することに尽力しています。本論文で議論された課題がお客様の事業目標と一致する場合、ぜひ当社のエンジニアリングチームにご相談ください。これらの原理をいかにお客様の部品製造に適用できるか、共に探求してまいります。
著作権情報
- このコンテンツは、Pavee Siriruk氏およびTitiwetaya Yaikratok氏による論文「Factors Analysis and Prediction in Die-casting Process for Defects Reduction」に基づく要約および分析です。
- 出典: https://www.iieom.org/proceedings/2022istanbul/453.pdf
本資料は情報提供のみを目的としています。無断での商業利用は禁じられています。 Copyright © 2025 CASTMAN. All rights reserved.