Predicting the most suitable pump: Streamlining the quotation process with XGBoost
Tiensuu, Taru (2025)
Tiensuu, Taru
2025
Teknis-luonnontieteellinen DI-ohjelma - Master's Programme in Science and Engineering
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2025-11-07
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2025110610445
https://urn.fi/URN:NBN:fi:tuni-2025110610445
Tiivistelmä
Centrifugal pumps are a vital part of daily operations in the hydraulic transport of solids. Common applications of slurry pumps in hydraulic transportation include industries such as metallurgy, mining, chemical processing, and agriculture. A slurry pump is a heavy and robust version of a centrifugal pump and is more capable of handling tough and abrasive duties.
The pump quotation process starts with the arrival of the customer’s inquiry. The customer provides specifications for their application, based on which the proposal engineer starts to identify the most suitable pump using different systems, basic guidelines, and especially their personal knowledge. The selection of the most suitable slurry pump has been identified as a bottleneck in the pump quotation process, particularly due to the complexity of the decision and its impact on time management. This challenge can be addressed using a machine learning classification method. A classification model predicts the pump model based on the customer’s needs, application requirements, and slurry characteristics. Developing an AI-boosted recommendation system should make proposals more likely to lead to successful sales, enable faster turnaround times, and build a more standardized way of working globally.
XGBoost is a scalable machine learning system for tree boosting. It is based on the core principle of gradient boosting, where each new decision tree is integrated with the previous to reduce the overall prediction error. It is widely used in various machine learning challenges, standing out for its scalability and effectiveness across different scenarios. XGBoost has also gained widespread recognition for its strong performance and reliability in major machine learning competitions.
The aim of this thesis was to find a solution on how to implement an XGBoost Classifier to streamline the pump quotation process to more efficiently identify the best options for a given quotation. The best option is defined by the choices made by the proposal engineers, with the pump models selected in the previous quotations serving as targets for training the predictive model. For a new quotation, predictions are generated from the inquiry data, which captures the specific requirements of the application and serves as the input of the model. The resulting machine learning tool was intended to serve as a support tool for proposal engineers in their final decision making while acknowledging that the expert retains responsibility for the final decision.
During the project, the entire process was implemented, from data integrations to model training and monitoring the utilization rate. The resulting XGBoost Classifier model now predicts a predefined number of top options and presents the results together with the corresponding probabilities. The model was also trained to highlight the won cases and to include the commercial aspects of the decision process. This thesis presents an introduction to slurry pumps, the mathematical background of XGBoost, the training data and its features, and the model training, prediction, and results process. The work was implemented for Metso Finland Oy in collaboration with the pumps business line and the Data and AI team. Keskipakopumput ovat tärkeässä osassa kiinteiden aineiden hydraulisessa siirrossa. Esimerkkejä keskipakopumppujen käyttökohteista ovat muun muassa metallurgia, kaivosteollisuus, kemiallinen prosessointi sekä maatalous. Lietepumppu on puolestaan erityisen kookas ja kestävä versio keskipakopumpusta, joka siten soveltuu erityisesti vaativiin ja kuluttaviin sovelluskohteisiin.
Lietepumppujen tarjousprosessi alkaa asiakkaan tarjouspyynnön vastaanottamisesta. Asiantuntija valitsee mielestään sopivimman pumpun asiakkaan sovelluskohteiden vaatimusten mukaisesti hyödyntäen erilaisia järjestelmiä, yleisiä ohjeistuksia sekä erityisesti henkilökohtaista osaamistaan. Lietepumppumallin valinta on tunnistettu rajoittavaksi tekijäksi pumppujen tarjousprosessissa erityisesti ajankäytön sekä päätöksen haastavuuden näkökulmista. Tämä haaste voidaan ratkaista käyttämällä koneoppimisen luokittelumenetelmää. Luokittelumallin avulla ennustetaan pumppumalli asiakkaan tarpeiden, sovellusvaatimusten ja lietteen ominaisuuksien perusteella. Koneoppimisjärjestelmän kehittäminen parantaisi myyntiin johtavien tarjousten osuutta, mahdollistaisi nopeammat tarjousten läpimenoajat sekä vahvistaisi standardisoitua, globaalia työskentelytapaa.
XGBoost on yksi laajimmin käytetyistä koneoppimismenetelmistä erottuen skaalautuvuutensa ja tehokkuutensa ansiosta edukseen monipuolisissa koneoppimistehtävissä. XGBoost perustuu gradienttitehostettujen päätöspuiden perusperiaatteeseen, jossa jokainen uusi päätöspuu pyrkii minimoimaan ennusteiden virheitä. XGBoost on myös saavuttanut laajaa tunnustusta vahvan suorituskykynsä ja luotettavuutensa vuoksi suurissa koneoppimisen kilpailuissa.
Tämän opinnäytetyön tavoitteena oli tuottaa tekoälyratkaisu, jossa XGBoost-luokittelijaa voidaan hyödyntää lietepumpun tarjousprosessin tehostamiseen. Paras vaihtoehto kuvastaa tässä asiayhteydessä alan asiantuntijoiden tekemiä pumppuvalintoja, sillä ennustava malli koulutetaan aiemman tarjousdatan sisältämien pumppumallien perusteella. Ennuste uudelle tarjoukselle luodaan perustuen sovelluskohteen vaatimuksia kuvaavaan dataan, joka toimii mallin syötteenä. Tuloksena saatava koneoppimismalli on suunniteltu toimimaan alan asiantuntijoiden lopullista päätöksentekoa tukevana työkaluna siten, että vastuu lopullisesta päätöksestä on asiantuntijan.
Tässä projektissa toteutettiin koko prosessi dataintegraatioista mallin koulutukseen ja käyttöasteen seurantaan. Lopputuloksena syntynyt XGBoost-luokittelijamalli ennustaa ennalta määritellyn lukumäärän parhaita pumppuvaihtoehtoja kullekin tarjouspyynnölle ja esittää tulokset yhdessä niitä vastaavien todennäköisyyksien kanssa. Malli koulutettiin myös korostamaan voitettuja tarjouksia sekä ottamaan huomioon päätösprosessin kaupallisia näkökulmia. Tämä opinnäytetyö tarjoaa yleiskatsauksen lietepumppuihin sekä esittelee XGBoostin matemaattisen taustan, koulutusdatan ja sen ominaisuudet sekä mallin koulutus-, ennuste- ja tulosprosessin. Työ toteutettiin Metso Finland Oy:lle yhteistyössä pumppujen liiketoimintayksikön sekä data- ja tekoälytiimin kanssa.
The pump quotation process starts with the arrival of the customer’s inquiry. The customer provides specifications for their application, based on which the proposal engineer starts to identify the most suitable pump using different systems, basic guidelines, and especially their personal knowledge. The selection of the most suitable slurry pump has been identified as a bottleneck in the pump quotation process, particularly due to the complexity of the decision and its impact on time management. This challenge can be addressed using a machine learning classification method. A classification model predicts the pump model based on the customer’s needs, application requirements, and slurry characteristics. Developing an AI-boosted recommendation system should make proposals more likely to lead to successful sales, enable faster turnaround times, and build a more standardized way of working globally.
XGBoost is a scalable machine learning system for tree boosting. It is based on the core principle of gradient boosting, where each new decision tree is integrated with the previous to reduce the overall prediction error. It is widely used in various machine learning challenges, standing out for its scalability and effectiveness across different scenarios. XGBoost has also gained widespread recognition for its strong performance and reliability in major machine learning competitions.
The aim of this thesis was to find a solution on how to implement an XGBoost Classifier to streamline the pump quotation process to more efficiently identify the best options for a given quotation. The best option is defined by the choices made by the proposal engineers, with the pump models selected in the previous quotations serving as targets for training the predictive model. For a new quotation, predictions are generated from the inquiry data, which captures the specific requirements of the application and serves as the input of the model. The resulting machine learning tool was intended to serve as a support tool for proposal engineers in their final decision making while acknowledging that the expert retains responsibility for the final decision.
During the project, the entire process was implemented, from data integrations to model training and monitoring the utilization rate. The resulting XGBoost Classifier model now predicts a predefined number of top options and presents the results together with the corresponding probabilities. The model was also trained to highlight the won cases and to include the commercial aspects of the decision process. This thesis presents an introduction to slurry pumps, the mathematical background of XGBoost, the training data and its features, and the model training, prediction, and results process. The work was implemented for Metso Finland Oy in collaboration with the pumps business line and the Data and AI team.
Lietepumppujen tarjousprosessi alkaa asiakkaan tarjouspyynnön vastaanottamisesta. Asiantuntija valitsee mielestään sopivimman pumpun asiakkaan sovelluskohteiden vaatimusten mukaisesti hyödyntäen erilaisia järjestelmiä, yleisiä ohjeistuksia sekä erityisesti henkilökohtaista osaamistaan. Lietepumppumallin valinta on tunnistettu rajoittavaksi tekijäksi pumppujen tarjousprosessissa erityisesti ajankäytön sekä päätöksen haastavuuden näkökulmista. Tämä haaste voidaan ratkaista käyttämällä koneoppimisen luokittelumenetelmää. Luokittelumallin avulla ennustetaan pumppumalli asiakkaan tarpeiden, sovellusvaatimusten ja lietteen ominaisuuksien perusteella. Koneoppimisjärjestelmän kehittäminen parantaisi myyntiin johtavien tarjousten osuutta, mahdollistaisi nopeammat tarjousten läpimenoajat sekä vahvistaisi standardisoitua, globaalia työskentelytapaa.
XGBoost on yksi laajimmin käytetyistä koneoppimismenetelmistä erottuen skaalautuvuutensa ja tehokkuutensa ansiosta edukseen monipuolisissa koneoppimistehtävissä. XGBoost perustuu gradienttitehostettujen päätöspuiden perusperiaatteeseen, jossa jokainen uusi päätöspuu pyrkii minimoimaan ennusteiden virheitä. XGBoost on myös saavuttanut laajaa tunnustusta vahvan suorituskykynsä ja luotettavuutensa vuoksi suurissa koneoppimisen kilpailuissa.
Tämän opinnäytetyön tavoitteena oli tuottaa tekoälyratkaisu, jossa XGBoost-luokittelijaa voidaan hyödyntää lietepumpun tarjousprosessin tehostamiseen. Paras vaihtoehto kuvastaa tässä asiayhteydessä alan asiantuntijoiden tekemiä pumppuvalintoja, sillä ennustava malli koulutetaan aiemman tarjousdatan sisältämien pumppumallien perusteella. Ennuste uudelle tarjoukselle luodaan perustuen sovelluskohteen vaatimuksia kuvaavaan dataan, joka toimii mallin syötteenä. Tuloksena saatava koneoppimismalli on suunniteltu toimimaan alan asiantuntijoiden lopullista päätöksentekoa tukevana työkaluna siten, että vastuu lopullisesta päätöksestä on asiantuntijan.
Tässä projektissa toteutettiin koko prosessi dataintegraatioista mallin koulutukseen ja käyttöasteen seurantaan. Lopputuloksena syntynyt XGBoost-luokittelijamalli ennustaa ennalta määritellyn lukumäärän parhaita pumppuvaihtoehtoja kullekin tarjouspyynnölle ja esittää tulokset yhdessä niitä vastaavien todennäköisyyksien kanssa. Malli koulutettiin myös korostamaan voitettuja tarjouksia sekä ottamaan huomioon päätösprosessin kaupallisia näkökulmia. Tämä opinnäytetyö tarjoaa yleiskatsauksen lietepumppuihin sekä esittelee XGBoostin matemaattisen taustan, koulutusdatan ja sen ominaisuudet sekä mallin koulutus-, ennuste- ja tulosprosessin. Työ toteutettiin Metso Finland Oy:lle yhteistyössä pumppujen liiketoimintayksikön sekä data- ja tekoälytiimin kanssa.