Workpiece detection using machine vision
Pohja, Miikka (2024)
Pohja, Miikka
2024
Teknisten tieteiden kandidaattiohjelma - Bachelor's Programme in Engineering Sciences
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2024-12-11
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2024121110978
https://urn.fi/URN:NBN:fi:tuni-2024121110978
Tiivistelmä
This bachelor’s thesis explores the use of machine vision to detect workpieces in industrial settings, focusing on identifying the optimal techniques and requirements for this task.
The study begins with an introduction to machine vision, emphasizing its role in automating inspection and identifcation processes within intelligent factories. Key research questions address what the essential components of machine vision systems are and how they work, what are the requirements for a machine vision system used for detecting workpieces and what are the object detection techniques behind these systems and how do they compare to each other. The research methodology is based on a literature review of academic literature.
The document outlines both classical and modern object detection techniques. Classical methods include edge detection, HOG (Histogram of Oriented Gradients), and SIFT (Scale-Invariant Feature Transform), which rely on lower computational requirements but lack the accuracy and precision. Modern deep learning approaches, such as R-CNN (Region-based Convolutional Neural Network) and YOLO (You Only Look Once), offer improved accuracy when detecting workpieces, with YOLO achieving real-time detection capabilities crucial for industrial applications.
The study evaluates these techniques based on accuracy, precision speed, and ease of implementation. YOLO is identifed as the best method on average as it has a great balance of speed and accuracy. Though classical methods remain viable in low-cost or resource-constrained environments. RCNN should not be considered in a factory environment as it can not meet real-time requirements and is costly to develop.
In conclusion, this study advocates for YOLOs usage in real-time industrial applications while acknowledging the limitations of the study, such as the exclusion of newer model versions and the need for consistent testing hardware. Future research suggestions include exploring advanced versions of these models and conducting direct comparisons using standardized datasets. Tässä kandidaatin tutkielmassa tutkitaan konenäön käyttöä työkappaleiden tunnistamiseen teollisessa ympäristössä. Keskittyy optimaalisten tekniikoiden ja vaatimusten määrittämiseen tätä tehtävää varten. Tutkimus alkaa johdannolla konenäköön, jossa korostetaan sen roolia tarkastusja tunnistamisprosessien automatisoinnissa älykkäissä tehtaissa. Keskeiset tutkimuskysymykset koskevat konenäköjärjestelmien olennaisia komponentteja, toiminnallisia ja epätoiminnallinen vaatimuksia sekä erilaisten kappaleiden tunnistustekniikoiden vertailua. Tutkimusmenetelmä perustuu akateemisten lähteiden kirjallisuuskatsaukseen.
Tässä dokumentissa tutkitaan sekä klassisia että nykyaikaisia kohteiden tunnistustekniikoita. Klassisiin menetelmiin kuuluvat edge detection, HOG (Histogram of Oriented Gradients) ja SIFT (Scale-Invariant Feature Transform), jotka tarvitsevat vähemmän laskentatehoa, mutta niiden tarkkuus voi olla riittämätön tietyissä sovelluksissa. Nykyaikaiset syväoppimismenetelmät, kuten RCNN (Region-based Convolutional Neural Network) ja YOLO (You Only Look Once), tarjoavat parempaa tarkkuutta ja YOLO täyttää reaaliaikaisuusvaatimuksen, joka on ratkaiseva kriteeri teollisissa ympäristössä.
Tutkimuksessa arvioidaan näitä tekniikoita tarkkuuden, täsmällisyyden, laskennallisen nopeuden ja toteutuksen helppouden perusteella. YOLO-menetelmää suositellaan nopeuden ja tarkkuuden tasapainon vuoksi, vaikka klassiset menetelmät ovat edelleen käyttökelpoisia tilanteissa, jossa alhaiset kustannukset ja resurssien puute ovat keskeisiä tekijöitä.
Yhteenvetona tässä tutkimuksessa suositellaan YOLO:n käyttöä reaaliaikaisissa teollisuussovelluksissa, mutta samalla kiinnitetään huomiota tutkimuksen rajoituksiin, kuten uudempien versioiden poissulkeminen. Tulevien tutkimuksien suositellaan tarkastelevan kehittyneempiä versioita ja käyttävän keskenään samanlaisia testauspaketteja suorien vertailujen toteuttamiseksi.
The study begins with an introduction to machine vision, emphasizing its role in automating inspection and identifcation processes within intelligent factories. Key research questions address what the essential components of machine vision systems are and how they work, what are the requirements for a machine vision system used for detecting workpieces and what are the object detection techniques behind these systems and how do they compare to each other. The research methodology is based on a literature review of academic literature.
The document outlines both classical and modern object detection techniques. Classical methods include edge detection, HOG (Histogram of Oriented Gradients), and SIFT (Scale-Invariant Feature Transform), which rely on lower computational requirements but lack the accuracy and precision. Modern deep learning approaches, such as R-CNN (Region-based Convolutional Neural Network) and YOLO (You Only Look Once), offer improved accuracy when detecting workpieces, with YOLO achieving real-time detection capabilities crucial for industrial applications.
The study evaluates these techniques based on accuracy, precision speed, and ease of implementation. YOLO is identifed as the best method on average as it has a great balance of speed and accuracy. Though classical methods remain viable in low-cost or resource-constrained environments. RCNN should not be considered in a factory environment as it can not meet real-time requirements and is costly to develop.
In conclusion, this study advocates for YOLOs usage in real-time industrial applications while acknowledging the limitations of the study, such as the exclusion of newer model versions and the need for consistent testing hardware. Future research suggestions include exploring advanced versions of these models and conducting direct comparisons using standardized datasets.
Tässä dokumentissa tutkitaan sekä klassisia että nykyaikaisia kohteiden tunnistustekniikoita. Klassisiin menetelmiin kuuluvat edge detection, HOG (Histogram of Oriented Gradients) ja SIFT (Scale-Invariant Feature Transform), jotka tarvitsevat vähemmän laskentatehoa, mutta niiden tarkkuus voi olla riittämätön tietyissä sovelluksissa. Nykyaikaiset syväoppimismenetelmät, kuten RCNN (Region-based Convolutional Neural Network) ja YOLO (You Only Look Once), tarjoavat parempaa tarkkuutta ja YOLO täyttää reaaliaikaisuusvaatimuksen, joka on ratkaiseva kriteeri teollisissa ympäristössä.
Tutkimuksessa arvioidaan näitä tekniikoita tarkkuuden, täsmällisyyden, laskennallisen nopeuden ja toteutuksen helppouden perusteella. YOLO-menetelmää suositellaan nopeuden ja tarkkuuden tasapainon vuoksi, vaikka klassiset menetelmät ovat edelleen käyttökelpoisia tilanteissa, jossa alhaiset kustannukset ja resurssien puute ovat keskeisiä tekijöitä.
Yhteenvetona tässä tutkimuksessa suositellaan YOLO:n käyttöä reaaliaikaisissa teollisuussovelluksissa, mutta samalla kiinnitetään huomiota tutkimuksen rajoituksiin, kuten uudempien versioiden poissulkeminen. Tulevien tutkimuksien suositellaan tarkastelevan kehittyneempiä versioita ja käyttävän keskenään samanlaisia testauspaketteja suorien vertailujen toteuttamiseksi.
Kokoelmat
- Kandidaatintutkielmat [8894]