Cell Detection from Microscope Images Using Histogram of Oriented Gradients
Tikkanen, Tuomas Tapani (2014)
Tikkanen, Tuomas Tapani
2014
Signaalinkäsittelyn ja tietoliikennetekniikan koulutusohjelma
Tieto- ja sähkötekniikan tiedekunta - Faculty of Computing and Electrical Engineering
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2014-12-03
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tty-201412021562
https://urn.fi/URN:NBN:fi:tty-201412021562
Tiivistelmä
In this master's thesis, cell detection from bright-field microscope images is studied using Histogram of Oriented Gradients (HOG) features with Support Vector Machine supervised learning classifier. The proposed method is trained iteratively by finding hard examples. The performance of the method is evaluated using 16 training and 12 test images with altogether 10736 PC3 human prostate cancer cells. The cell detection accuracy is assessed with Receiver Operating Characteristic curves, F1-score and Bivariate Similarity Index. Decision between true positive and false positive detection is made using PAS-metric.
The experiments consider various parameters and their effect on performance. It is shown that using hard examples in the training phase increases the level of generalization of the model considerably. ROC AUC reaches an excellent value of 0.98 after iterative training. When SVM threshold is varied for each image in the testing phase, F1-score averaged over the peak F1-scores of each image reaches a high value of 0.85. The most suitable combinations of HOG descriptor parameter values are presented. All in all, results indicate that HOG can be successfully applied to bright-field microscope images of PC3 prostate cancer cells taken on subsequent days, which results in a growth curve that favorably agrees with manual counts. The implemented cell detection framework outperforms humans in terms of consistency, objectivity and speed. Tässä diplomityössä tutkitaan solujen tunnistamista mikroskooppikuvista käyttäen Histogram of Oriented Gradients (HOG) piirteitä. Hahmontunnisprosessiin HOG piirteitä käyttäen sisältyy luokitus lineaarisella tukivektorikoneella (SVM), joka on ohjatun oppimisen luokitinmalli. Työssä esitetyssä menetelmässä luokitinmalli opetetaan iteratiivisesti etsien vaikeita esimerkkejä. Menetelmän tarkkuutta tarkastellaan käyttäen opetusvaiheessa 16:ta kuvaa ja testausvaiheessa 12:ta kuvaa. Mikroskooppikuvat on otettu kirkaskenttäoptiikalla (bright-field microscopy) ihmisen eturauhassyöpäsoluviljelmästä (PC3), mihin on merkitty puoliautomaattisesti yhteensä 10736 solua. Menetelmän tarkkuutta arvioidaan käyttäen käyttäen Receiver Operating Characteristic käyriä, sekä F1-score ja Bivariate Similarity Index metriikoita. Päätös oikean ja väärän tunnistuksen välillä tehdään käyttäen PAS-metriikkaa.
Tulokset osoittavat, että HOG piirteitä voidaan käyttää onnistuneesti solujen tunnistuksessa mikroskooppikuvista. Peräkkäisinä päivinä soluviljelmästä otetuista kuvista voidaan esitetyn menetelmän avulla arvioida kasvukäyrä, jonka ennustamat solujen lukumäärät vastaavat suotuisasti käsin laskettujen solujen lukumääriä. Otettaessa vaikeat esimerkit mukaan opetukseen, väärien tunnistusten määrä pienenee huomattavasti. Vaikeiden esimerkkien etsinnän jälkeen luokittimen tarkkuus mitattuna ROC käyrän alle jäävänä pinta-alana saa korkeasta luokitustarkkuudesta kertovan arvon 0.98. Menetelmän toimivuuden puolesta puhuu myös F1-score, jonka suuruus on 0.85 keskiarvoistettuna kaikkien testikuvien yli, kun kullekin kuvalle ideaalista SVM herkkyyttä on sovellettu. Työn johtopäätöksenä todetaan, että toteutettu menetelmä laskee solut riittävällä tarkkuudella sekä objektiivisemmin että nopeammin kuin ihmiset ja on näin ollen varteenotettava lähestymistapa automaattisessa solujen tunnistamisessa mikroskooppikuvista.
The experiments consider various parameters and their effect on performance. It is shown that using hard examples in the training phase increases the level of generalization of the model considerably. ROC AUC reaches an excellent value of 0.98 after iterative training. When SVM threshold is varied for each image in the testing phase, F1-score averaged over the peak F1-scores of each image reaches a high value of 0.85. The most suitable combinations of HOG descriptor parameter values are presented. All in all, results indicate that HOG can be successfully applied to bright-field microscope images of PC3 prostate cancer cells taken on subsequent days, which results in a growth curve that favorably agrees with manual counts. The implemented cell detection framework outperforms humans in terms of consistency, objectivity and speed.
Tulokset osoittavat, että HOG piirteitä voidaan käyttää onnistuneesti solujen tunnistuksessa mikroskooppikuvista. Peräkkäisinä päivinä soluviljelmästä otetuista kuvista voidaan esitetyn menetelmän avulla arvioida kasvukäyrä, jonka ennustamat solujen lukumäärät vastaavat suotuisasti käsin laskettujen solujen lukumääriä. Otettaessa vaikeat esimerkit mukaan opetukseen, väärien tunnistusten määrä pienenee huomattavasti. Vaikeiden esimerkkien etsinnän jälkeen luokittimen tarkkuus mitattuna ROC käyrän alle jäävänä pinta-alana saa korkeasta luokitustarkkuudesta kertovan arvon 0.98. Menetelmän toimivuuden puolesta puhuu myös F1-score, jonka suuruus on 0.85 keskiarvoistettuna kaikkien testikuvien yli, kun kullekin kuvalle ideaalista SVM herkkyyttä on sovellettu. Työn johtopäätöksenä todetaan, että toteutettu menetelmä laskee solut riittävällä tarkkuudella sekä objektiivisemmin että nopeammin kuin ihmiset ja on näin ollen varteenotettava lähestymistapa automaattisessa solujen tunnistamisessa mikroskooppikuvista.