Memory disorder detection using facial expression analysis
Ruoranen, Julia (2023)
Ruoranen, Julia
2023
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-29
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202305155791
https://urn.fi/URN:NBN:fi:tuni-202305155791
Tiivistelmä
Facial expressions are people’s way of communicating and interact with each other. Without saying a word person can message his/her emotions by them. When there happen some changes in facial expressions it can affect person’s social interaction and relationships. Changes in facial expressions occur with memory disorder. Of the individual symptoms, apathy in particular reduces the intensity of the facial expressions, making the face expressionless.
The purpose of this thesis was to explore how the facial expression recognition program could be applied when searching memory disorder. The focus is on apathy as a symptom because it correlates clearest with changes in facial expressions. The idea was to recognize facial expressions from two video clips. The difference between the clips was that the first one had spontaneous reactions for a funny video and second one expressionless reaction to the same video. Recognized expressions were analyzed and the differences between the videos were spotted to show how the apathic facial expressions differ from normally produced facial expressions.
The program was built by using Python facial expressions analysis toolbox (PyFeat) which contains tools for analyzing and visualizing facial expressions. Detector for facial expression analysis was built by using PyFeat’s pretrained detectors (face, facial landmarks, pose, action units and emotions). This detector recognized expressions from the videos and produces data of face and facial landmark location, action units’ prediction values and emotional reactions’ prediction values.
Biggest differences between the videos were found in action units’ and emotions’ prediction values. Action unit values showed that movement in any action unit area were minimum since the values stayed in 0.5 and under the whole video. While comparing the certain action units which produces emotional reaction of happiness (the emotion which was tried to trigger with the video) the spontaneous video’s values were high most time of the video while the apathic video showed no movement in these action units during the video. Emotion prediction values showed as well that the maintaining emotion in the spontaneous video was happiness but in the apathic video the maintaining emotion was neutral. Neutral facial expression was there to describe where there is no visible emotion in the face.
Neutral expression is main thing to focus when trying to find out if the memory disorder exists. Important thing to notice is that some reference data is needed when analyzing someone’s facial expression changes since people have differences in facial expressiveness in usual. In the future the concrete differences need to be identified if the facial expression analysis is wanted to be used as a memory disorder detection method. Kasvonilmeet ovat kommunikoinnin ja viestinnän keino ihmisten välillä. Niiden avulla ihmiset kykenevät viestimään omista tunnetiloistaan ilman sanallista viestiä. Kun ilmeissä tapahtuu muutoksia, voi se vaikuttaa ihmisen vuorovaikutukseen ja sosiaalisiin suhteisiin. Muistisairaudet ovat yksi ilmeissä tapahtuvien muutosten aiheuttajista. Yksittäisistä oireista erityisesti apatia vähentää ilmeiden voimakkuutta tehden kasvoista ilmeettömämmät.
Työn tarkoituksena oli tutkia, miten kasvonilmeitä tunnistavaa ohjelmaa voisi hyödyntää muistisairauden etsimisessä. Keskittymiskohtana oireista toimi nimenomaan apatia, koska aiemmissa tutkimuksissa oli löydetty selkeää korrelaatiota apatian ja kasvonilmeiden muutosten välille. Ohjelman ideana oli tunnistaa kasvonilmeet kahdesta videoklipistä. Analysoitavat video-klipit oli luotu siten, että ensimmäisessä videossa oli spontaani reaktio ja toisessa ilmeettömäm-pi reaktio hauskaan videoon. Analyysin tuloksia tutkimalla etsittiin eroja videoiden välillä, jotta pystytään esittämään, miten apaattiset kasvonilmeet eroavat tavallisista kasvonilmeistä.
Ohjelma rakennettiin käyttäen Python Facial Expression Analysis Toolbox:ia (PyFeat), joka sisältää malleja ja työkaluja kasvonilmeiden tunnistamiseen ja analysointiin. PyFeat:in avulla luotiin ns. etsintätyökalu, joka koostui PyFeat:n omista esiharjoitetuista etsintäkomponenteista. Etsintätyökalu tunnistaa kasvonilmeet ja tuottaa dataa kasvojen ja kasvonpiirteiden sijainnista videolla, pään ja kasvojen asennosta sekä toimintayksiköiden (action units) ja ilmeiden ennus-tearvoista.
Suurimmat erot videoiden välillä löydettiin toimintayksiköiden ja ilmeiden ennustearvoista. Il-meettömän videon kohdalla missään toimintayksikössä ei tapahtunut aktivoitumista eli ennus-tearvo 0.5 tai alle, mikä viittaa siihen, että kasvoissa ei tapahtunut liikettä ilmeitä tuottavissa li-haksissa. Ilon tunnetta tuottavissa toimintayksiköissä oli selkeä ero videoiden välillä: spontaa-nissa videossa toimintayksiköt olivat selkeästi aktiiviset eli ennustearvo yli 0.8 koko videon ajan, kun taas ilmeettömän videon kohdalla ennustearvot pysyivät lähellä nollaa. Ilmeiden ennustear-voissa ilon tunne oli selkeästi läsnä koko spontaanin videon ajan, apaattisella videolla taas koko videon tunnetila on neutraali. Neutraali tunnetila on kuvastamassa tilannetta, jossa kasvoilla ei ole mitään näkyvää tunnereaktiota.
Neutraali tunnetila ja tunnetilojen ennustearvot muutenkin ovat tärkein keskittymiskohta, kun yritetään etsiä muistisairauteen viittavia piirteitä. On hyvä kuitenkin muistaa, että jonkinlaista re-ferenssimateriaalia tarvitaan, kun analysoidaan kasvonilmeiden muutoksia, sillä kasvojen il-meikkyydessä on lähtökohtaisesti eroja ihmisten välillä. Tulevaisuudessa konkreettisia muutok-sia pitäisi identifioida tarkemmin, mikäli kasvonilmeiden analyysia halutaan hyödyntää muistisai-rauden etsinnässä.
The purpose of this thesis was to explore how the facial expression recognition program could be applied when searching memory disorder. The focus is on apathy as a symptom because it correlates clearest with changes in facial expressions. The idea was to recognize facial expressions from two video clips. The difference between the clips was that the first one had spontaneous reactions for a funny video and second one expressionless reaction to the same video. Recognized expressions were analyzed and the differences between the videos were spotted to show how the apathic facial expressions differ from normally produced facial expressions.
The program was built by using Python facial expressions analysis toolbox (PyFeat) which contains tools for analyzing and visualizing facial expressions. Detector for facial expression analysis was built by using PyFeat’s pretrained detectors (face, facial landmarks, pose, action units and emotions). This detector recognized expressions from the videos and produces data of face and facial landmark location, action units’ prediction values and emotional reactions’ prediction values.
Biggest differences between the videos were found in action units’ and emotions’ prediction values. Action unit values showed that movement in any action unit area were minimum since the values stayed in 0.5 and under the whole video. While comparing the certain action units which produces emotional reaction of happiness (the emotion which was tried to trigger with the video) the spontaneous video’s values were high most time of the video while the apathic video showed no movement in these action units during the video. Emotion prediction values showed as well that the maintaining emotion in the spontaneous video was happiness but in the apathic video the maintaining emotion was neutral. Neutral facial expression was there to describe where there is no visible emotion in the face.
Neutral expression is main thing to focus when trying to find out if the memory disorder exists. Important thing to notice is that some reference data is needed when analyzing someone’s facial expression changes since people have differences in facial expressiveness in usual. In the future the concrete differences need to be identified if the facial expression analysis is wanted to be used as a memory disorder detection method.
Työn tarkoituksena oli tutkia, miten kasvonilmeitä tunnistavaa ohjelmaa voisi hyödyntää muistisairauden etsimisessä. Keskittymiskohtana oireista toimi nimenomaan apatia, koska aiemmissa tutkimuksissa oli löydetty selkeää korrelaatiota apatian ja kasvonilmeiden muutosten välille. Ohjelman ideana oli tunnistaa kasvonilmeet kahdesta videoklipistä. Analysoitavat video-klipit oli luotu siten, että ensimmäisessä videossa oli spontaani reaktio ja toisessa ilmeettömäm-pi reaktio hauskaan videoon. Analyysin tuloksia tutkimalla etsittiin eroja videoiden välillä, jotta pystytään esittämään, miten apaattiset kasvonilmeet eroavat tavallisista kasvonilmeistä.
Ohjelma rakennettiin käyttäen Python Facial Expression Analysis Toolbox:ia (PyFeat), joka sisältää malleja ja työkaluja kasvonilmeiden tunnistamiseen ja analysointiin. PyFeat:in avulla luotiin ns. etsintätyökalu, joka koostui PyFeat:n omista esiharjoitetuista etsintäkomponenteista. Etsintätyökalu tunnistaa kasvonilmeet ja tuottaa dataa kasvojen ja kasvonpiirteiden sijainnista videolla, pään ja kasvojen asennosta sekä toimintayksiköiden (action units) ja ilmeiden ennus-tearvoista.
Suurimmat erot videoiden välillä löydettiin toimintayksiköiden ja ilmeiden ennustearvoista. Il-meettömän videon kohdalla missään toimintayksikössä ei tapahtunut aktivoitumista eli ennus-tearvo 0.5 tai alle, mikä viittaa siihen, että kasvoissa ei tapahtunut liikettä ilmeitä tuottavissa li-haksissa. Ilon tunnetta tuottavissa toimintayksiköissä oli selkeä ero videoiden välillä: spontaa-nissa videossa toimintayksiköt olivat selkeästi aktiiviset eli ennustearvo yli 0.8 koko videon ajan, kun taas ilmeettömän videon kohdalla ennustearvot pysyivät lähellä nollaa. Ilmeiden ennustear-voissa ilon tunne oli selkeästi läsnä koko spontaanin videon ajan, apaattisella videolla taas koko videon tunnetila on neutraali. Neutraali tunnetila on kuvastamassa tilannetta, jossa kasvoilla ei ole mitään näkyvää tunnereaktiota.
Neutraali tunnetila ja tunnetilojen ennustearvot muutenkin ovat tärkein keskittymiskohta, kun yritetään etsiä muistisairauteen viittavia piirteitä. On hyvä kuitenkin muistaa, että jonkinlaista re-ferenssimateriaalia tarvitaan, kun analysoidaan kasvonilmeiden muutoksia, sillä kasvojen il-meikkyydessä on lähtökohtaisesti eroja ihmisten välillä. Tulevaisuudessa konkreettisia muutok-sia pitäisi identifioida tarkemmin, mikäli kasvonilmeiden analyysia halutaan hyödyntää muistisai-rauden etsinnässä.
Kokoelmat
- Kandidaatintutkielmat [8935]