Skip to main content
Login | Suomeksi | På svenska | In English

Linear mixed models for estimating heritability and testing genetic association in family data

Show simple item record

dc.date.accessioned 2015-11-03T08:27:23Z und
dc.date.accessioned 2017-10-24T12:21:42Z
dc.date.available 2015-11-03T08:27:23Z und
dc.date.available 2017-10-24T12:21:42Z
dc.date.issued 2015-11-03T08:27:23Z
dc.identifier.uri http://radr.hulib.helsinki.fi/handle/10138.1/5109 und
dc.identifier.uri http://hdl.handle.net/10138.1/5109
dc.title Linear mixed models for estimating heritability and testing genetic association in family data en
ethesis.discipline Statistics en
ethesis.discipline Tilastotiede fi
ethesis.discipline Statistik sv
ethesis.discipline.URI http://data.hulib.helsinki.fi/id/670ef0b6-2f9e-4e98-91af-a292298fb670
ethesis.department.URI http://data.hulib.helsinki.fi/id/61364eb4-647a-40e2-8539-11c5c0af8dc2
ethesis.department Institutionen för matematik och statistik sv
ethesis.department Department of Mathematics and Statistics en
ethesis.department Matematiikan ja tilastotieteen laitos fi
ethesis.faculty Matematisk-naturvetenskapliga fakulteten sv
ethesis.faculty Matemaattis-luonnontieteellinen tiedekunta fi
ethesis.faculty Faculty of Science en
ethesis.faculty.URI http://data.hulib.helsinki.fi/id/8d59209f-6614-4edd-9744-1ebdaf1d13ca
ethesis.university.URI http://data.hulib.helsinki.fi/id/50ae46d8-7ba9-4821-877c-c994c78b0d97
ethesis.university Helsingfors universitet sv
ethesis.university University of Helsinki en
ethesis.university Helsingin yliopisto fi
dct.creator Lääperi, Mitja
dct.issued 2015
dct.language.ISO639-2 eng
dct.abstract Coronary heart disease (CHD) is one of the leading causes of death worldwide. Linear mixed models (LMMs) are presented in this thesis and they are applied to family data from the European Multicenter Study on Familial Dyslipidemias in Patients with Premature Coronary Heart Disease (EUFAM) -project. The data contain 23 quantitative traits relating to risk of CHD and roughly 28 million genetic variants. The data consist of nearly 1600 individuals from around 150 families. Linear mixed models are used when the data contain clustering or repeated measurements. In other words, when the observations are dependent. In the EUFAM data the observations come from families. In this case, the linear mixed models take the relatedness of the individuals into account. Linear mixed models are applied for both heritability estimation and genome-wide association testing in this thesis. Both in simulations and in the analyses with the EUFAM-data the need for LMMs can be seen. The LMM has more statistical power than the standard linear model when heritability exists in the data. The standard linear model also has inflated type I error rate. Both of these occur because the standard linear model does not take the relatedness of the individuals into account. For example, in the genome-wide analysis done for the EUFAM-data the standard linear model gives a massive amount of false positives when compared to the linear mixed model. The thesis proves the usefulness of and need for linear mixed models when analyzing family data. en
dct.abstract Sydän- ja verisuonitaudit ovat maailmanlaajuisesti yksi yleisimpiä kuolinsyitä. Tutkielmassa esitellään lineaarinen sekamalli ja sitä sovelletaan European Multicenter Study on Familial Dyslipidemias in Patients with Premature Coronary Heart Disease (EUFAM) -projektin perheainestoon. Aineisto sisältää 23 jatkuvaa sydän- ja verisuonitauteihin liittyvää riskitekijää ja noin 28 miljoonaa geneettisiä varianttia. Aineisto koostuu lähes 1600 yksilöstä, jotka ovat peräisin noin 150 perheestä. Lineaarisia sekamalleja käytetään, kun aineisto sisältää ryhmittäytymistä tai toistuvia mittauksia. Toisin sanoen, kun havainnot ovat riippuvia toisistaan. EUFAM-aineistossa havainnot ovat peräisin perheistä, jolloin lineaarisella sekamallilla voidaan ottaa huomioon yksilöiden välinen sukulaisuus. Tutkielmassa sovelletaan lineaarisia sekamalleja periytyvyyden estimointiin ja genominlaajuiseen assosiaatiotutkimukseen. Sekä simulaatioissa että EUFAM-aineiston analyyseissä havaitsemme lineaarisen sekamallin tarpeellisuuden. Sekamallilla on enemmän tilastollista voimaa kuin tavallisella lineaarimallilla, kun selitettävään muuttujaan vaikuttaa periytyvyys. Tavallinen lineaarimalli myös aliarvioi tyypin I virheet. Nämä ovat seurausta siitä, ettei tavallinen lineaarimalli ota huomioon yksilöiden välisiä sukulaisuuksia. Esimerkiksi EUFAM-aineistolle tehdyssä genominlaajuisessa assosiaatiotutkimuksessa tavallinen lineaarimalli antaa huomattavan määrään vääriä assosiaatioita verrattaessa lineaariseen sekamalliin. Tutkielma osoittaa lineaarisen sekamallin hyödyllisyyden ja tarpeellisuuden analysoitaessa perheaineistoja. fi
dct.language en
ethesis.language.URI http://data.hulib.helsinki.fi/id/languages/eng
ethesis.language English en
ethesis.language englanti fi
ethesis.language engelska sv
ethesis.thesistype pro gradu-avhandlingar sv
ethesis.thesistype pro gradu -tutkielmat fi
ethesis.thesistype master's thesis en
ethesis.thesistype.URI http://data.hulib.helsinki.fi/id/thesistypes/mastersthesis
dct.identifier.urn URN:NBN:fi-fe2017112251872
dc.type.dcmitype Text

Files in this item

Files Size Format View
mastersThesis.pdf 2.149Mb PDF

This item appears in the following Collection(s)

Show simple item record