Kombination von K-means++ Clustering und PCA zur Analyse von Chromatin-Daten

Authors: 
Gerighausen, Daniel
Year: 
2013
Language: 
German
Abstract: 
In der Epigenetik werden die Veränderungen der Erbinformationen neben der DNS erforscht. Dabei werden den Histonen, um die sich die DNS im Zellkern wickelt, eine große Bedeutung zugeordnet. In dieser Arbeit werden die Ergebnisse eines neuen Segmentierungsverfahrens ausgewertet und visualisiert. Dabei werden die vorliegenden Daten mittels des k-means++ Algorithmus geclustert.Zuerst werden die Clusterergebnisse statistisch ausgewertet, um sie dann mit den durch vorgehenden Arbeiten erworbenen Kenntnissen zu vergleichen. Mittels dieses Vergleichs werden dann die idealen Parameter für das Clustering bestimmt. Die Ergebnisse dieses idealen Clusterings werden dann mittels Starplots, Scatterplots und Binningplots visualisiert. Für die Erstellung der Scatter- und Binningplots wird eine PCA genutzt, um die Daten auf zwei Dimensionen zu reduzieren.
AttachmentSize
template.pdf2.24 MB