Clustering analysis와 Factor analysis
건강 빅데이터를 다루다보면 변수(차원)의 개수가 매우 많아지는 상황을 마주하게 된다. 특히, 유전체 데이터의 경우, 분석시 각각 하나하나의 Single Nucleotide Polymorphism(SNP)마다 어떤 특정한 질병 또는 표현형과 연관되었는지를 통계적으로 검증하는 상황에 마주하고는 한다. 유전체 데이터뿐 아니라 전사체, 단백체, 대사체 등 대부분의 오믹스 데이터가 이러한 경우에 해당된다. 오믹스가 아니라 표현형 중에서도 다양한 표현형 요소들의 패턴을 분석하고자 할 때도 있다. 이런 경우에 활용할 수 있는 방법론이 바로 Clustering analysis(군집분석)와 Factor analysis(요인분석)이다. Clustering analysis먼저 Clustering analysis는 개인별로..
Omics
2024. 3. 11. 23:28