BibTex RIS Cite

n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi

Year 2012, Volume: 15 Issue: 4, 26 - 36, 01.02.2013

Abstract

Özet: Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alınan 38 adet değişken üzerinde yapıldı. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n³p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Temel Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelendi. Sonuçta, kümelemede en uygun yöntemin Temel Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu saptandı. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.

Anahtar Kelimeler:  Kümeleme Analizi, Sayısal Sınıflandırma, Temel Bileşenler Analizi, Ayırım Analizi, Korelasyon Analizi

 

A Comparison of Different Clustering Methods on the Biological Data with n<p Dimensions

 

Abstract : This research was carried out on 38 variables from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (n³p) must be decreased. Principal Component, Discriminant and analysis of correlation were used to decrease the number of variables. The reduced number of variables by using these mentioned methods, was comparatively evaluated by using different clustering methods. Present results shown that the most suitable method for clustering is the Ward method used together with Principle Components variable reducing technique. It was also found out that the most suitable measurement index to determine the number of clusters were Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics.

Keywords: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis

n<p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi

Year 2012, Volume: 15 Issue: 4, 26 - 36, 01.02.2013

Abstract

 

Özet: Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alınan 38 adet değişken üzerinde yapıldı. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n³p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Temel Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelendi. Sonuçta, kümelemede en uygun yöntemin Temel Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu saptandı. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.

Anahtar Kelimeler:  Kümeleme Analizi, Sayısal Sınıflandırma, Temel Bileşenler Analizi, Ayırım Analizi, Korelasyon Analizi.

 

A Compaision of Different Clustering Methods on the Biological Data with n<p Dimensions

 

Abstract : This research was carried out on 38 variables from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (n³p) must be decreased. Principal Component, Discriminant and analysis of correlation were used to decrease the number of variables. The reduced number of variables by using these mentioned methods, was comparatively evaluated by using different clustering methods. Present results shown that the most suitable method for clustering is the Ward method used together with Principle Components variable reducing technique. It was also found out that the most suitable measurement index to determine the number of clusters were Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics.

Keywords: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis.

 

There are 0 citations in total.

Details

Primary Language English
Journal Section Biometrics
Authors

İrfan Öztürk

Necati Yıldız This is me

Publication Date February 1, 2013
Published in Issue Year 2012 Volume: 15 Issue: 4

Cite

APA Öztürk, İ., & Yıldız, N. (2013). n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi, 15(4), 26-36. https://doi.org/10.18016/ksujns.60622
AMA Öztürk İ, Yıldız N. n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi. February 2013;15(4):26-36. doi:10.18016/ksujns.60622
Chicago Öztürk, İrfan, and Necati Yıldız. “N < P Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”. KSÜ Doğa Bilimleri Dergisi 15, no. 4 (February 2013): 26-36. https://doi.org/10.18016/ksujns.60622.
EndNote Öztürk İ, Yıldız N (February 1, 2013) n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi 15 4 26–36.
IEEE İ. Öztürk and N. Yıldız, “n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”, KSÜ Doğa Bilimleri Dergisi, vol. 15, no. 4, pp. 26–36, 2013, doi: 10.18016/ksujns.60622.
ISNAD Öztürk, İrfan - Yıldız, Necati. “N < P Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”. KSÜ Doğa Bilimleri Dergisi 15/4 (February 2013), 26-36. https://doi.org/10.18016/ksujns.60622.
JAMA Öztürk İ, Yıldız N. n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi. 2013;15:26–36.
MLA Öztürk, İrfan and Necati Yıldız. “N < P Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”. KSÜ Doğa Bilimleri Dergisi, vol. 15, no. 4, 2013, pp. 26-36, doi:10.18016/ksujns.60622.
Vancouver Öztürk İ, Yıldız N. n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi. 2013;15(4):26-3.