Ki-Kare Testi Nedir?
Bir kalite müdürü olarak şu tabloyu incelediğinizi düşünün: Sabah vardiyasında 18 yüzey hatası, akşam vardiyasında 32 yüzey hatası tespit edilmiş. İlk bakışta akşam vardiyası daha kötü görünüyor. Ama bu fark gerçekten vardiyadan mı kaynaklanıyor, yoksa sırf şans eseri mi ortaya çıktı?
Ki-kare testi (chi-square test, sembolü χ²), kategorik verilerin frekanslarını analiz eden parametrik olmayan bir istatistiksel testtir. Sürekli verilere (ağırlık, uzunluk, sıcaklık gibi) değil, sayılabilir verilere uygulanır: kaç adet hatalı ürün çıktı, hangi kategoriye kaç gözlem düştü, beklenen dağılım ile gerçek dağılım arasında fark var mı gibi sorulara yanıt verir.
Bu test, hipotez testi çerçevesinde çalışır. Bir H0 (sıfır hipotezi) kurarsınız, veriyi toplarsınız, χ² istatistiğini hesaplarsınız ve p-değerine bakarak karar verirsiniz. Ancak t-testi veya ANOVA gibi ortalama karşılaştırma testlerinden farklı olarak ki-kare testi frekanslarla (sayılarla) çalışır.
Kalite mühendisliğinde, üretim analizlerinde ve Six Sigma projelerinde ki-kare testi sıklıkla kullanılır. Hata tiplerinin vardiyalara göre dağılımını incelemek, tedarikçi performansını kategorik olarak kıyaslamak, müşteri şikayetlerinin ürün gruplarına göre bağımsız olup olmadığını araştırmak gibi pek çok senaryoda karşınıza çıkar.
Ki-Kare Testinin Formülü
Ki-kare istatistiğinin genel formülü basit ama güçlüdür:
χ² = Σ [(Gözlenen - Beklenen)² / Beklenen]
Yani her hücre için gözlenen frekans ile beklenen frekans arasındaki farkı alırsınız, karesini alırsınız, beklenen frekansa bölersiniz ve tüm hücrelerin sonuçlarını toplarsınız.
| Sembol | Anlamı |
|---|---|
| χ² | Ki-kare test istatistiği |
| O (Observed) | Gözlenen frekans (gerçek sayım) |
| E (Expected) | Beklenen frekans (H0 doğruysa olması gereken sayım) |
| Σ | Tüm kategoriler/hücreler üzerinden toplam |
| df | Serbestlik derecesi (degrees of freedom) |
Formüldeki mantık şu: Eğer gözlenen değerler beklenen değerlere çok yakınsa, χ² küçük çıkar ve H0 reddedilmez. Eğer gözlenen ile beklenen arasındaki farklar büyükse, χ² büyür ve H0 reddedilir.
Ki-Kare Testi Türleri
Ki-kare testi iki ana kategoriye ayrılır. Her ikisi de aynı formülü kullanır, ancak araştırma sorusu ve veri yapısı farklıdır.
1. Ki-Kare Bağımsızlık Testi (Test of Independence)
Bağımsızlık testi, iki kategorik değişken arasında ilişki olup olmadığını araştırır. Veriler bir çapraz tablo (contingency table) halinde düzenlenir.
Soru: "Bu iki değişken birbirinden bağımsız mı, yoksa aralarında istatistiksel bir ilişki var mı?"
Hipotezler:
- H0: İki değişken birbirinden bağımsızdır (aralarında ilişki yoktur).
- H1: İki değişken birbirinden bağımsız değildir (aralarında ilişki vardır).
Endüstriyel örnekler:
- Hata tipi ile üretim hattı arasında ilişki var mı?
- Tedarikçi ile malzeme ret oranı arasında bağımlılık var mı?
- Operatör deneyim seviyesi ile ürün kalite kategorisi (A, B, C) arasında ilişki var mı?
- Vardiya ile iş kazası türü arasında bağımlılık var mı?
2. Ki-Kare Uyum İyiliği Testi (Goodness of Fit Test)
Uyum iyiliği testi, tek bir kategorik değişkenin gözlenen dağılımının teorik (beklenen) bir dağılıma uyup uymadığını test eder.
Soru: "Gözlenen veriler, beklediğim dağılıma uyuyor mu?"
Hipotezler:
- H0: Gözlenen dağılım, beklenen dağılıma uygundur.
- H1: Gözlenen dağılım, beklenen dağılımdan anlamlı şekilde farklıdır.
Endüstriyel örnekler:
- Bir zarın (veya rastgele sürecin) çıktıları eşit dağılmış mı?
- Hafta içi her güne eşit sayıda hata düşmesi bekleniyor, gerçekte öyle mi?
- Müşteri şikayetleri teorik dağılıma uyuyor mu?
- Bir kalıp makinasından çıkan parçaların boyut dağılımı normal dağılıma uyuyor mu?
İki Test Arasındaki Farklar
| Özellik | Bağımsızlık Testi | Uyum İyiliği Testi |
|---|---|---|
| Değişken sayısı | İki kategorik değişken | Tek kategorik değişken |
| Veri yapısı | Çapraz tablo (r x c) | Tek satır frekans tablosu |
| Araştırma sorusu | İki değişken ilişkili mi? | Dağılım beklentiye uyuyor mu? |
| Serbestlik derecesi | (r-1)(c-1) | k-1 |
| Tipik kullanım | Hata tipi vs. vardiya | Hataların günlere eşit dağılımı |
Adım Adım Uygulama: Bağımsızlık Testi Örneği
Bir otomotiv yan sanayi fabrikasında kalite mühendisi olarak çalıştığınızı düşünün. Enjeksiyon kalıplama hattından çıkan plastik parçalarda üç tip hata gözlemliyorsunuz: çapak, çökme izi ve renk farkı. Son bir aylık verileri vardiyalara göre topladınız ve şüpheleniyorsunuz: "Hata tipi vardiyaya göre değişiyor mu, yoksa rastgele mi dağılıyor?"
Adım 1: Hipotezleri Kur
- H0: Hata tipi ile vardiya birbirinden bağımsızdır (ilişki yoktur).
- H1: Hata tipi ile vardiya birbirinden bağımsız değildir (ilişki vardır).
- Anlamlılık düzeyi: α = 0.05
Adım 2: Gözlenen Frekans Tablosunu Oluştur
| Çapak | Çökme İzi | Renk Farkı | Satır Toplamı | |
|---|---|---|---|---|
| Sabah Vardiyası | 30 | 20 | 10 | 60 |
| Akşam Vardiyası | 15 | 25 | 20 | 60 |
| Gece Vardiyası | 25 | 35 | 20 | 80 |
| Sütun Toplamı | 70 | 80 | 50 | 200 |
Adım 3: Beklenen Frekansları Hesapla
Beklenen frekans formülü: E = (Satır Toplamı x Sütun Toplamı) / Genel Toplam
Örneğin sabah vardiyasında çapak beklenen frekansı: E = (60 x 70) / 200 = 21.0
Tüm beklenen frekanslar:
| Çapak | Çökme İzi | Renk Farkı | |
|---|---|---|---|
| Sabah Vardiyası | 21.0 | 24.0 | 15.0 |
| Akşam Vardiyası | 21.0 | 24.0 | 15.0 |
| Gece Vardiyası | 28.0 | 32.0 | 20.0 |
Adım 4: Her Hücre İçin χ² Katkısını Hesapla
Her hücre için (O - E)² / E hesaplanır:
- Sabah-Çapak: (30-21)²/21 = 81/21 = 3.857
- Sabah-Çökme İzi: (20-24)²/24 = 16/24 = 0.667
- Sabah-Renk Farkı: (10-15)²/15 = 25/15 = 1.667
- Akşam-Çapak: (15-21)²/21 = 36/21 = 1.714
- Akşam-Çökme İzi: (25-24)²/24 = 1/24 = 0.042
- Akşam-Renk Farkı: (20-15)²/15 = 25/15 = 1.667
- Gece-Çapak: (25-28)²/28 = 9/28 = 0.321
- Gece-Çökme İzi: (35-32)²/32 = 9/32 = 0.281
- Gece-Renk Farkı: (20-20)²/20 = 0/20 = 0.000
Adım 5: Toplam χ² İstatistiğini Bul
χ² = 3.857 + 0.667 + 1.667 + 1.714 + 0.042 + 1.667 + 0.321 + 0.281 + 0.000 = 10.216
Adım 6: Serbestlik Derecesini Hesapla
df = (satır sayısı - 1) x (sütun sayısı - 1) = (3-1)(3-1) = 4
Adım 7: Karar Ver
α = 0.05 ve df = 4 için ki-kare kritik değeri tablolardan 9.488 bulunur.
Hesaplanan χ² = 10.216 > Kritik değer = 9.488 olduğundan H0 reddedilir.
Yorum: Hata tipi ile vardiya arasında istatistiksel olarak anlamlı bir ilişki vardır (χ² = 10.216, df = 4, p < 0.05). Sabah vardiyasında çapak hatası beklenenden belirgin şekilde fazla çıkıyor. Bu bulgu, sabah vardiyasında kalıp sıcaklığının yeterince dengelenmeden üretime başlandığına işaret edebilir. Kalite ekibi olarak sabah vardiyasının başlangıç prosedürlerini incelemeniz yerinde olacaktır.
Uyum İyiliği Testi Örneği
Bir gıda fabrikasında haftalık kalite denetimi yapıyorsunuz. Beş üretim hattının her birinden eşit oranda hata çıkması bekleniyor. Son ay toplam 150 hata kaydedilmiş. Veriler şöyle:
| Hat | Gözlenen Hata (O) | Beklenen Hata (E) | (O-E)²/E |
|---|---|---|---|
| Hat 1 | 22 | 30 | 2.133 |
| Hat 2 | 38 | 30 | 2.133 |
| Hat 3 | 31 | 30 | 0.033 |
| Hat 4 | 45 | 30 | 7.500 |
| Hat 5 | 14 | 30 | 8.533 |
| Toplam | 150 | 150 | 20.333 |
- df = k - 1 = 5 - 1 = 4
- χ² = 20.333
- Kritik değer (α = 0.05, df = 4) = 9.488
χ² = 20.333 >> 9.488 olduğundan H0 kesinlikle reddedilir. Hatalar eşit dağılmamış. Hat 4 beklenenden çok daha fazla, Hat 5 ise çok daha az hata üretmiş. Hat 4'te sistematik bir sorun olduğu açık; ekipman bakım geçmişi, operatör yetkinliği veya hammadde parti farkları araştırılmalı.
Serbestlik Derecesi (df) Hesaplama
Serbestlik derecesi, ki-kare dağılımının şeklini belirleyen temel parametredir. Yanlış hesaplarsanız yanlış kritik değere bakarsınız ve yanlış karar verirsiniz.
| Test Türü | Serbestlik Derecesi Formülü | Açıklama |
|---|---|---|
| Bağımsızlık testi | df = (r-1)(c-1) | r = satır sayısı, c = sütun sayısı |
| Uyum iyiliği testi | df = k-1 | k = kategori sayısı |
| Homojenlik testi | df = (r-1)(c-1) | Bağımsızlık testi ile aynı formül |
Pratik ipucu: 2x2 tabloda df = 1, 3x3 tabloda df = 4, 2x4 tabloda df = 3 olur. Serbestlik derecesi arttıkça ki-kare dağılımı sağa kayar ve kritik değer yükselir; yani anlamlı sonuç bulmak için daha büyük bir χ² değerine ihtiyaç duyarsınız.
Beklenen Frekans Hesaplama ve Kurallar
Beklenen frekanslar, ki-kare testinin sağlıklı sonuç vermesi için kritik öneme sahiptir.
Bağımsızlık testinde: Her hücrenin beklenen frekansı şöyle hesaplanır:
E = (Satır Toplamı x Sütun Toplamı) / Genel Toplam
Uyum iyiliği testinde: Beklenen frekanslar araştırma sorusuna göre belirlenir. Eşit dağılım bekliyorsanız toplam gözlem sayısını kategori sayısına bölersiniz. Belirli bir oran bekliyorsanız toplam gözlemi oranla çarparsınız.
Minimum beklenen frekans kuralı: Ki-kare testinin güvenilir sonuç vermesi için yaygın kabul edilen kural, hiçbir hücrede beklenen frekansın 5'in altına düşmemesidir. Beklenen frekansı 5'in altında olan hücrelerin oranı tablonun %20'sini aşmamalıdır. Bu kurala uyulmadığında ki-kare yaklaşımı zayıflar ve alternatif yöntemlere başvurmanız gerekir.
p-Değeri Yorumlama
Ki-kare testinde p-değeri, gözlenen χ² istatistiğinin veya daha büyüğünün H0 doğruysa ortaya çıkma olasılığını ifade eder.
Karar kuralı:
- p < α ise H0 reddedilir (anlamlı ilişki/fark var)
- p >= α ise H0 reddedilemez (yeterli kanıt yok)
Dikkat edilmesi gereken noktalar:
- p-değeri "etkinin büyüklüğünü" göstermez. p = 0.001 bulmak, ilişkinin güçlü olduğu anlamına gelmez. Büyük örneklemlerde küçük farklar bile anlamlı çıkabilir.
- p > 0.05 "ilişki yoktur" demek değildir. Sadece "bu veride yeterli kanıt bulamadık" demektir. Örneklem büyütülürse sonuç değişebilir.
- Etki büyüklüğü ölçüleri kullanın. Ki-kare testinde Cramer's V veya phi katsayısı gibi etki büyüklüğü ölçüleri raporlamak, sonuçlarınıza derinlik katar.
Yates Düzeltmesi ve Fisher Exact Test
Yates Düzeltmesi (Yates' Correction for Continuity)
Ki-kare dağılımı sürekli bir dağılımdır, ancak frekans verileri kesiklidir. Bu uyumsuzluk, özellikle 2x2 tablolarda ve küçük örneklemlerde ki-kare testinin p-değerini olması gerekenden daha küçük hesaplamasına yol açabilir. Yates düzeltmesi bu sorunu hafifletmek için uygulanır.
Düzeltilmiş formül: χ² = Σ [(|O - E| - 0.5)² / E]
Her hücrede gözlenen ve beklenen frekans arasındaki farkın mutlak değerinden 0.5 çıkarılır. Bu, testin daha muhafazakar olmasını sağlar. Yani gereksiz yere H0 reddetme olasılığını azaltır.
Ne zaman kullanılır:
- Yalnızca 2x2 tablolarda
- Özellikle toplam örneklem 40'ın altındaysa veya herhangi bir beklenen frekans 10'un altındaysa
Fisher Exact Test
Beklenen frekansların 5'in altına düştüğü durumlarda ki-kare testi güvenilirliğini yitirir. Bu durumda Fisher exact test (Fisher kesin olasılık testi) devreye girer. Adından da anlaşılacağı gibi, yaklaşıma değil kesin olasılık hesabına dayanır.
Ne zaman Fisher exact test tercih edilir:
- 2x2 tablolarda herhangi bir beklenen frekans 5'in altındaysa
- Toplam örneklem boyutu 20'nin altındaysa
- Kesin p-değeri gerektiğinde (örneğin tıbbi araştırmalarda)
Pratikte çoğu istatistik yazılımı, 2x2 tablo analizi yaptığınızda otomatik olarak hem ki-kare hem de Fisher exact test sonuçlarını raporlar. Beklenen frekanslarınız düşükse Fisher exact test değerine bakmanız daha doğrudur.
Size Uygun Eğitimi Bulun
Bireysel mi yoksa kurumsal mı eğitim arıyorsunuz?
Kalite Kontrol ve Üretimde Ki-Kare Uygulamaları
Ki-kare testi, üretim ortamlarında kategorik verilerin analiz edilmesi gereken her durumda kullanılabilir. Aşağıda gerçek dünya senaryolarına yakın örnekler verilmiştir.
Uygulama 1: Hata Tipi ve Vardiya Bağımsızlık Analizi
Yukarıdaki enjeksiyon kalıplama örneğinde gördüğümüz gibi, hata tiplerinin vardiyalara göre dağılımını incelemek, kök neden analizine yön verir. Belirli bir vardiyada belirli bir hata tipinin yoğunlaşması, o vardiyaya özgü koşullara (ekipman ısınma süresi, operatör yorgunluğu, hammadde partisi) dikkat çeker.
Uygulama 2: Tedarikçi Performans Karşılaştırması
Üç farklı tedarikçiden gelen PCB kartların kabul/ret durumunu inceliyorsunuz. Her tedarikçiden 500'er adet gelen malzeme partisi "Kabul", "Koşullu Kabul" veya "Ret" olarak sınıflandırılıyor. Ki-kare bağımsızlık testi ile tedarikçi ile kalite kategorisi arasında ilişki olup olmadığını test edebilirsiniz. Eğer anlamlı bir ilişki bulursanız, hangi tedarikçinin hangi kategoride beklentiden saptığına hücre bazında bakarak aksiyona geçersiniz.
Uygulama 3: Müşteri Şikayeti Dağılım Analizi
Bir beyaz eşya üreticisinde dört ürün grubundan (bulaşık makinesi, çamaşır makinesi, buzdolabı, fırın) gelen şikayetlerin eşit dağılması bekleniyor. Son çeyrekte toplam 320 şikayet alındı. Uyum iyiliği testi ile şikayetlerin gerçekten eşit dağılıp dağılmadığını test edersiniz. Dağılım eşit değilse, en çok şikayet alan ürün grubuna kaynak ayırma kararı veriye dayanır.
Uygulama 4: Proses Değişikliği Sonrası Doğrulama
Yeni bir kaynak parametresi uygulamadan önce ve sonra kaynakların "Kusursuz", "Küçük Kusur" ve "Ret" olarak sınıflandırıldığını düşünün. Ki-kare testi, proses değişikliğinin kaynak kalite kategorilerinin dağılımını anlamlı şekilde değiştirip değiştirmediğini gösterir. Bu, DMAIC sürecinin Improve aşamasında doğrulama için güçlü bir kanıt sunar.
Yazılım Araçları ile Ki-Kare Testi
Ki-kare testini elle hesaplamak öğreticidir, ancak pratikte yazılım kullanılır. İşte yaygın araçlar ve temel komutlar:
Microsoft Excel: CHITEST() veya CHISQ.TEST() fonksiyonu ile gözlenen ve beklenen frekans aralıklarını girerek p-değerini alabilirsiniz. CHISQ.INV.RT() ile kritik değer hesaplanır.
Minitab: Stat > Tables > Chi-Square Test for Association yoluyla bağımsızlık testi, Stat > Tables > Chi-Square Goodness-of-Fit Test yoluyla uyum iyiliği testi yapılır. Minitab, beklenen frekansları, χ² katkılarını ve p-değerini otomatik raporlar.
Python (SciPy): scipy.stats.chi2_contingency() fonksiyonu bağımsızlık testi için, scipy.stats.chisquare() fonksiyonu uyum iyiliği testi için kullanılır. Her iki fonksiyon da χ² istatistiği, p-değeri ve serbestlik derecesini döndürür.
R: chisq.test() fonksiyonu hem bağımsızlık hem de uyum iyiliği testi için kullanılır. Matris veya vektör girişi alır. fisher.test() fonksiyonu ile Fisher exact test uygulanır.
SPSS: Analyze > Descriptive Statistics > Crosstabs yolunu kullanarak çapraz tablo oluşturulur. Statistics sekmesinden Chi-square seçeneği işaretlenerek ki-kare testi sonuçları alınır.
Ki-Kare Testinde Yaygın Hatalar
Ki-kare testi basit görünür, ancak yanlış uygulamaları oldukça yaygındır. İşte dikkat etmeniz gereken kritik noktalar:
1. Sürekli veri ile ki-kare testi yapmak: Ki-kare testi frekans verileri içindir. Ölçüm verileri (ağırlık, boyut, sıcaklık) ile ki-kare testi yapılamaz. Bu tür veriler için t-testi veya ANOVA kullanılmalıdır. Ancak sürekli verileri kategorilere ayırarak (örneğin "Kabul/Ret") ki-kare testine dönüştürmek mümkündür; fakat bu bilgi kaybına yol açar.
2. Beklenen frekans kuralını ihlal etmek: Beklenen frekansı 5'in altında olan hücreler varsa ki-kare testinin p-değeri güvenilir olmaz. Bu durumda kategorileri birleştirmek, Fisher exact test kullanmak veya örneklemi büyütmek gerekir.
3. Yüzdelerle ki-kare testi yapmak: Ki-kare formülüne mutlaka ham frekanslar (sayılar) girilmelidir. Oranlar veya yüzdeler girilirse sonuçlar anlamsız olur.
4. Bağımlı gözlemlerle test yapmak: Ki-kare bağımsızlık testi, gözlemlerin birbirinden bağımsız olmasını varsayar. Aynı parçanın farklı zaman noktalarında ölçülmesi gibi bağımlı gözlemlerde McNemar testi gibi alternatif yöntemler kullanılmalıdır.
5. Çoklu karşılaştırma sorunu: Ki-kare testi anlamlı çıktığında hangi hücrelerin farkı yarattığını belirlemek için post-hoc analiz (artık değerlerin incelenmesi) yapılması gerekir. Sadece "anlamlı" demek yetmez; farkın nereden kaynaklandığını göstermeniz gerekir.
6. Örneklem büyüklüğünü göz ardı etmek: Çok büyük örneklemlerde küçük ve pratik olarak anlamsız farklar bile istatistiksel olarak anlamlı çıkabilir. Cramer's V gibi etki büyüklüğü ölçüleriyle sonuçlarınızı destekleyin.
7. Tek yönlü hipotez kurmak: Ki-kare testi doğası gereği çift yönlü (two-sided) bir testtir. "Vardiya A daha kötüdür" gibi tek yönlü hipotezler için ki-kare testi uygun değildir.
Ki-Kare Dağılımı ve Kritik Değerler
Ki-kare dağılımı, yalnızca pozitif değerler alan, sağa çarpık bir dağılımdır. Serbestlik derecesi arttıkça dağılım simetriğe yaklaşır. Aşağıdaki tablo, yaygın kullanılan serbestlik dereceleri için kritik değerleri gösterir:
| df | α = 0.10 | α = 0.05 | α = 0.01 |
|---|---|---|---|
| 1 | 2.706 | 3.841 | 6.635 |
| 2 | 4.605 | 5.991 | 9.210 |
| 3 | 6.251 | 7.815 | 11.345 |
| 4 | 7.779 | 9.488 | 13.277 |
| 5 | 9.236 | 11.070 | 15.086 |
| 6 | 10.645 | 12.592 | 16.812 |
| 8 | 13.362 | 15.507 | 20.090 |
| 10 | 15.987 | 18.307 | 23.209 |
Hesapladığınız χ² değeri, ilgili satırdaki kritik değerden büyükse H0 reddedilir. Pratikte yazılımların verdiği p-değerine bakmak daha doğrudan bir yöntemdir.
Ki-Kare Testi Uygulamanın Özet Adımları
- Araştırma sorusunu belirleyin: İki değişken arasında ilişki mi arıyorsunuz (bağımsızlık testi) yoksa dağılım uyumu mu test ediyorsunuz (uyum iyiliği)?
- Hipotezleri kurun: H0 ve H1'i net ifade edin.
- Anlamlılık düzeyini belirleyin: Genellikle α = 0.05.
- Verileri toplayın ve frekans tablosunu oluşturun.
- Beklenen frekansları hesaplayın ve minimum beklenen frekans kuralını kontrol edin.
- χ² istatistiğini hesaplayın.
- Serbestlik derecesini belirleyin.
- p-değerini bulun veya kritik değerle karşılaştırın.
- Karar verin ve sonuçları yorumlayın. Etki büyüklüğü ölçüsü ekleyin.
- Post-hoc analiz yapın: Anlamlı sonuç bulduysanız farkın kaynağını belirleyin.
Sıkça Sorulan Sorular (FAQ)
Ki-kare testi hangi tür verilerle kullanılır?
Ki-kare testi kategorik (nominal veya ordinal) verilerle kullanılır. Frekans verileri, yani her kategoriye düşen gözlem sayıları gereklidir. Sürekli veriler (ağırlık, uzunluk, sıcaklık) ile doğrudan ki-kare testi uygulanamaz; ancak sürekli veriler kategorilere ayrılarak (örneğin: düşük/orta/yüksek) ki-kare testine uygun hale getirilebilir. Bu durumda bilgi kaybı yaşanacağını unutmamak gerekir.
Ki-kare testi ile t-testi arasındaki fark nedir?
Ki-kare testi frekans verileri (sayımlar) ile çalışır ve iki kategorik değişken arasındaki ilişkiyi veya dağılım uyumunu test eder. T-testi ise sürekli verilerin ortalamalarını karşılaştırır. Örneğin "erkek ve kadın çalışanların hata yapma oranı farklı mı?" sorusunda veri hata sayılarıysa ki-kare, hata ölçüm değerlerinin ortalamasıysa t-testi kullanılır.
Beklenen frekans 5'in altına düşerse ne yapılmalı?
Üç seçenek vardır: Birincisi, düşük frekanslı kategorileri mantıklı bir şekilde birleştirmek. İkincisi, 2x2 tablolarda Fisher exact test kullanmak. Üçüncüsü, örneklem büyüklüğünü artırarak veri toplamaya devam etmek. Kategorileri birleştirirken anlamlı gruplamalar yapmaya dikkat etmek gerekir; aksi takdirde sonuçlar yorumlanamazlaşır.
Ki-kare testi sonucu anlamlı çıktı, ne yapmalıyım?
Ki-kare testi sadece "ilişki var" der, "hangi hücrede fark var" demez. Anlamlı sonuç bulduysanız: (a) Standardize edilmiş artık değerlere bakın; mutlak değeri 2'yi aşan hücreler farkın kaynağıdır. (b) Cramer's V hesaplayarak etki büyüklüğünü raporlayın. (c) Gözlenen ve beklenen frekansları karşılaştırarak pratik yorumunuzu yapın. Kalite yönetiminde bu bulguyu kök neden analizine girdi olarak kullanın.
Ki-kare testi negatif çıkabilir mi?
Hayır. Formülde farkların karesi alındığı ve pozitif bir sayıya (beklenen frekans) bölündüğü için χ² istatistiği her zaman sıfır veya pozitiftir. Eğer hesaplamanızda negatif bir değer çıkıyorsa, formülde bir hata yapmışsınızdır. χ² = 0 ancak gözlenen ve beklenen frekanslar tamamen eşit olduğunda ortaya çıkar.
Ki-kare bağımsızlık testi ile homojenlik testi arasındaki fark nedir?
Matematiksel olarak ikisi de aynı formülü ve aynı hesaplamayı kullanır. Fark araştırma tasarımındadır. Bağımsızlık testinde tek bir popülasyondan örneklem alınır ve iki değişken arasındaki ilişki incelenir. Homojenlik testinde ise birden fazla popülasyondan ayrı ayrı örneklem alınır ve bu popülasyonların belirli bir değişken açısından benzer dağılım gösterip göstermediği test edilir. Sonuç olarak yorumlama farklıdır ancak hesaplama aynıdır.
Ki-kare testinde örneklem büyüklüğü ne kadar olmalıdır?
Kesin bir alt sınır yoktur, ancak temel kural beklenen frekanslarla ilgilidir: Tüm hücrelerde beklenen frekansın en az 5 olması arzu edilir. Pratikte toplam örneklem büyüklüğü genellikle en az 50 olmalıdır. Daha küçük tabloları güvenilir şekilde analiz etmek istiyorsanız Fisher exact test kullanabilirsiniz. Öte yandan çok büyük örneklemlerde (n > 1000) neredeyse her fark anlamlı çıkacağından, etki büyüklüğü ölçüleri mutlaka raporlanmalıdır.
Ki-kare testi ile ANOVA arasındaki ilişki nedir?
Her ikisi de grup karşılaştırma testleridir, ancak farklı veri türleri ile çalışır. ANOVA sürekli bir bağımlı değişkenin (örneğin çekme mukavemeti) grup ortalamalarını karşılaştırır. Ki-kare testi ise kategorik değişkenlerin frekans dağılımlarını karşılaştırır. Eğer bağımlı değişkeniniz "Kabul/Ret" gibi kategorik ise ki-kare, "ölçüm değeri" gibi sürekli ise ANOVA tercih edilmelidir. Six Sigma projelerinde Analyze aşamasında veri türüne göre doğru testi seçmek, analiz kalitesinin temelidir.











