Ünite 6: Verilerin Özetlenmesi, Sunumu ve Analizi

Giriş

Araştırmacının yapması gereken ilk iş ele alınacak konuyu veya sorunu açık bir ifade ile ortaya koymaktır. Bundan sonra incelenecek konu üzerinde etkisi olan etkenlerin belirlenmesi ve bu etkenlere ait seçeneklerin bulunması gelmektedir. Bu etkenlerin ve konuların belirli limitler içinde oldukları akılda tutularak çözümleri için geçerli ve güvenilir veri setlerinden gereken dataları elde etmelidir. Elde ettiği dataları doğru yöntemler ile analiz edip hedeflediği soruların cevaplarını ulaşır. Bu cevaplardan sonra araştırmacı verilerin özetlenmesi ve sunumuna geçilebilir.

Verilerin Tanımlanması

Bir araştırmanın verileri araştırma birimlerine ilişkin gözlemlere dayanır. Araştırma birimleri insan veya herhangi bir hayvan ya da kurum olabilir. Bu birimlerin belirli bir grup oluşturacak sayıda bir araya getirilmiş hâli araştırmanın örneklemini oluşturur. Araştırmada ele alınan toplam birim sayısına “örneklem büyüklüğü“ denir. Araştırmada ölçüm ile ya da sayım ile verisi elde edilen bu özelliklerin her birine “değişken” denir. Bir araştırmada tek bir veri ele alınabildiği gibi yüzlerce veri de ele alınabilir.

Verileri en kaba şekliyle “nicel” (kantitatif) ve “nitel” (kalitatif) olarak ikiye ayrılabilir. Nitel veriler sayısal değildir. Kategorilere ayrılarak incelenirler. Nicel veriler ise sayısal verilerdir ve çeşitli ölçümler ile incelenirler.

Araştırmalarda elde edilen bulgular ifade edilirken, basitten karmaşığa doğru birçok yöntem uygulanarak bir yol izlenir ve konu mümkün olduğunca derinlemesine ele alınır. Sonrasında da bu inceleme sonucunda elde edilen rakamlar mantık çerçevesinde anlamlı sonuçlar elde etmek amacıyla yorumlanır. Son olarak da elde edilen yorumlar sadece yazı ile değil aynı zamanda da tablo ve grafikler yardımıyla herkesin kolayca irdelemesi için ifade edilir. Tablo ve grafikler metin içerisinde yazı ile ifade edilen kısımlara ihtiyaç duymadan içeriği anlatır nitelikte olması gerekmektedir.

Nitel Verilerin Özetlenmesi: Verilerden elde edilen araştırma birimlerinin değerlerini hep birlikte ele alarak bize fikir verecek şekle sokmaya “verilerin özetlenmesi” denir.

Nitel (kategorilere ayrılmış ve sayımla belirlenen) değişkenlerin verileri, bütün içinde her bir kategoriyi oluşturanların sayısının oranı belirtilerek özetlenir. İki değişkenli ve çok değişkenli nitel verilerin özetlenmesi olarak çeşitlere ayrılan nitel verilerin özetlenmesi esnasında verilerin bilgisayara aktarılması sürecine hataya yer vermemek için dikkatli yaklaşılması gerekmektedir.

Nitel Verilerin Grafiklerinin Oluşturulması: Bilgisayarların kullanıma girmesiyle çok değişik şekiller verilerek ve gereğinde resimler çizilen grafikler sıklıkla görülmeye başlanmıştır. Örneğin; yıllık ayran tüketimi grafiğinde çubukların ayran olarak gösterilmesi, bu grafiklere “piktogram” adı verilmektedir.

Hem tabloların hem de grafiklerin oluşturulmasında dikkat edilmesi gereken noktalar mevcuttur. Bunlar arasında ortak özellik olarak öne çıkanlardan bahsedecek olursak, uygun, açık ve net başlıklara sahip olmaları, sadece metinde yer alan bilgilerin yer alması, anlam karmaşasını önleyici bir görünüme ve dikkat çekici bir estetiğe sahip olmaları sıralanabilir. Geçmişte metinlerin önemli kısımlarının vurgulanması amacıyla tablolar, tabloların önemli kısımlarının vurgulanması amacıyla da grafikler tercih edilirken günümüzde dergilerin sayfa sınırlamaları nedeniyle her iki vurgu tekniği de metinler için kullanılmaktadır. Gruplanmış karakterde ve sayımla elde edilen veriler çubuk veya pasta grafik, ölçümle belirlenen veriler de histogram ile özetlenir. Grafik ve tablolarda daha etkili bir sunum ortaya koymak için, bu konuda daha fazla deneyime sahip kişilerden de yardım alınabilir.

Nicel Verilerin Özetlenmesi: Ölçümle elde edilen verileri (nicel) iki türlü özetlemek mümkündür. Birincisi, bu ölçümleri kategorilere ayırarak yine oran cinsinden ifade etmek üzere tablolaştırmak ve çubuk veya pasta grafiği çizerek grafik elde etmektir. Bu uygulamaya nicel değişkenlerin gruplanmış hâle getirilmesi ya da “sınıflanması” denir. Bu işlemden sonra artık nicel değişken nitel değişken şekline sokulmuş olmaktadır. İkinci yol ise ölçülen verilere nicel özetleme işlemleri yapmaktır. Bunlar;

  • Aritmetik Ortalama ±Standart Sapma ile ifade edilerek,
  • Ortanca (Median) ile birlikte 1. ve 3. Çeyrek (Quartile) ile ifade edilerektir.

Birinci yolu seçersek aritmetik ortalama dağılımın hangi ölçüm değeri civarında en fazla yığılma gösterdiğini (örneğin yetişkin erkeklerin Türkiye’de boy ortalaması 175 cm); yaygınlık ölçütü ise bu ortalamadan hangi sıklıkla ne kadar matematiksel uzaklığa yayılma gösterdiği (örneğin 12 cm standart sapma ile) anlaşılmaktadır. Her iki durumda da yapılan ölçümlerde gözlenen en küçük değeri, en büyük değeri de belirtmelidir. Böylece dağılımın hangi aralık içinde kaldığı anlatılmış olur. En büyük değerden en küçük değerin çıkarılması ile “Dağılım Aralığı (Range)” bulunmuş olur.

Nicel Değişkenleri Ortalama ve Standart Sapma ile Özetlemek : Dağılımın özellikleri hangi verilerin sunumunun yapılacağının bilinmesi açısından önemlidir. Dağılımın belirlenmesi için de aşağıdaki koşullar fikir sahibi olunmasına yardımcı olurlar:

  • Gözlem sayısı 20’nin üzerine çıkan bir çoğunluğa ulaşmışsa,
  • Standart sapma aritmetik ortalamadan daha küçük bir matematiksel değerde kalmamışsa,
  • Aritmetik ortalama, ortanca ve tepe değeri birbirine eşit veya çok yakın değerlerde ise dağılımın normal dağılım özellikleri gösterdiği düşünülerek aritmetik ortalama ve standart sapma ile özetleme yolu seçilir.

Bunların yanı sıra daha ayrıntılı bir sınama yapmak gerekliliği oluşursa Tek Örnekte Kolmogorov Smirnov Testi ya da Lilliefors Testi kullanılabilir. Ya da dağılımın histogramına bakılarak normal dağılım eğrisinin bozulup bozulmadığı öncesinde irdelenir ve sonrasında yukardaki üç koşul aranır.

Histogramda normal dağılım eğrisi bozulmuş bir görünümde ise ve anlatılan üç özellik görünmüyor ise normal dağılım sağlanmadığı için, dağılımı özetlemek için ortanca ve çeyrekleri seçmek gerekmektedir. Ortalama ve ortancanın farklılığı bu şekilde ortaya çıkmış olur.

Nicel Değişkenleri Ortanca ve Çeyrekler ile Özetlemek: Normal dağılımdan bahsedemeyeceğimiz durumlarda dağılım ortanca ve çeyrekler ile özetlenir.

Hangi yöntem kullanılırsa kullanılsın, mutlaka bir merkezi değer ya da yaygınlık değeri ile dağılımın özetlendiğinin bilinmesi önemlidir.

Nicel Verilerin Özetlenmesinde Kullanılan Ölçütlerin Hesaplanması: Nicel verilerin özetlenmesinde kullanılan ölçütlerden biri, aritmetik ortalamadır. “Aritmetik Ortalama”, elde edilen bütün ölçüm sonuçları toplanarak kişi sayısına bölünmesiyle elde edilir. Bir diğer ölçüt “Ortanca” ise, elde edilen bütün ölçüm değerleri en küçükten en büyüğe doğru sıralanırsa toplam kişi sayısının tam yarısına gelen kişinin ölçüsü bu dağılımın ortancasını verir. Kişi sayısı çift ise, aynen yazıldığı gibi uygulanır, tek ise, bir eklenerek ikiye bölünür. Bir başkası tepe değeridir. “Tepe değer” dağılımda en çok kişinin aldığı değerdir. Sıklık inceleyen grafik (histogram) çizildiğinde grafiğin en tepe noktaya eriştiği yer olarak görünecektir.

Temel istatistik uygulamalarında en sık olarak dağılım aralığı (range), varyans, standart sapma, standart hata ve çeyreklikler karşımıza çıkanlardır. “Yaygınlık ölçütleri”, dağılımda ne kadar ölçüm değerinin hangi matematiksel mesafe ile ne şekilde merkezden uzaklaşma eğiliminde olduğunun ölçütleridir. “Dağılım aralığı”, en büyük değerden en küçük değerin çıkarılması ile bulunur. “Varyans” ın hesaplanması da kolaydır. Aritmetik ortalama bulununca her bir kişinin değeri ile ortalama arasındaki fark alınıp bu farklar toplanır ve serbestlik derecesine (kişi sayısının bir eksiği) bölünür, yani varyans ortalamadan farkların averajıdır. “Standart sapma”, varyansın kareköküdür. “Çeyrekler” ise, ortanca dağılımı ikiye bölmüş gibi düşününce her iki dağılımın ayrı ayrı ortancalarını bulmak ile elde edilirler.

Nicel Verilerin Dağılımını Özetleme Çalışması: Özetleri yayımlarken dikkat edilmesi gerekenler şunlardır:

  • Özetin dayandığı gözlem sayısı (n) her zaman belirtilir.
  • İkili seçeneklerde (ya A şıkkı ya B şıkkı şeklindeki durumlarda) A’nın veya B’nin yüzdesini yayımlanır ama ikisini birden yayımlanmaz. Çünkü okuyucu kalan kısmın diğer seçeneğe ait kısım olduğunu kolayca düşünebilir ve boş yere yazı fazlalığı ile uğraşmaya gerek yoktur.
  • Eğer merkezi değeri vermede ortancayı kullanılıyorsa, aynı zamanda alt ve üst çeyrekleri de verilmelidir.
  • Eğer merkezi değeri vermede ortalamayı kullanıyorsanız, aynı zamanda standart sapmayı da vermeyi ihmal etmeyiniz.
  • Her zaman dağılımın en küçük ve en büyük değerleri de yayımlanır.

Normal Dağılım ve Standart Hata: Örneklemin incelenmek istenen evreni (o özelliği taşıyan bütün birimlerin toplamından oluşan büyük kütle) iyice temsil edebilmesi ve bizi yanıltmaması için iki özellik taşıması gerekir: Yeterli sayıda birimden oluşmak ve bu birimlerin evreni iyi temsil edecek dağılımla seçilmiş olması yani normal dağılıyor olmasıdır. Bu şartların sağlanması ile ulaşılmak istenen hiçbir zaman bilemeyeceğimiz durumların ölçüsü veya oranıdır. Bu gibi durumlarda örneklemlerden elde ettiğimiz sonuçlar evrene atfedilir. Ancak bunu yaparken evrenin bütün birimleri ölçüme alınmadığı için belli bir oranda hata payı oluşacaktır. Bu yanılma payını ölçmek için standart hata kavramı kullanılır.

Normal dağılımın özellikleri şunlardır:

  • Nicel değişkenlerin dağılımıdır.
  • Simetriktir.
  • Teorik normal dağılımda aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir.
  • Merkezi değerden sağa ve sola bir standart sapma mesafesinde gidilerek oluşturulan sınırlar içine dağılımdaki toplam birim sayısının % 68’i düşer.
  • Merkezî değerden sağa ve sola 1,96 ile standart sapma çarpılarak bulunan değer mesafesinde gidilerek oluşturulan sınırlar içine dağılımdaki toplam birim sayısının % 95’i düşer.
  • Merkezî değerden sağa ve sola 2,58 ile standart sapma çarpılarak bulunan değer mesafesinde gidilerek oluşturulan sınırlar içine dağılımdaki toplam birim sayısının % 99’u düşer.

Standart Hata: Çan eğrileri çizen ortalamaların oluşturduğu ikinci bir çan eğrisi elde etmiş oluyoruz. İşte bu ortalamaların dağılımının standart sapmasına “standart hata” denir. Genellikle örneklemden bir ölçüt elde edildiğinde o ölçütün standart hatası da verilerek yayımlanır. Örneklem büyüklüğü arttıkça standart hata azalır. Evrenin tamamına ulaşılması halinde de sıfır olur.

İki Değişkenin Birlikte Ele Alınması

Amaç bir değişkenin değerleri şu veya bu şekilde değiştikçe diğer değişkende ne gibi değişimlerin olduğunu anlamaya çalışmaktır. Başka bir deyişle bir değişken diğer değişkeni nasıl etkilemektedir sorusuna cevap aranmaktadır. Tabi bazı değişkenler diğerlerini etkilemeyebilirler, bu nedenle de bu ayrımların farkın varmak önem arz etmektedir. Birbirlerini etkileme ve birbirlerinden etkilenme durumları değişkenlerin tanımlanmasında kullanılmaktadır.

Değişkenler böylelikle rolleri açısından ikiye ayrılabilmektedir; bağımsız değişken ve bağımlı değişken. Bazen değişkenler arasında böyle etkileme-etkilenme durumu söz konusu olmaz. Böyle değişkenler bir arada incelenirken hangisinin bağımsız, hangisinin bağımlı olarak ele alınacağı fark etmez. Bu değişkenler arasında bir ilişki yoktur denilir.

Bağımsız ve bağımlı değişkenler birlikte ele alınırken ve etkileşim durumları incelenirken onların veri karakterine göre değişik istatistiksel anlamlılık testleri uygulanmaktadır.

Nitel değişkenlere uygulanacak testler belirlenirken onların iki seçenekli mi, yoksa ikiden çok seçenekli mi olduğu testin belirlenmesinde önem kazanır. Nicel değişkenlerin testleri belirlenirken de onların normal dağılıma uyup uymadığı önem kazanır (S:142, Tablo 6.5).

İstatistiksel anlamlılık: Bir araştırmada elde edilen sonucun belirli bazı etkenlerin birbiriyle ilişkisi olduğundan mı, yoksa yalnızca şans eseri mi ortaya çıktığını anlamaya yarayan bir matematiksel araçtır.

Bilimsel bir çalışmada, bir hipotez oluşturulur sonra veri toplanarak analiz edilir. Belirli bir güven aralığı (genellikle % 95) hesaplanır, bu güven aralığında kalınması olasılığı bulunur. Eğer bu olasılık kırmızıçizginin (genellikle 0,05 yani % 5)’in altına inmişse gruplar arasında görülen fark anlamlıdır denir. İstatistiksel olarak anlamlı demek ortaya çıkan farkın şans eseri olması olasılığının % 5’ten az olması demektir. Bu kadar küçük bir olasılığa inanmayıp şans eseri ortaya çıkmama olasılığı olan % 95 veya daha üzeri olasılığa inanırız.

H0 hipotezi anlamlılık testlerini kolayca yürütmemiz için ortaya konulan genel bir hipotez ifadesidir. Her zaman görülen farkların şans eseri olarak ortaya çıktığını, yani evrendeki gerçek değerlerin aslında birbirinden farklı olmadığını, farkın sıfır olduğunu iddia eden bir önermedir. Biz H0 ’ın doğru olma olasılığını bulmaktayız. Bu olasılık küçük p harfi ile gösterilir.

İki Oranın Karşılaştırılması

İki şekilde yapılır:

  • İki oranın karşılaştırılmasında önemlilik testleri
  • İki oranın farklılığı için % 95 güven aralıklarıdır.

Herhangi bir istatistiksel önemlilik testinde, H0 hipotezini ortaya koymak, yani gruplar arasında anlamlı bir farklılık olmadığını iddia etmek testin başlangıcıdır. Bu sebeple iki oran (veya yüzde) karşılaştırılırken testi yapan önce olumsuz bir tavır alarak işe başlar ve arada anlamlı bir fark olmadığını iddia eder.

“p” Değerlerinin Yorumlanması: Yerleşik uygulamaya göre, p<0.05 değeri hipotezin yanlış olduğunu söylemeye yeter. Yüzdeler arasındaki fark 0,05 düzeyinde istatistiksel olarak anlamlıdır.

İki Oran Farkının %95 Güven Aralığı: Sadece bir farkın istatistiksel olarak anlamlı ya da anlamsız olduğunu söyleyip işi bitirmek yanlıştır. Bulunan p değeri verilmelidir.

İki Ortalamanın Karşılaştırılması

Eşleştirme yoksa iki ayrı toplulukta, birbirinden bağımsız olarak rastgele örneklemler alınmış demektir. Gözlemlerin çift olarak eşleştirildiği grupların ortalamalarının karşılaştırılması durumunda t-testinin eşleştirilmiş gruplar için uyarlanan şekli kullanılır.

Nitel Değişkenler Arasındaki İlişkiler

İki değişken arasındaki ilişkiyi incelenirken bu iki değişkenin birleşik dağılımı ele alınır ve 2-yönlü tablo (başka bir deyişle 2 değişkenin tablosu) oluşturulur (S:151, Tablo 6.10).

Nicel Değişkenler Arasındaki İlişkiler

Aynı kişiler, aynı toplum, aynı materyal vb. üzerinde birden çok özellik ölçümü yapılmışsa (örneğin çocukların boy uzunluğu ve vücut ağırlığı) “bu ölçüm değerlerinden birisi grubun geneline göre yüksek olan bir çocuğun diğer özellik ölçümü de yüksek mi çıkmaktadır?” gibi bir soru bizi korelasyon analizlerine götürmektedir. Yani özelliklerden birinin değeri arttıkça diğeri de artıyorsa azaldıkça da azalıyorsa bu iki değişken arasında pozitif korelasyon vardır denilir. Bazen biri arttıkça diğerinde azalma gözlenir. Bu durumlarda bu değişkenler arasında negatif korelasyon vardır denilir.

İki nicel değişkenin korelasyonu olup olmadığı saçılım grafiği oluşturularak gösterilir ve bir de korelasyon katsayısı hesaplanır. Saçılım grafiği her iki değişkenin de y ve x eksenlerine yerleştirilip kendi ölçü birimlerine göre cetvellerin bu eksenlere aktarıldığı kadran üzerinde oluşturulur.

Doğrusal korelasyon olmadığı zaman noktalar kadran üzerinde öylesine dağılmış bir görüntü verir. Artsa da zalsa da saçılan noktalar bir sanal çizgi etrafında ne kadar güzel hizaya dizilmişse başka bir deyişle elipsin karnı ne kadar daralıp çizgi şekline yaklaşmışsa korelasyon katsayısı (r) o kadar 1’e doğru yaklaşmış yani korelasyon güçlenmiş demektir. Pozitif tam ilişkide r = +1 olur. Negatif tam ilişkide ise r= -1’dir. Katsayılar 0,20’nin altına geldiğinde ilişki yok denecek düzeydedir(S:154, Tablo 6.16).

Bilimin Genel Yaklaşımı – Bilginin Birleştirilmesi: Böylece çalışmalar bireysel olmaktan çok takım oyunu hâlinde kurgulanmakta ve herkes üstlendiği kısmı en iyi yapmaya çalışmaktadır. Sağlık alanında yeni konuların, yeni tablo ve grafik tekniklerin, yeni analiz yöntemlerinin, yeni tür verilerin karşımıza çıkması çok doğaldır. Bu konu veya teknikle daha fazla uğraşmış bilim insanlarını bulup yardım almak, İnternet’ten bu yeni tekniği öğrenmek, gereğinde okuduğumuz yayının yazarına e-posta yazarak ondan daha fazla bilgi edinmek hep kullanılan yollardır. Ayrıca bilimin kanıt sayabileceği verileri elde ederken, analiz ederken ve yayımlarken büyük finansal bütçeler de gerekmektedir. Araştırma projesinin bütçesi ile sınırlı kanıtlar sonunda sınırlı kabul görecektir. Bunu yenmenin yolu bilgide ve beceride olduğu gibi finansal kaynaklarda da güç birliğine gitmektir. Araştırma tekniklerini öğrenirken bir yandan da araştırmacıların duyarlılık noktalarını da öğrenmek ve birlikte çalışma olanağını kaybetmemek gerekmektedir.