Monday, February 3, 2014

Ukuran penyebaran (Measures of Dispersion)


Ukuran penyebaran (Measures of Dispersion) atau ukuran keragaman pengamatan dari nilai rata-ratanya disebut simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk menentukan dispersi data pengamatan, seperti jangkauan/rentang (range), simpangan kuartil (quartile deviation), simpangan rata-rata (mean deviation), dan simpangan baku (standard deviation).
Ukuran tendensi sentral (mean, median, mode) merupakan nilai pewakil dari suatu distribusi frekuensi, tetapi ukuran tersebut tidak memberikan gambaran informasi yang lengkap mengenai bagaimana penyebaran data pengamatan terhadap nilai sentralnya. Ukuran tendensi sentral saja tidak cukup untuk menggambarkan distribusi frekuensi. Selain itu kita harus memiliki ukuran persebaran data pengamatan.


Jangkauan (Range)
Ukuran penyebaran yang paling sederhana adalah Range (Jangkauan/Rentang, terkadang di beberapa literatur diterjemahkan dengan istilah wilayah). Range dari suatu kelompok data pengamatan adalah selisih antara nilai minimum dan maksimum.
Misalnya, range untuk Varietas I pada tabel di atas adalah 45 - 40 = 5 (45 adalah nilai maksimum dan 40 adalah nilai minimum). Seringkali kita mengatakan range dengan pernyataan seperti "hasil berkisar antara 40 - 45 kg per petak". Kisarannya lebih sempit dibandingkan dengan pernyataan "hasil berkisar antara 40 - 60 kg per petak". Pernyataan pertama menggambarkan bahwa variasi hasil padi tidak terlalu beragam, sedangkan pada pernyataan kedua, terjadi hal sebaliknya.

Range hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat diandalkan sebagai indikator dari ukuran penyebaran. Hal ini terjadi karena range sangat dipengaruhi oleh nilai-nilai ekstrim. Pada contoh di atas, jika hasil tertinggi varietas I adalah 60 kg/petak, bukan 45 kg/petak, maka range-nya = 60-40= 20 kg/petak.
Jelas, interpretasi kita akan berubah. Kita lebih sepakat mengatakan bahwa variasi hasil sangat beragam. Benarkah demikian? Apabila kita perhatikan kembali, nilai hasil padi lainnya hampir seragam, berkisar antara 40-44 kg/petak. Namun dengan adanya pencilan hasil, 60 kg/petak, interpretasinya jadi lain, kita cenderung mengatakan bahwa hasil beragam, padahal keragaman tersebut sebenarnya tidak mewakili semua nilai dalam sampel/populasinya.

Hasil sebesar 60 kg/petak merupakan contoh dari nilai ekstrem dan tidak biasa. Nilai tersebut merupakan pencilan (outlier) dan sebaiknya di periksa kembali kebenaran datanya atau dihilangkan dari data pengamatan, karena akan menghasilkan kesimpulan yang tidak tepat.

Contoh 1:
Contoh kasus lain yang bisa menimbulkan salah interpretasi mengenai ukuran penyebaran data dengan menggunakan Range adalah sebagai berikut:
Berikut ini adalah nilai Quiz ke-1 dan ke-2 Matakuliah Statistik. Tentukan Range untuk masing-masing Quiz. Apa kesimpulan Anda?
Quiz ke-1:
1
20
20
20
20
20
20
20
20
20
20
Quiz ke-2:
2
3
4
5
6
14
15
16
17
18
19
Jawab:
Quiz 1: range = 20-1 = 19
Quiz 2: range = 19-2 = 17
Kesimpulan:
Quiz ke-1 lebih bervariasi di banding Quiz 2 karena nilai range Quiz 1 > Quiz 2. Bandingkan dengan kesimpulan yang diperoleh dengan menggunakan simpangan kuartil dan Standar deviasi.
Kelemahan lain dari Range adalah tidak menggambarkan sebaran data terhadap nilai pusatnya. Perhatikan contoh dan gambar berikut.
Contoh 2:
Tentukan Mean dan Range dari kedua Varietas berikut. Kesimpulan apa yang bisa Anda tarik berdasarkan nilai mean (rata-rata) dan range-nya?
Varietas I
45
42
42
41
40
Varietas III
45
40
44
41
40
Jawab:
Varietas I: Mean = 42; range = 5
Varietas II: Mean = 42; range = 5
Kesimpulan:
Kedua Varietas, I dan III mempunyai nilai mean dan range yang sama, yaitu mean = 42 dan range = 5.















Apabila kita hanya menggunakan ukuran range sebagai ukuran penyebaran, pasti kita mengatakan bahwa keragaman hasil kedua varietas sama. Namun apabila kita perhatikan bagaimana sebaran data kedua varietas terhadap nilai pusatnya, mungkin kita lebih memilih Varietas I, karena pada Varietas I sebaran datanya tidak jauh dari nilai pusatnya.
Untuk menghindari kelemahan range seperti di atas, ukuran dispersi lain seperti simpangan kuartil lebih disukai.

Simpangan kuartil dihitung dengan cara menghapus nilai-nilai yang terletak di bawah kuartil pertama dan nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang berada di bawah ataupun di atas distribusi data, dihilangkan.
Simpangan kuartil didapatkan dengan cara menghitung nilai rata-rata dari kedua kuartil tersebut, Q1 dan Q3.


Simpangan kuartil lebih stabil dibandingkan dengan Range karena tidak dipengaruhi oleh nilai ekstrem. Nilai-nilai ekstrim sudah dihapus. Meskipun demikian, sama seperti Range, simpangan kuartil juga tetap tidak memperhatikan dan memperhitungkan penyimpangan semua gugus datanya. Simpangan kuartil hanya memperhitungkan nilai pada kuartil pertama dan kuartil ketiga saja.

Contoh 3
Tentukan nilai simpangan kuartil pada Contoh 2.
Jawab:
Untuk menentukan nilai kuartil, terlebih dahulu sampel data harus diurutkan. Kebetulan pada contoh ini, data sudah terurut.
Selanjutnya tentukan letak dari kuartil tersebut dan terakhir tentukan nilai kuartilnya.
1
2
3
4
5
6
7
8
9
10
11
Quiz 1:
1
20
20
20
20
20
20
20
20
20
20
Quiz 2:
2
3
4
5
6
14
15
16
17
18
19
n = 11




Quiz 1:
Letak Q1 = ¼(11+1) = 3 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 20

Letak Q3 = ¾(11+1) = 9 sehingga nilai Q1 adalah data yang terletak pada urutan ke-9, yaitu 20




Quiz 2:
Letak Q1 = ¼(11+1) = 3 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 5
Letak Q3 = ¾(11+1) = 9 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 17




Kesimpulan:
Berdasarkan simpangan kuartil, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)



No comments:

Post a Comment