Ukuran penyebaran (Measures of Dispersion)
atau ukuran keragaman pengamatan dari nilai rata-ratanya disebut simpangan (deviation/dispersi).
Terdapat beberapa ukuran untuk menentukan dispersi data pengamatan, seperti jangkauan/rentang
(range), simpangan kuartil (quartile deviation), simpangan
rata-rata (mean deviation), dan simpangan baku (standard
deviation).
Ukuran tendensi sentral (mean,
median, mode) merupakan nilai pewakil dari suatu distribusi
frekuensi, tetapi ukuran tersebut tidak memberikan gambaran informasi yang
lengkap mengenai bagaimana penyebaran data pengamatan terhadap nilai sentralnya.
Ukuran tendensi sentral saja tidak cukup untuk menggambarkan distribusi
frekuensi. Selain itu kita harus memiliki ukuran persebaran data pengamatan.
Jangkauan (Range)
Ukuran penyebaran yang paling
sederhana adalah Range (Jangkauan/Rentang, terkadang di beberapa
literatur diterjemahkan dengan istilah wilayah). Range dari suatu
kelompok data pengamatan adalah selisih antara nilai minimum dan maksimum.
Misalnya, range untuk Varietas I
pada tabel di atas adalah 45 - 40 = 5 (45 adalah nilai maksimum dan 40 adalah
nilai minimum). Seringkali kita mengatakan range dengan pernyataan seperti
"hasil berkisar antara 40 - 45 kg per petak". Kisarannya lebih sempit
dibandingkan dengan pernyataan "hasil berkisar antara 40 - 60 kg per
petak". Pernyataan pertama menggambarkan bahwa variasi hasil padi tidak
terlalu beragam, sedangkan pada pernyataan kedua, terjadi hal sebaliknya.
Range hanya memperhitungkan dua nilai,
yaitu nilai maksimum dan nilai minimum dan tidak memperhitungkan semua nilai,
sehingga sangat tidak stabil atau tidak dapat diandalkan sebagai
indikator dari ukuran penyebaran. Hal ini terjadi karena range sangat
dipengaruhi oleh nilai-nilai ekstrim. Pada contoh di atas, jika hasil
tertinggi varietas I adalah 60 kg/petak, bukan 45 kg/petak, maka range-nya =
60-40= 20 kg/petak.
Jelas, interpretasi kita akan
berubah. Kita lebih sepakat mengatakan bahwa variasi hasil sangat beragam.
Benarkah demikian? Apabila kita perhatikan kembali, nilai hasil padi lainnya
hampir seragam, berkisar antara 40-44 kg/petak. Namun dengan adanya pencilan
hasil, 60 kg/petak, interpretasinya jadi lain, kita cenderung mengatakan bahwa
hasil beragam, padahal keragaman tersebut sebenarnya tidak mewakili semua nilai
dalam sampel/populasinya.
Hasil sebesar 60 kg/petak merupakan
contoh dari nilai ekstrem dan tidak biasa. Nilai tersebut merupakan pencilan (outlier)
dan sebaiknya di periksa kembali kebenaran datanya atau dihilangkan dari data
pengamatan, karena akan menghasilkan kesimpulan yang tidak tepat.
Contoh 1:
Contoh kasus lain yang bisa
menimbulkan salah interpretasi mengenai ukuran penyebaran data dengan
menggunakan Range adalah sebagai berikut:
Berikut ini adalah nilai Quiz ke-1
dan ke-2 Matakuliah Statistik. Tentukan Range untuk masing-masing Quiz. Apa
kesimpulan Anda?
Quiz ke-1:
|
1
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
Quiz ke-2:
|
2
|
3
|
4
|
5
|
6
|
14
|
15
|
16
|
17
|
18
|
19
|
Jawab:
Quiz 1: range = 20-1 = 19
Quiz 2: range = 19-2 = 17
Kesimpulan:
Quiz ke-1 lebih bervariasi di
banding Quiz 2 karena nilai range Quiz 1 > Quiz 2. Bandingkan dengan kesimpulan
yang diperoleh dengan menggunakan simpangan kuartil dan Standar deviasi.
Kelemahan lain dari Range adalah
tidak menggambarkan sebaran data terhadap nilai pusatnya. Perhatikan contoh dan
gambar berikut.
Contoh 2:
Tentukan Mean dan Range dari kedua
Varietas berikut. Kesimpulan apa yang bisa Anda tarik berdasarkan nilai mean
(rata-rata) dan range-nya?
Varietas I
|
45
|
42
|
42
|
41
|
40
|
Varietas III
|
45
|
40
|
44
|
41
|
40
|
Jawab:
Varietas I: Mean = 42; range = 5
Varietas II: Mean = 42; range = 5
Kesimpulan:
Kedua Varietas, I dan III mempunyai
nilai mean dan range yang sama, yaitu mean = 42 dan range = 5.
Apabila kita hanya menggunakan
ukuran range sebagai ukuran penyebaran, pasti kita mengatakan bahwa keragaman
hasil kedua varietas sama. Namun apabila kita perhatikan bagaimana sebaran data
kedua varietas terhadap nilai pusatnya, mungkin kita lebih memilih Varietas I,
karena pada Varietas I sebaran datanya tidak jauh dari nilai pusatnya.
Untuk menghindari kelemahan range
seperti di atas, ukuran dispersi lain seperti simpangan kuartil lebih
disukai.
Simpangan kuartil dihitung dengan
cara menghapus nilai-nilai yang terletak di bawah kuartil pertama dan
nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang
berada di bawah ataupun di atas distribusi data, dihilangkan.
Simpangan kuartil didapatkan dengan
cara menghitung nilai rata-rata dari kedua kuartil tersebut, Q1 dan
Q3.
Simpangan kuartil lebih stabil
dibandingkan dengan Range karena tidak dipengaruhi oleh nilai ekstrem.
Nilai-nilai ekstrim sudah dihapus. Meskipun demikian, sama seperti Range,
simpangan kuartil juga tetap tidak memperhatikan dan memperhitungkan
penyimpangan semua gugus datanya. Simpangan kuartil hanya memperhitungkan nilai
pada kuartil pertama dan kuartil ketiga saja.
Contoh 3
Tentukan nilai simpangan kuartil
pada Contoh 2.
Jawab:
Untuk menentukan nilai kuartil,
terlebih dahulu sampel data harus diurutkan. Kebetulan pada contoh ini, data
sudah terurut.
Selanjutnya tentukan letak dari
kuartil tersebut dan terakhir tentukan nilai kuartilnya.
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
|
Quiz 1:
|
1
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
20
|
Quiz 2:
|
2
|
3
|
4
|
5
|
6
|
14
|
15
|
16
|
17
|
18
|
19
|
n = 11
Quiz 1:
Letak Q1 = ¼(11+1) = 3 sehingga
nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 20
Letak Q3 = ¾(11+1) = 9 sehingga nilai
Q1 adalah data yang terletak pada urutan ke-9, yaitu 20
Quiz 2:
Letak Q1 = ¼(11+1) = 3 sehingga
nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 5
Letak Q3 = ¾(11+1) = 9 sehingga
nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 17
Kesimpulan:
Berdasarkan simpangan kuartil, Quiz
ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda
dengan kesimpulan berdasarkan range)
No comments:
Post a Comment