Ukuran Penyebaran (Measures of Dispersion) ~ Dunia Cerita

Ukuran tendensi sentral (mean, median, mode) merupakan nilai pewakil dari suatu distribusi frekuensi, tetapi ukuran tersebut tidak memberikan gambaran informasi yang lengkap mengenai bagaimana penyebaran data pengamatan terhadap nilai sentralnya. Sebagai contoh, kita mempunyai distribusi hasil panen dua varietas padi (kg per plot), masing-masing terdiri dari 5 plot. Andaikan distribusi datanya sebagai berikut:
Varietas I : 45 42 42 41 40 Varietas II : 54 48 42 36 30 Varietas III : 45 40 44 41 40
Kita dapat melihat bahwa nilai mean varietas I dan II bernilai sama, 42 kg, namun apabila kita perhatikan, keragaman kedua varietas tersebut berbeda. Varietas I mungkin lebih dipilih karena lebih konsisten. Hal ini terlihat dari data hasil pada varietas I lebih seragam dibandingkan dengan Varietas II. Pada Varietas I, hasilnya tidak terlalu jauh dari nilai pusatnya, 42 kg, sedangkan pada Varietas II, sebaran datanya sangat beragam (perhatikan gambar berikut).

Pada contoh tersebut, jelas bahwa ukuran tendensi sentral saja tidak cukup untuk menggambarkan distribusi frekuensi. Selain itu kita harus memiliki ukuran persebaran data pengamatan. Ukuran penyebaran atau ukuran keragaman pengamatan dari nilai rata-ratanya disebut simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk menentukan dispersi data pengamatan, seperti jangkauan/rentang (range), simpangan kuartil (quartile deviation), simpangan rata-rata (mean deviation), dan simpangan baku (standard deviation).

Jangkauan (Range)

Ukuran penyebaran yang paling sederhana adalah Range (Jangkauan/Rentang, terkadang di beberapa literatur diterjemahkan dengan istilah wilayah). Range dari suatu kelompok data pengamatan adalah selisih antara nilai minimum dan maksimum.

$Range=nilai\ maksimum-nilai\ minimum$

Misalnya, range untuk Varietas I pada tabel di atas adalah 45 – 40 = 5 (45 adalah nilai maksimum dan 40 adalah nilai minimum). Seringkali kita mengatakan range dengan pernyataan seperti “hasil berkisar antara 40 – 45 kg per petak”. Kisarannya lebih sempit dibandingkan dengan pernyataan “hasil berkisar antara 40 – 60 kg per petak”. Pernyataan pertama menggambarkan bahwa variasi hasil padi tidak terlalu beragam, sedangkan pada pernyataan kedua, terjadi hal sebaliknya.
Range hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat diandalkan sebagai indikator dari ukuran penyebaran. Hal ini terjadi karena range sangat dipengaruhi oleh nilai-nilai ekstrim. Pada contoh di atas, jika hasil tertinggi varietas I adalah 60 kg/petak, bukan 45 kg/petak, maka range-nya = 60-40= 20 kg/petak.
Jelas, interpretasi kita akan berubah. Kita lebih sepakat mengatakan bahwa variasi hasil sangat beragam. Benarkah demikian? Apabila kita perhatikan kembali, nilai hasil padi lainnya hampir seragam, berkisar antara 40-44 kg/petak. Namun dengan adanya pencilan hasil, 60 kg/petak, interpretasinya jadi lain, kita cenderung mengatakan bahwa hasil beragam, padahal keragaman tersebut sebenarnya tidak mewakili semua nilai dalam sampel/populasinya.
Hasil sebesar 60 kg/petak merupakan contoh dari nilai ekstrem dan tidak biasa. Nilai tersebut merupakan pencilan (outlier) dan sebaiknya di periksa kembali kebenaran datanya atau dihilangkan dari data pengamatan, karena akan menghasilkan kesimpulan yang tidak tepat.
Contoh 2:

Contoh kasus lain yang bisa menimbulkan salah interpretasi mengenai ukuran penyebaran data dengan menggunakan Range adalah sebagai berikut:
Berikut ini adalah nilai Quiz ke-1 dan ke-2 Matakuliah Statistik. Tentukan Range untuk masing-masing Quiz. Apa kesimpulan Anda?

Quiz ke-1:	1	20	20	20	20	20	20	20	20	20	20
Quiz ke-2:	2	3	4	5	6	14	15	16	17	18	19

Jawab:

Quiz 1: range = 20-1 = 19
Quiz 2: range = 19-2 = 17
Kesimpulan:
Quiz ke-1 lebih bervariasi di banding Quiz 2 karena nilai range Quiz 1 > Quiz 2. Bandingkan dengan kesimpulan yang diperoleh dengan menggunakan simpangan kuartil dan Standar deviasi.
Kelemahan lain dari Range adalah tidak menggambarkan sebaran data terhadap nilai pusatnya. Perhatikan contoh dan gambar berikut.
Contoh 3:

Tentukan Mean dan Range dari kedua Varietas berikut. Kesimpulan apa yang bisa Anda tarik berdasarkan nilai mean (rata-rata) dan range-nya?

Varietas I	45	42	42	41	40
Varietas III	45	40	44	41	40

Jawab:

Varietas I: Mean = 42; range = 5
Varietas II: Mean = 42; range = 5
Kesimpulan:

Kedua Varietas, I dan III mempunyai nilai mean dan range yang sama, yaitu mean = 42 dan range = 5.

Apabila kita hanya menggunakan ukuran range sebagai ukuran penyebaran, pasti kita mengatakan bahwa keragaman hasil kedua varietas sama. Namun apabila kita perhatikan bagaimana sebaran data kedua varietas terhadap nilai pusatnya, mungkin kita lebih memilih Varietas I, karena pada Varietas I sebaran datanya tidak jauh dari nilai pusatnya.
Untuk menghindari kelemahan range seperti di atas, ukuran dispersi lain seperti simpangan kuartil lebih disukai.

Simpangan kuartil (Quartile Deviation)

Simpangan kuartil dihitung dengan cara menghapus nilai-nilai yang terletak di bawah kuartil pertama dan nilai-nilai di atas kuartil ketiga, sehingga nilai-nilai ekstrem, baik yang berada di bawah ataupun di atas distribusi data, dihilangkan.
Simpangan kuartil didapatkan dengan cara menghitung nilai rata-rata dari kedua kuartil tersebut, Q₁ dan Q₃.

$\dfrac{\left(Q_3-Q_2\right)+(Q_2-Q_1)}{2}=\dfrac{(Q_3-Q_1)}{2}$

Simpangan kuartil lebih stabil dibandingkan dengan Range karena tidak dipengaruhi oleh nilai ekstrem. Nilai-nilai ekstrim sudah dihapus. Meskipun demikian, sama seperti Range, simpangan kuartil juga tetap tidak memperhatikan dan memperhitungkan penyimpangan semua gugus datanya. Simpangan kuartil hanya memperhitungkan nilai pada kuartil pertama dan kuartil ketiga saja.
Contoh 4

Tentukan nilai simpangan kuartil pada Contoh 2.
Jawab:

Untuk menentukan nilai kuartil, terlebih dahulu sampel data harus diurutkan. Kebetulan pada contoh ini, data sudah terurut.
Selanjutnya tentukan letak dari kuartil tersebut dan terakhir tentukan nilai kuartilnya.

	1	2	3	4	5	6	7	8	9	10	11
Quiz 1:	1	20	20	20	20	20	20	20	20	20	20
Quiz 2:	2	3	4	5	6	14	15	16	17	18	19

n = 11
$Letak\ Q_i=\dfrac{i}{4}(n+1)$
Quiz 1:

Letak Q1 = ¼(11+1) = 3 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 20
Letak Q3 = ¾(11+1) = 9 sehingga nilai Q1 adalah data yang terletak pada urutan ke-9, yaitu 20
$simpangan\ kuartil=\dfrac{(Q_3-Q_1)}{2}=\dfrac{(20-20)}{2}=0$
Quiz 2:

Letak Q1 = ¼(11+1) = 3 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 5
Letak Q3 = ¾(11+1) = 9 sehingga nilai Q1 adalah data yang terletak pada urutan ke-3, yaitu 17
$simpangan\ kuartil=\dfrac{(Q_3-Q_1)}{2}=\dfrac{(17-5)}{2}=6$
Kesimpulan:

Berdasarkan simpangan kuartil, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)

Simpangan Rata-rata (Mean Deviation)

Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median cukup kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada umumnya, simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai simpangan rata-rata. Simpangan rata-rata dihitung dengan formula berikut:
$Simpangan\ rata-rata=\dfrac{\Sigma (x_i-\overline{x})}{n}$
Formula tersebut tentu memenuhi dua kriteria sebelumnya, dihitung dari semua data dan menunjukkan dispersi rata-rata dari mean, tetapi tidak memenuhi kriteria ketiga. Bagaimanapun dispersi dari data, semua perhitungan dengan rumus ini akan selalu menghasilkan nilai nol. Hal ini karena pembilang dari rumus di atas $\Sigma (x_i-x)$ menunjukkan bahwa hasil penjumlahannya akan selalu sama dengan nol.
Terdapat dua cara untuk mengantisipasi masalah ini, keduanya akan menghilangkan tanda-tanda negatif dari perhitungan.
Cara pertama adalah dengan menggunakan formula berikut:
Sampel:
$Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\overline{x}|}{n}$
Populasi:
$Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\mu |}{N}$
Untuk data yang sudah disusun dalam bentuk tabel frekuensi:
Data Tunggal (tidak di grupkan berdasarkan selang kelas):
$Simpangan\ rata-rata=\dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|x_i-\overline{x}|}}{\Sigma f_i}=\dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|x_i-\overline{x}|}}{n}$
Data kelompok (sudah digrupkan berdasarkan selang tertentu):
Simpangan rata-rata yang dihitung dari distribusi frekuensi data yang dikelompokkan menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, m_i). Selanjutnya, nilai perkiraan simpangan rata-rata dapat dihitung dengan menggunakan rumus:
$Simpangan\ rata-rata\approx \dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|m_i-\overline{x}|}}{\Sigma f_i}=\dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|m_i-\overline{x}|}}{n}$
Pada formula di atas, pembilangnya akan selalu bernilai positif, karena yang diambil adalah nilai mutlaknya, perhatikan tanda modulus || yang berarti baik hasilnya negatif ataupun positif akan selalu diperlakukan sebagai data positif.
Cara kedua adalah dengan menggunakan jumlah kuadrat dari semua nilai simpangan datanya. Cara ini dikenal dengan istilah Ragam (varians) dan standar deviasi.
Contoh 5

Tentukan nilai simpangan rata-rata pada Contoh 2.
Jawab:

Quiz I: rata-rata =18.27
Quiz 2: rata-rata = 10.82

No	Quiz 1 (x_i)	$x_i-\overline{x}$	$\left\|x_i-\overline{x}\right\|$	Quiz 2 (x_i)	$x_i-\overline{x}$	$\left\|x_i-\overline{x}\right\|$
1	1	-17.27	17.27	2	-8.82	8.82
2	20	1.73	1.73	3	-7.82	7.82
3	20	1.73	1.73	4	-6.82	6.82
4	20	1.73	1.73	5	-5.82	5.82
5	20	1.73	1.73	6	-4.82	4.82
6	20	1.73	1.73	14	3.18	3.18
7	20	1.73	1.73	15	4.18	4.18
8	20	1.73	1.73	16	5.18	5.18
9	20	1.73	1.73	17	6.18	6.18
10	20	1.73	1.73	18	7.18	7.18
11	20	1.73	1.73	19	8.18	8.18
		Jumlah	34.55		Jumlah	68.18

Quiz 1:

$Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\overline{x}|}{n}=\dfrac{34.55}{11}=3.141$

Quiz 2:

$Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\overline{x}|}{n}=\dfrac{68.18}{11}=6.198$

Kesimpulan:

Berdasarkan simpangan rata-rata, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)
Catatan:

Untuk menentukan simpangan rata-rata dari tabel frekuensi, caranya mirip dengan contoh 7 dan 8.
Contoh Tambahan:

Dengan cara yang sama seperti di atas, nilai simpangan rata-rata untuk ketiga varietas:
Varietas I = 1.2
Varietas II = 7.2
Varietas III = 2

Ragam dan Standar deviasi

Ukuran penyebaran dengan menggunakan perhitungan simpangan rata-rata diperoleh dengan mengabaikan tanda-tanda penyimpangan.
Secara matematis hal tersebut tidak benar. Cara kedua, yaitu dengan mengkuadratkan nilai simpangan sehingga nilai negatif berubah menjadi positif. Cara ini lebih tepat. Rata-rata dari jumlah nilai simpangan dikenal dengan ragam (varians). Setelah nilai ragam diperoleh, selanjutnya nilai ragam tersebut diakarkan untuk mendapatkan kembali satuan asal dari variabel tersebut (bukan kg²/petak², tapi kg/petak

) . Cara pengukuran keragaman seperti ini dikenal dengan Standar deviasi.
Secara matematis, standar deviasi dapat dihitung dengan menggunakan formula:
$\sigma =\sqrt{\dfrac{\Sigma {\left(x_i-\mu \right)}^2}{N}}\ atau\ \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{N}}{N}}\$
Standar deviasi populasi disimbolkan dengan ? (baca ‘sigma’) dan standar deviasi sampel disimbolkan dengan s. Standar deviasi sampel yang baik seharusnya merupakan ukuran yang tidak bias terhadap standar deviasi populasinya, karena kita menggunakan ukuran standar deviasi sampel untuk memperkirakan nilai standar deviasi populasi. Untuk itu, nilai n pada formula di atas diganti dengan n – 1 sehingga formula untuk standar deviasi sampel adalah sebagai berikut:
$s=\sqrt{\dfrac{\Sigma {\left(x_i-\overline{x}\right)}^2}{n-1}}\ {\rm atau}\ \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{n}}{n-1}}\$
Mengapa harus diganti dengan n-1?! Pembuktiannya diluar bahasan blog ini.

Data pada tabel distribusi frekuensi:
Data Tunggal:
$s=\sqrt{\dfrac{\sum^k_{i=1}{{f_i\left(x_i-\overline{x}\right)}^2}}{n-1}}\ {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_ix}^2_i-\dfrac{{\left(\Sigma f_ix_i\right)}^2}{n}}{n-1}}\$
$\ {\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_ix}^2_i-{\left(\Sigma f_ix_i\right)}^2}{n(n-1)}}$
Data kelompok (sudah digrupkan berdasarkan selang tertentu):
Sama seperti pada perhitungan simpangan rata-rata. Standar deviasi dan ragam yang dihitung dari distribusi frekuensi data yang sudah dikelompokkan menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, m_i). Selanjutnya, nilai perkiraan standar deviasi dapat dihitung dengan menggunakan rumus:
$s=\sqrt{\dfrac{\sum^k_{i=1}{{f_i\left(m_i-\overline{x}\right)}^2}}{n-1}}\ {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma f_im_i\right)}^2}{n}}{n-1}}\$
$\ {\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma f_im_i\right)}^2}{n(n-1)}}$
Nilai kuadrat dari standar deviasi dikenal dengan ragam (variance). Pada teknik analisis varian, $\Sigma x^2-\dfrac{{\left(\Sigma x\right)}^2}{n}$ dikenal dengan Jumlah Kuadrat (Sum of Square), dan ragam (varian) dikenal dengan istilah Kuadrat Tengah/Rata-rata Jumlah Kuadrat (Mean Square).
Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus data dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun, apabila dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi, sama halnya seperti mean.
Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila setiap unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan tertentu. Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan setara dengan hasilkali dari nilai standar deviasi aktual dengan konstan.
Contoh 6

Apabila data nilai Quiz pada contoh 2 diambil dari sampel, tentukan nilai ragam dan standar deviasinya.
Jawab:

Untuk mencari nilai standar deviasi sampel, kita bisa menggunakan salah satu formula berikut:
$s=\sqrt{\dfrac{\Sigma {\left(x_i-\overline{x}\right)}^2}{n-1}}\ {\rm atau}\ \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{n}}{n-1}}\$
Formula pertama adalah formula secara definitif. Formula yang direkomendasikan untuk perhitungan secara manual adalah formula yang ke-2. Cara perhitungan dengan formula yang ke-2 bisa di lihat pada contoh 7 dan 8. Pada contoh ini, sebagai latihan, kita gunakan formula yang pertama. Untuk perhitungan dengan formula pertama, kita memerlukan nilai rata-ratanya, sehingga terlebih dahulu kita harus menghitung nilai rata-ratanya.
Quiz I: rata-rata =18.27
Quiz 2: rata-rata = 10.82

No	Quiz 1 (x_i)	$(x_i-\overline{x})$	${\left(x_i-\overline{x}\right)}^2$	Quiz 2 (x_i)	$(x_i-\overline{x})$	${\left(x_i-\overline{x}\right)}^2$
1	1	-17.27	298.35	2	-8.82	77.76
2	20	1.73	2.98	3	-7.82	61.12
3	20	1.73	2.98	4	-6.82	46.49
4	20	1.73	2.98	5	-5.82	33.85
5	20	1.73	2.98	6	-4.82	23.21
6	20	1.73	2.98	14	3.18	10.12
7	20	1.73	2.98	15	4.18	17.49
8	20	1.73	2.98	16	5.18	26.85
9	20	1.73	2.98	17	6.18	38.21
10	20	1.73	2.98	18	7.18	51.58
11	20	1.73	2.98	19	8.18	66.94
		Jumlah	328.1818			453.6364

Quiz 1:

$s=\sqrt{\dfrac{\Sigma {\left(x_i-\overline{x}\right)}^2}{n-1}}\ \ s=\sqrt{\dfrac{328.18}{11-1}}=5.73\$
$ragam=s^2={5.73}^2=32.82\$
Quiz 2:

$s=\sqrt{\dfrac{453.64}{11-1}}=6.74\ \$

$ragam=s^2={6.74}^2=45.36$

Kesimpulan:

Berdasarkan nilai ragam dan standar deviasi, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)
Contoh 7

Hitung nilai standar deviasi dan ragam dari tabel frekuensi data tunggal berikut:

No	x_i	f_i
1	70	5
2	69	6
3	45	3
4	80	1
5	56	1
Jumlah	320	16

Jawab:

Untuk kemudahan dalam perhitungan secara manual, kita gunakan formula standar deviasi berikut:
$s=\sqrt{\dfrac{n\Sigma {f_ix}^2_i-{\left(\Sigma f_ix_i\right)}^2}{n(n-1)}}\ {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_ix}^2_i-\dfrac{{\left(\Sigma f_ix_i\right)}^2}{n}}{n-1}}$
Selanjutnya kita buat tabel seperti pada tabel berikut:

No	x_i	f_i	f_i.x_i	f_i.x_i²
1	70	5	350	24500
2	69	6	414	28566
3	45	3	135	6075
4	80	1	80	6400
5	56	1	56	3136
Jumlah	320	16	1035	68677

Dari tabel tersebut didapat:
n = 16
mean = 1035/12 = 64.69
Standar deviasi:
$s=\sqrt{\dfrac{{\rm 68677}-\dfrac{{\left({\rm 1035}\right)}^2}{16}}{16-1}}=10.72\$
${\rm atau}\ s=\sqrt{\dfrac{16(68677)-{\left({\rm 1035}\right)}^2}{16(16-1)}}=10.72$
${\rm Ragam}\ s^2={\left(10.72\right)}^2=115.03$
Contoh 8

Hitung nilai standar deviasi dan ragam dari tabel frekuensi yang sudah dikelompokkan:
Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh di atas, pada contoh ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).

Kelas ke-	Nilai Ujian	f_i
1	31 – 40	2
2	41 – 50	3
3	51 – 60	5
4	61 – 70	13
5	71 – 80	24
6	81 – 90	21
7	91 – 100	12
	Jumlah	80

Jawab:

Untuk kemudahan dalam perhitungan secara manual, kita gunakan formula standar deviasi berikut:
$s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma f_im_i\right)}^2}{n}}{n-1}}\ {\rm atau}\ \ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma f_im_i\right)}^2}{n(n-1)}}$
Selanjutnya kita buat daftar tabel berikut, tentukan nilai tengah kelas/pewakilnya (m_i) dan lengkapi kolom berikutnya.

Kelas ke-	Nilai Ujian	f_i	m_i	f_i.m_i	f_i.m_i²
1	31 – 40	2	35.5	71.0	2520.5
2	41 – 50	3	45.5	136.5	6210.8
3	51 – 60	5	55.5	277.5	15401.3
4	61 – 70	13	65.5	851.5	55773.3
5	71 – 80	24	75.5	1812.0	136806.0
6	81 – 90	21	85.5	1795.5	153515.3
7	91 – 100	12	95.5	1146.0	109443.0
	Jumlah	80	458.5	6090.0	479670.0

Dari tabel tersebut didapat:
n = 80
mean = 6090/80 = 76.13
Standar deviasi dan ragam:
$s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma f_im_i\right)}^2}{n}}{n-1}}=\sqrt{\dfrac{{\rm 479670}-\dfrac{{\left({\rm 6090}\right)}^2}{80}}{80-1}}=77.92$
${\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma f_im_i\right)}^2}{n(n-1)}}=\sqrt{\dfrac{80(479670)-{\left({\rm 6090}\right)}^2}{80(80-1)}}=77.92$
${\rm Ragam}\ s^2={\left(77.92\right)}^2=6070.81$
Contoh Tambahan:

Dengan cara yang sama seperti di atas, nilai standar deviasi untuk ketiga varietas:
Varietas I = 1.87
Varietas II = 9.49
Varietas III = 2.35

Ukuran sebaran relatif (Measures of Relative Dispersion)

Perhatikan contoh kasus Varietas I vs Varietas II di atas. Kedua varietas tersebut mempunyai nilai rata-rata yang sama. Untuk dua distribusi data dengan nilai rata-rata yang sama atau hampir sama, kita dapat secara langsung membandingkan keragaman kedua distribusi tersebut dengan melihat nilai standar deviasinya. Kita sepakat untuk mengatakan bahwa Varietas II lebih beragam dibandingkan dengan Varietas I. Namun apabila rata-rata dari kedua distribusi data tersebut jauh berbeda, kita tidak dapat membandingkan keragamannya dengan menggunakan nilai standar deviasinya secara langsung. Pada kasus tersebut, untuk membandingkan tingkat keragaman dari kedua distribusi datanya, kita harus menggunakan ukuran penyebaran relatif.
Terdapat beberapa ukuran penyebaran relatif untuk Range, Simpangan Kuartil, Simpangan Rata-rata, dan Standar deviasi. Koefisien Keragaman (coefficient of variation) yang paling penting dan sering digunakan adalah ukuran penyebaran relatif dari Standar Deviasi.
Koefisien Keragaman Standar deviasi dihitung dengan formula berikut:
$KK=C.V=\dfrac{s}{\overline{x}}\times 100\%$
Koefisien Keragaman merupakan ukuran yang bebas satuan dan selalu dinyatakan dalam bentuk persentase. Nilai KK yang kecil menunjukkan bahwa data tidak terlalu beragam dan di katakan lebih konsisten. KK tidak dapat diandalkan apabila nilai rata-rata hampir sama dengan 0 (nol). KK juga tidak stabil apabila skala pengukuran data yang digunakan bukan skala rasio.
Contoh 9:

Perhatikan gugus data untuk Kelompok A dan Kelompok B

A	2	4	5	6	6	7	7	7	8	9
B	3	6	7	9	9	10	10	10	11	12

Kelompok A: Rata-rata = 6.1; s = 2.0
Kelompok B: Rata-rata = 8.7; s = 2.7
$KK\left(A\right)=\dfrac{s}{\overline{x}}\times 100\%=\dfrac{2.0}{6.1}\times 100\%=33.2\%$
$KK\left(B\right)=\dfrac{s}{\overline{x}}\times 100\%=\dfrac{2.7}{8.7}\times 100\%=30.7\%$
Nilai Koefisien keragaman kelompok B lebih kecil dibandingkan dengan kelompok A. Namun apabila kita perhatikan nilai standar deviasinya, justru hal sebaliknya yang terjadi, SD A lebih kecil dibandingkan dengan SD B. Dengan demikian, untuk melihat keragaman relatif suatu gugus data, kita jangan hanya menyandarkan pada nilai standar deviasinya.

Skewness and Kurtosis

Rata-rata dan ukuran penyebaran dapat menggambarkan distribusi data tetapi tidak cukup untuk menggambarkan sifat distribusi. Untuk dapat menggambarkan karakteristik dari suatu distribusi data, kita menggunakan konsep-konsep lain yang dikenal sebagai kemiringan (skewness) dan keruncingan (kurtosis).

Skewness

Kemiringan (skewness) berarti ketidaksimetrisan. Sebuah distribusi dikatakan simetris apabila nilai-nilainya tersebar merata disekitar nilai rata-ratanya. Sebagai contoh, distribusi data berikut simetris terhadap nilai rata-ratanya, 3.

x	1	2	3	4	5
frek (f)	5	9	12	9	5

Pada contoh gambar berikut, distribusi data tidak simetris. Gambar pertama miring (menjulur) ke arah kiri dan gambar ke-2 miring ke arah kanan.

Pada distribusi data yang simetris, mean, median dan modus bernilai sama.

Beberapa langkah-langkah perhitungan digunakan untuk menyatakan arah dan tingkat kemiringan dari sebaran data. Langkah-langkah tersebut diperkenalkan oleh Pearson.
Koefisien kemiringan(Coefficient of Skewness):
$S_k=\dfrac{3(mean-median)}{standar\ deviasi}$
Interpretasi: Untuk distribusi data yang simetris, Sk = 0. Apabila distribusi data menjulur ke kiri (negatively skewed), Sk bernilai negatif, dan apabila menjulur ke kanan (positively skewed), SK bernilai positif. Kisaran untuk SK antara -3 dan 3.
Ukuran kemiringan yang lain adalah koefisien β₁ (baca ‘beta-satu’):
${\rm populasi}:\ {\beta }_1=\dfrac{{\mu }^2_3}{{\mu }^3_2};\ \ \ \ \ {\rm sampel}:\ b_1=\dfrac{m^2_3}{m^3_2}$
dimana:
$m_3=\dfrac{\Sigma {\left(x_i-x\right)}^3}{n-1};{\rm dan}\ m_2=\dfrac{\Sigma {\left(x_i-x\right)}^2}{n-1}$
Interpretasi:
Distribusi dikatakan simetris apabila nilai b₁ = 0. Skewness positif atau negatif tergantung pada nilai b₁ apakah bernilai positif atau negatif.

Kurtosis

Kurtosis merupakan ukuran untuk mengukur keruncingan distribusi data.

Distribusi pada gambar di atas semuanya simetris terhadap nilai rata-ratanya. Namun bentuk ketiganya tidak sama. Kurva berwarna biru dikenal sebagai mesokurtik (kurva normal), kurva berwarna merah dikenal sebagai leptokurtik (kurva runcing) dan kurva berwarna hijau dikenal sebagai platikurtik (kurva datar).
Kurtosis dihitung dengan menggunakan koefisien Pearson, β₂ (baca ‘beta – dua’).
${\rm populasi}:\ {\beta }_2=\dfrac{{\mu }_4}{{\mu }^2_2};\ \ \ \ \ {\rm sampel}:b_2=\dfrac{m_4}{m^2_2}$
dimana:
$m_4=\dfrac{\Sigma {\left(x_i-x\right)}^4}{n-1};{\rm dan}\ m_2=\dfrac{\Sigma {\left(x_i-x\right)}^2}{n-1}$
Interpretasi:
Distribusi dikatakan:

Mesokurtik (Normal) jika b₂ = 3
Leptokurtik jika b₂ > 3
platikurtik jika b₂ < 3

NB:
Update terbaru Formula dan contoh perhitungan Skewness dan Kurtosis, bisa Anda pelajari di sini

Referensi:

Mario Triola. 2004. Elementary Statistics. 9^th Edition. Pearson Education.
Stephen Bernstein and Ruth Bernstein. 1999. Elements of Statistics I: Descriptive Statistics and Probability. The McGraw-Hill Companies, Inc
Web:
- Indian Agricultural Statistics Research Institute: http://www.iasri.res.in/
- Statistical dispersion: http://en.wikipedia.org/wiki/Statistical_dispersion
Sumber : http://smartstat.wordpress.com/

Dunia Cerita

Tempat dimana anda bisa sharing ilmu, berita, loker, tips-tps sederhana, cerita inspiratif, curhat asmara serta kisah cinta yang tersembunyi

Friday, October 14, 2011