Analisis data eksploratif (Exploratory Data Analysis – EDA)
merupakan metode eksplorasi data dengan menggunakan teknik aritmatika sederhana dan teknik grafis dalam meringkas data pengamatan.di dalam statistika dasar Analisis Eksplorasi data juga bisa di artikan sebagai cara untuk mengenali pola data nelalui diagram atau grafik, mendeteksi adanya nilai ekstrim agar kita dalam mengexplorasi data tidak terpengaruh efek ekstrem, dengan menggunakan diagram pencar dan membuat garis persamaan untuk menentukan pola hubungan antar variabel serta melakukan smoothing data. Penyajian data dalam bentuk tabel kontingensi dan melakukan analisis hubungan dari variabel yang bersifat kategori.
kali ini kita akan membahas tentang explorasi data menggunakan diagram batang-daun dan diagram kotak-garis .
diagram batang daun (steam and leaf diagram) merupakan diagram yang sangat mudah di buat dan mudah pula untuk membacanya. dan cara membuat diagram batang daun adalah sebagai berikut:
1.telitilah data yang hendak di olah, carilah data terkecil dan data terbesar
2. pisahkan masing-masing data ke dalam batang(yang berada di dalam batang adalah angka pertama dari batang)dan kedalam daun(daun hanya angka terakhir dari data)
catatan"batang bisa lebih dari dua angka namun daun hanya terdiri dari satu angka
contoh kita membuat diagram batang daun menggunakan data berikut
99.,91,98,111,109,104,91,107,111,96
batang daun
9 1,1,6,8,9
10 4,7,9
11 1,1
Via diagram batang-daun terlihat bahwa:
Lokasi pemusatan dari sebaran data dapat diketahui. Bentuk (shape) sebaran data dapat diketahui,
apakah simetri ataukah tidak simetri (melenceng/menjulur/skewed). Tentu saja dalam hal ini tidak tepat benar kesimetri-annya. Apakah sebaran memiliki satu puncak ataukah dua puncak?
Apakah ada data yang berperilaku“menyimpang”?
Kelemahan Diagram Batang-Daun:
Sulit menyusun diagram ini pada kasus data sangat menyebar. Misalnya, data berkisar antara 0.5 dengan 1122.
Sebaliknya, kalau kisarannya kecil,penggunaan diagram ini menjadi kurang tepat. Misalnya, data berkisar antara 42 dengan 45.
Quartile (kuartil) arti harafiahnya : "perempatan"
sehingga,Median disebut kuartil kedua (Q2) karena merupakan dua kuartil atau dua perempatan atau ± 50 % dari semua pengamatan nilainya lebih kecil dari median tersebut.
Q1: ± 25 % dari semua data berada dibawahnya.
Q3 : ± 75 % dari semua data berada dibawahnya.
untuk lebih jelasnya kalian bisa mendownload free materinya disini
No comments:
Post a Comment