🛠️

Whiz Tools

Build • Create • Innovate

Box Plot Calculator for Visual Data Analysis and Insights

Hasilkan analisis visual dari dataset Anda menggunakan plot box-and-whisker. Alat ini menghitung dan menampilkan ukuran statistik kunci termasuk kuartil, median, dan pencilan.

Kalkulator Box Plot

Kalkulator Box Plot

📚

Dokumentasi

Kalkulator Box Plot

Pendahuluan

Box plot, juga dikenal sebagai plot kotak dan kumis, adalah cara standar untuk menampilkan distribusi data berdasarkan ringkasan lima angka: minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan maksimum. Kalkulator ini memungkinkan Anda untuk menghasilkan box plot dari sekumpulan data numerik yang diberikan, menyediakan alat yang kuat untuk visualisasi dan analisis data.

Cara Menggunakan Kalkulator Ini

  1. Masukkan data Anda sebagai daftar angka yang dipisahkan oleh koma atau spasi di kolom input.
  2. Kalkulator akan secara otomatis menghitung statistik box plot dan menampilkan hasilnya.
  3. Representasi visual dari box plot akan ditampilkan di bawah hasil.
  4. Anda dapat menyalin hasil yang dihitung menggunakan tombol "Salin Hasil".

Rumus

Rumus kunci yang digunakan dalam perhitungan box plot adalah:

  1. Median (Q2): Untuk dataset yang terurut dengan n elemen,

    x_{\frac{n+1}{2}} & \text{jika n ganjil} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{jika n genap} \end{cases} $$
  2. Kuartil Pertama (Q1) dan Kuartil Ketiga (Q3): Q1=Median dari setengah bawah dataQ1 = \text{Median dari setengah bawah data} Q3=Median dari setengah atas dataQ3 = \text{Median dari setengah atas data}

  3. Rentang Interkuartil (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. Kumis: Kumis Bawah=max(min(x),Q11.5IQR)\text{Kumis Bawah} = \max({\min(x), Q1 - 1.5 * IQR}) Kumis Atas=min(max(x),Q3+1.5IQR)\text{Kumis Atas} = \min({\max(x), Q3 + 1.5 * IQR})

  5. Outlier: Setiap titik data di bawah Kumis Bawah atau di atas Kumis Atas.

Perhitungan

Kalkulator melakukan langkah-langkah berikut untuk menghasilkan box plot:

  1. Urutkan data input dalam urutan menaik.
  2. Hitung median (Q2):
    • Jika jumlah titik data ganjil, median adalah nilai tengah.
    • Jika jumlah titik data genap, median adalah rata-rata dari dua nilai tengah.
  3. Hitung kuartil pertama (Q1):
    • Ini adalah median dari setengah bawah data.
    • Jika jumlah titik data ganjil, median tidak termasuk dalam salah satu setengah.
  4. Hitung kuartil ketiga (Q3):
    • Ini adalah median dari setengah atas data.
    • Jika jumlah titik data ganjil, median tidak termasuk dalam salah satu setengah.
  5. Hitung rentang interkuartil (IQR) = Q3 - Q1.
  6. Tentukan kumis:
    • Kumis bawah: Titik data terkecil yang lebih besar dari atau sama dengan Q1 - 1.5 * IQR
    • Kumis atas: Titik data terbesar yang kurang dari atau sama dengan Q3 + 1.5 * IQR
  7. Identifikasi outlier: Setiap titik data di bawah kumis bawah atau di atas kumis atas.

Penting untuk dicatat bahwa ada berbagai metode untuk menghitung kuartil, terutama saat berhadapan dengan dataset yang memiliki jumlah elemen genap. Metode yang dijelaskan di atas dikenal sebagai metode "eksklusif", tetapi metode lain seperti metode "inklusif" atau metode "median dari median" juga dapat digunakan. Pilihan metode dapat sedikit mempengaruhi posisi Q1 dan Q3, terutama untuk dataset kecil.

Interpretasi

Q3 Median Q1 Min Max Komponen Box Plot
  • Kotak dalam plot mewakili rentang interkuartil (IQR), dengan bagian bawah kotak di Q1 dan bagian atas di Q3.
  • Garis di dalam kotak mewakili median (Q2).
  • Kumis membentang dari kotak ke nilai minimum dan maksimum, tidak termasuk outlier.
  • Outlier dipetakan sebagai titik individu di luar kumis.

Box plot memberikan beberapa wawasan tentang data:

  • Tendensi sentral: Median menunjukkan nilai pusat dari dataset.
  • Variabilitas: IQR dan sebaran keseluruhan dari minimum ke maksimum menunjukkan dispersi data.
  • Skewness: Jika median tidak terpusat di dalam kotak, itu menunjukkan skewness dalam data.
  • Outlier: Titik di luar kumis menunjukkan potensi outlier atau nilai ekstrem.

Kasus Penggunaan

Box plot berguna di berbagai bidang, termasuk:

  1. Statistik: Untuk memvisualisasikan distribusi dan skewness data. Misalnya, membandingkan nilai ujian di berbagai sekolah atau kelas.

  2. Analisis Data: Untuk mengidentifikasi outlier dan membandingkan distribusi. Dalam bisnis, ini dapat digunakan untuk menganalisis data penjualan di berbagai wilayah atau periode waktu.

  3. Penelitian Ilmiah: Untuk menyajikan hasil dan membandingkan kelompok. Misalnya, membandingkan efektivitas berbagai perawatan dalam studi medis.

  4. Pengendalian Kualitas: Untuk memantau variabel proses dan mengidentifikasi anomali. Dalam manufaktur, ini dapat digunakan untuk melacak dimensi produk dan memastikan bahwa mereka berada dalam rentang yang dapat diterima.

  5. Keuangan: Untuk menganalisis pergerakan harga saham dan metrik keuangan lainnya. Misalnya, membandingkan kinerja berbagai reksa dana dari waktu ke waktu.

  6. Ilmu Lingkungan: Untuk menganalisis dan membandingkan data lingkungan, seperti tingkat polusi atau variasi suhu di berbagai lokasi atau periode waktu.

  7. Analitik Olahraga: Untuk membandingkan statistik kinerja pemain di berbagai tim atau musim.

Alternatif

Meskipun box plot adalah alat yang kuat untuk visualisasi data, ada beberapa alternatif tergantung pada kebutuhan spesifik analisis:

  1. Histogram: Berguna untuk menunjukkan distribusi frekuensi dari dataset. Mereka memberikan lebih banyak detail tentang bentuk distribusi tetapi mungkin kurang efektif untuk membandingkan beberapa dataset.

  2. Plot Violin: Menggabungkan fitur box plot dengan plot kepadatan kernel, menunjukkan kepadatan probabilitas data pada nilai yang berbeda.

  3. Plot Sebar: Ideal untuk menunjukkan hubungan antara dua variabel, yang tidak dapat dilakukan oleh box plot.

  4. Diagram Batang: Cocok untuk membandingkan nilai tunggal di berbagai kategori.

  5. Grafik Garis: Efektif untuk menunjukkan tren dari waktu ke waktu, yang tidak dapat ditangkap dengan baik oleh box plot.

  6. Heatmap: Berguna untuk memvisualisasikan dataset kompleks dengan beberapa variabel.

Pilihan antara alternatif ini tergantung pada sifat data dan wawasan spesifik yang ingin disampaikan.

Sejarah

Box plot ditemukan oleh John Tukey pada tahun 1970 dan pertama kali muncul dalam bukunya "Exploratory Data Analysis" pada tahun 1977. Desain asli Tukey, yang disebut "plot skematik," hanya menampilkan median, kuartil, dan nilai ekstrem.

Perkembangan kunci dalam sejarah box plot meliputi:

  1. 1978: McGill, Tukey, dan Larsen memperkenalkan box plot notched, yang menambahkan interval kepercayaan untuk median.

  2. 1980-an: Konsep "outlier" dalam box plot menjadi lebih standar, biasanya didefinisikan sebagai titik di luar 1.5 kali IQR dari kuartil.

  3. 1990-an-2000-an: Dengan munculnya grafik komputer, variasi seperti box plot lebar variabel dan plot violin dikembangkan.

  4. Saat ini: Box plot interaktif dan dinamis telah menjadi umum dalam perangkat lunak visualisasi data, memungkinkan pengguna untuk menjelajahi titik data yang mendasarinya.

Box plot telah bertahan dari waktu ke waktu karena kesederhanaan dan efektivitasnya dalam merangkum dataset yang kompleks. Mereka terus menjadi pokok dalam analisis data di berbagai bidang.

Cuplikan Kode

Berikut adalah contoh cara membuat box plot dalam berbagai bahasa pemrograman:

1=QUARTILE(A1:A100,1)  ' Q1
2=MEDIAN(A1:A100)      ' Median
3=QUARTILE(A1:A100,3)  ' Q3
4=MIN(A1:A100)         ' Minimum
5=MAX(A1:A100)         ' Maksimum
6

Referensi

  1. Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
  2. McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of Box Plots. The American Statistician, 32(1), 12-16.
  3. Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). The box plot: a simple visual method to interpret data. Annals of internal medicine, 110(11), 916-921.
  4. Wickham, H., & Stryjewski, L. (2011). 40 years of boxplots. Laporan teknis, had.co.nz.
  5. Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). Some Implementations of the Boxplot. The American Statistician, 43(1), 50-54.