Hasilkan analisis visual dari dataset Anda menggunakan plot box-and-whisker. Alat ini menghitung dan menampilkan ukuran statistik kunci termasuk kuartil, median, dan pencilan.
Box plot, juga dikenal sebagai plot kotak dan kumis, adalah cara standar untuk menampilkan distribusi data berdasarkan ringkasan lima angka: minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan maksimum. Kalkulator ini memungkinkan Anda untuk menghasilkan box plot dari sekumpulan data numerik yang diberikan, menyediakan alat yang kuat untuk visualisasi dan analisis data.
Rumus kunci yang digunakan dalam perhitungan box plot adalah:
Median (Q2): Untuk dataset yang terurut dengan n elemen,
x_{\frac{n+1}{2}} & \text{jika n ganjil} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{jika n genap} \end{cases} $$Kuartil Pertama (Q1) dan Kuartil Ketiga (Q3):
Rentang Interkuartil (IQR):
Kumis:
Outlier: Setiap titik data di bawah Kumis Bawah atau di atas Kumis Atas.
Kalkulator melakukan langkah-langkah berikut untuk menghasilkan box plot:
Penting untuk dicatat bahwa ada berbagai metode untuk menghitung kuartil, terutama saat berhadapan dengan dataset yang memiliki jumlah elemen genap. Metode yang dijelaskan di atas dikenal sebagai metode "eksklusif", tetapi metode lain seperti metode "inklusif" atau metode "median dari median" juga dapat digunakan. Pilihan metode dapat sedikit mempengaruhi posisi Q1 dan Q3, terutama untuk dataset kecil.
Box plot memberikan beberapa wawasan tentang data:
Box plot berguna di berbagai bidang, termasuk:
Statistik: Untuk memvisualisasikan distribusi dan skewness data. Misalnya, membandingkan nilai ujian di berbagai sekolah atau kelas.
Analisis Data: Untuk mengidentifikasi outlier dan membandingkan distribusi. Dalam bisnis, ini dapat digunakan untuk menganalisis data penjualan di berbagai wilayah atau periode waktu.
Penelitian Ilmiah: Untuk menyajikan hasil dan membandingkan kelompok. Misalnya, membandingkan efektivitas berbagai perawatan dalam studi medis.
Pengendalian Kualitas: Untuk memantau variabel proses dan mengidentifikasi anomali. Dalam manufaktur, ini dapat digunakan untuk melacak dimensi produk dan memastikan bahwa mereka berada dalam rentang yang dapat diterima.
Keuangan: Untuk menganalisis pergerakan harga saham dan metrik keuangan lainnya. Misalnya, membandingkan kinerja berbagai reksa dana dari waktu ke waktu.
Ilmu Lingkungan: Untuk menganalisis dan membandingkan data lingkungan, seperti tingkat polusi atau variasi suhu di berbagai lokasi atau periode waktu.
Analitik Olahraga: Untuk membandingkan statistik kinerja pemain di berbagai tim atau musim.
Meskipun box plot adalah alat yang kuat untuk visualisasi data, ada beberapa alternatif tergantung pada kebutuhan spesifik analisis:
Histogram: Berguna untuk menunjukkan distribusi frekuensi dari dataset. Mereka memberikan lebih banyak detail tentang bentuk distribusi tetapi mungkin kurang efektif untuk membandingkan beberapa dataset.
Plot Violin: Menggabungkan fitur box plot dengan plot kepadatan kernel, menunjukkan kepadatan probabilitas data pada nilai yang berbeda.
Plot Sebar: Ideal untuk menunjukkan hubungan antara dua variabel, yang tidak dapat dilakukan oleh box plot.
Diagram Batang: Cocok untuk membandingkan nilai tunggal di berbagai kategori.
Grafik Garis: Efektif untuk menunjukkan tren dari waktu ke waktu, yang tidak dapat ditangkap dengan baik oleh box plot.
Heatmap: Berguna untuk memvisualisasikan dataset kompleks dengan beberapa variabel.
Pilihan antara alternatif ini tergantung pada sifat data dan wawasan spesifik yang ingin disampaikan.
Box plot ditemukan oleh John Tukey pada tahun 1970 dan pertama kali muncul dalam bukunya "Exploratory Data Analysis" pada tahun 1977. Desain asli Tukey, yang disebut "plot skematik," hanya menampilkan median, kuartil, dan nilai ekstrem.
Perkembangan kunci dalam sejarah box plot meliputi:
1978: McGill, Tukey, dan Larsen memperkenalkan box plot notched, yang menambahkan interval kepercayaan untuk median.
1980-an: Konsep "outlier" dalam box plot menjadi lebih standar, biasanya didefinisikan sebagai titik di luar 1.5 kali IQR dari kuartil.
1990-an-2000-an: Dengan munculnya grafik komputer, variasi seperti box plot lebar variabel dan plot violin dikembangkan.
Saat ini: Box plot interaktif dan dinamis telah menjadi umum dalam perangkat lunak visualisasi data, memungkinkan pengguna untuk menjelajahi titik data yang mendasarinya.
Box plot telah bertahan dari waktu ke waktu karena kesederhanaan dan efektivitasnya dalam merangkum dataset yang kompleks. Mereka terus menjadi pokok dalam analisis data di berbagai bidang.
Berikut adalah contoh cara membuat box plot dalam berbagai bahasa pemrograman:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Median
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Minimum
5=MAX(A1:A100) ' Maksimum
6
1## Mengasumsikan 'data' adalah vektor angka Anda
2boxplot(data)
3
1% Mengasumsikan 'data' adalah vektor angka Anda
2boxplot(data)
3
1// Menggunakan D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* array data Anda */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* array data Anda */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* data Anda */), "Seri 1", "Kategori 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Box Plot", "Kategori", "Nilai", dataset, true);
11
Temukan lebih banyak alat yang mungkin berguna untuk alur kerja Anda