Box Plot Tool for Visualizing Your Dataset Analysis
Hasilkan analisis visual dataset anda menggunakan plot kotak dan misai. Alat ini mengira dan memaparkan ukuran statistik utama termasuk kuartil, median, dan nilai luar.
Pengira Plot Kotak
Pengira Plot Kotak
Dokumentasi
Kalkulator Plot Kotak
Pengenalan
Plot kotak, juga dikenali sebagai plot kotak dan misai, adalah cara standard untuk memaparkan taburan data berdasarkan ringkasan lima nombor: minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan maksimum. Kalkulator ini membolehkan anda menghasilkan plot kotak daripada set data numerik yang diberikan, menyediakan alat yang berkuasa untuk visualisasi dan analisis data.
Cara Menggunakan Kalkulator Ini
- Masukkan data anda sebagai senarai nombor yang dipisahkan dengan koma atau ruang dalam medan input.
- Kalkulator akan secara automatik mengira statistik plot kotak dan memaparkan hasilnya.
- Representasi visual plot kotak akan ditunjukkan di bawah hasil.
- Anda boleh menyalin hasil yang dikira menggunakan butang "Salin Hasil".
Formula
Formula utama yang digunakan dalam pengiraan plot kotak adalah:
-
Median (Q2): Untuk dataset teratur dengan n elemen,
x_{\frac{n+1}{2}} & \text{jika n ganjil} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{jika n genap} \end{cases} $$ -
Kuartil Pertama (Q1) dan Kuartil Ketiga (Q3):
-
Julat Antara Kuartil (IQR):
-
Misai:
-
Poin luar biasa: Sebarang titik data di bawah Misai Bawah atau di atas Misai Atas.
Pengiraan
Kalkulator melakukan langkah-langkah berikut untuk menghasilkan plot kotak:
- Susun data input dalam urutan menaik.
- Kira median (Q2):
- Jika bilangan titik data adalah ganjil, median adalah nilai tengah.
- Jika bilangan titik data adalah genap, median adalah purata daripada dua nilai tengah.
- Kira kuartil pertama (Q1):
- Ini adalah median separuh bawah data.
- Jika bilangan titik data adalah ganjil, median tidak termasuk dalam mana-mana separuh.
- Kira kuartil ketiga (Q3):
- Ini adalah median separuh atas data.
- Jika bilangan titik data adalah ganjil, median tidak termasuk dalam mana-mana separuh.
- Kira julat antara kuartil (IQR) = Q3 - Q1.
- Tentukan misai:
- Misai bawah: Titik data terkecil yang lebih besar daripada atau sama dengan Q1 - 1.5 * IQR
- Misai atas: Titik data terbesar yang kurang daripada atau sama dengan Q3 + 1.5 * IQR
- Kenal pasti poin luar biasa: Sebarang titik data di bawah misai bawah atau di atas misai atas.
Penting untuk diperhatikan bahawa terdapat pelbagai kaedah untuk mengira kuartil, terutamanya apabila berhadapan dengan dataset yang mempunyai bilangan elemen yang genap. Kaedah yang diterangkan di atas dikenali sebagai kaedah "eksklusif", tetapi kaedah lain seperti kaedah "inklusif" atau kaedah "median median" juga boleh digunakan. Pemilihan kaedah boleh sedikit mempengaruhi kedudukan Q1 dan Q3, terutamanya untuk dataset kecil.
Tafsiran
- Kotak dalam plot mewakili julat antara kuartil (IQR), dengan bahagian bawah kotak pada Q1 dan bahagian atas pada Q3.
- Garis di dalam kotak mewakili median (Q2).
- Misai meluas dari kotak ke nilai minimum dan maksimum, tidak termasuk poin luar biasa.
- Poin luar biasa dipaparkan sebagai titik individu di luar misai.
Plot kotak memberikan beberapa pandangan tentang data:
- Kecenderungan pusat: Median menunjukkan nilai pusat dataset.
- Variabiliti: IQR dan penyebaran keseluruhan dari minimum ke maksimum menunjukkan penyebaran data.
- Kecenderungan: Jika median tidak terletak di tengah kotak, ia menunjukkan kecenderungan dalam data.
- Poin luar biasa: Titik di luar misai menonjolkan potensi poin luar biasa atau nilai ekstrem.
Kes Penggunaan
Plot kotak berguna dalam pelbagai bidang, termasuk:
-
Statistik: Untuk memvisualisasikan taburan dan kecenderungan data. Contohnya, membandingkan skor ujian di pelbagai sekolah atau kelas.
-
Analisis Data: Untuk mengenal pasti poin luar biasa dan membandingkan taburan. Dalam perniagaan, ia boleh digunakan untuk menganalisis data jualan di pelbagai kawasan atau tempoh masa.
-
Penyelidikan Saintifik: Untuk membentangkan hasil dan membandingkan kumpulan. Sebagai contoh, membandingkan keberkesanan pelbagai rawatan dalam kajian perubatan.
-
Kawalan Kualiti: Untuk memantau pembolehubah proses dan mengenal pasti anomali. Dalam pembuatan, ia boleh digunakan untuk menjejaki dimensi produk dan memastikan ia berada dalam julat yang boleh diterima.
-
Kewangan: Untuk menganalisis pergerakan harga saham dan metrik kewangan lain. Contohnya, membandingkan prestasi pelbagai dana bersama dari semasa ke semasa.
-
Sains Alam Sekitar: Untuk menganalisis dan membandingkan data alam sekitar, seperti tahap pencemaran atau variasi suhu di pelbagai lokasi atau tempoh masa.
-
Analisis Sukan: Untuk membandingkan statistik prestasi pemain di seluruh pasukan atau musim.
Alternatif
Walaupun plot kotak adalah alat yang berkuasa untuk visualisasi data, terdapat beberapa alternatif bergantung kepada keperluan analisis yang spesifik:
-
Histogram: Berguna untuk menunjukkan taburan kekerapan dataset. Mereka memberikan lebih banyak butiran tentang bentuk taburan tetapi mungkin kurang berkesan untuk membandingkan pelbagai dataset.
-
Plot Violin: Menggabungkan ciri-ciri plot kotak dengan plot ketumpatan kernel, menunjukkan ketumpatan kebarangkalian data pada nilai yang berbeza.
-
Plot Scatter: Ideal untuk menunjukkan hubungan antara dua pembolehubah, yang tidak dapat dilakukan oleh plot kotak.
-
Carta Bar: Sesuai untuk membandingkan nilai tunggal di pelbagai kategori.
-
Graf Garis: Berkesan untuk menunjukkan trend dari masa ke masa, yang tidak dapat ditangkap dengan baik oleh plot kotak.
-
Peta Haba: Berguna untuk memvisualisasikan dataset kompleks dengan pelbagai pembolehubah.
Pemilihan antara alternatif ini bergantung kepada sifat data dan pandangan spesifik yang ingin disampaikan.
Sejarah
Plot kotak dicipta oleh John Tukey pada tahun 1970 dan pertama kali muncul dalam bukunya "Exploratory Data Analysis" pada tahun 1977. Reka bentuk asal Tukey, yang dipanggil "plot skematik," hanya memaparkan median, kuartil, dan nilai ekstrem.
Perkembangan utama dalam sejarah plot kotak termasuk:
-
1978: McGill, Tukey, dan Larsen memperkenalkan plot kotak bertanda, yang menambah selang keyakinan untuk median.
-
1980-an: Konsep "poin luar biasa" dalam plot kotak menjadi lebih standard, biasanya ditakrifkan sebagai titik di luar 1.5 kali IQR dari kuartil.
-
1990-an-2000-an: Dengan kemunculan grafik komputer, variasi seperti plot kotak lebar berubah dan plot violin telah dibangunkan.
-
Hari ini: Plot kotak interaktif dan dinamik telah menjadi biasa dalam perisian visualisasi data, membolehkan pengguna meneroka titik data yang mendasari.
Plot kotak telah mengharungi ujian masa kerana kesederhanaan dan keberkesanannya dalam merumuskan dataset yang kompleks. Mereka terus menjadi pilihan utama dalam analisis data di pelbagai bidang.
Petikan Kod
Berikut adalah contoh cara untuk membuat plot kotak dalam pelbagai bahasa pengaturcaraan:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Median
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Minimum
5=MAX(A1:A100) ' Maksimum
6
1## Menganggap 'data' adalah vektor nombor anda
2boxplot(data)
3
1% Menganggap 'data' adalah vektor nombor anda
2boxplot(data)
3
1// Menggunakan D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* array data anda */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* array data anda */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* data anda */), "Siri 1", "Kategori 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Plot Kotak", "Kategori", "Nilai", dataset, true);
11
Rujukan
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of Box Plots. The American Statistician, 32(1), 12-16.
- Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). The box plot: a simple visual method to interpret data. Annals of internal medicine, 110(11), 916-921.
- Wickham, H., & Stryjewski, L. (2011). 40 years of boxplots. Laporan teknikal, had.co.nz.
- Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). Some Implementations of the Boxplot. The American Statistician, 43(1), 50-54.
Maklum Balas
Klik toast maklum balas untuk mula memberi maklum balas tentang alat ini
Alat Berkaitan
Temui lebih banyak alat yang mungkin berguna untuk aliran kerja anda