Hasilkan analisis visual dataset anda menggunakan plot kotak dan misai. Alat ini mengira dan memaparkan ukuran statistik utama termasuk kuartil, median, dan nilai luar.
Plot kotak, juga dikenali sebagai plot kotak dan misai, adalah cara standard untuk memaparkan taburan data berdasarkan ringkasan lima nombor: minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan maksimum. Kalkulator ini membolehkan anda menghasilkan plot kotak daripada set data numerik yang diberikan, menyediakan alat yang berkuasa untuk visualisasi dan analisis data.
Formula utama yang digunakan dalam pengiraan plot kotak adalah:
Median (Q2): Untuk dataset teratur dengan n elemen,
x_{\frac{n+1}{2}} & \text{jika n ganjil} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{jika n genap} \end{cases} $$Kuartil Pertama (Q1) dan Kuartil Ketiga (Q3):
Julat Antara Kuartil (IQR):
Misai:
Poin luar biasa: Sebarang titik data di bawah Misai Bawah atau di atas Misai Atas.
Kalkulator melakukan langkah-langkah berikut untuk menghasilkan plot kotak:
Penting untuk diperhatikan bahawa terdapat pelbagai kaedah untuk mengira kuartil, terutamanya apabila berhadapan dengan dataset yang mempunyai bilangan elemen yang genap. Kaedah yang diterangkan di atas dikenali sebagai kaedah "eksklusif", tetapi kaedah lain seperti kaedah "inklusif" atau kaedah "median median" juga boleh digunakan. Pemilihan kaedah boleh sedikit mempengaruhi kedudukan Q1 dan Q3, terutamanya untuk dataset kecil.
Plot kotak memberikan beberapa pandangan tentang data:
Plot kotak berguna dalam pelbagai bidang, termasuk:
Statistik: Untuk memvisualisasikan taburan dan kecenderungan data. Contohnya, membandingkan skor ujian di pelbagai sekolah atau kelas.
Analisis Data: Untuk mengenal pasti poin luar biasa dan membandingkan taburan. Dalam perniagaan, ia boleh digunakan untuk menganalisis data jualan di pelbagai kawasan atau tempoh masa.
Penyelidikan Saintifik: Untuk membentangkan hasil dan membandingkan kumpulan. Sebagai contoh, membandingkan keberkesanan pelbagai rawatan dalam kajian perubatan.
Kawalan Kualiti: Untuk memantau pembolehubah proses dan mengenal pasti anomali. Dalam pembuatan, ia boleh digunakan untuk menjejaki dimensi produk dan memastikan ia berada dalam julat yang boleh diterima.
Kewangan: Untuk menganalisis pergerakan harga saham dan metrik kewangan lain. Contohnya, membandingkan prestasi pelbagai dana bersama dari semasa ke semasa.
Sains Alam Sekitar: Untuk menganalisis dan membandingkan data alam sekitar, seperti tahap pencemaran atau variasi suhu di pelbagai lokasi atau tempoh masa.
Analisis Sukan: Untuk membandingkan statistik prestasi pemain di seluruh pasukan atau musim.
Walaupun plot kotak adalah alat yang berkuasa untuk visualisasi data, terdapat beberapa alternatif bergantung kepada keperluan analisis yang spesifik:
Histogram: Berguna untuk menunjukkan taburan kekerapan dataset. Mereka memberikan lebih banyak butiran tentang bentuk taburan tetapi mungkin kurang berkesan untuk membandingkan pelbagai dataset.
Plot Violin: Menggabungkan ciri-ciri plot kotak dengan plot ketumpatan kernel, menunjukkan ketumpatan kebarangkalian data pada nilai yang berbeza.
Plot Scatter: Ideal untuk menunjukkan hubungan antara dua pembolehubah, yang tidak dapat dilakukan oleh plot kotak.
Carta Bar: Sesuai untuk membandingkan nilai tunggal di pelbagai kategori.
Graf Garis: Berkesan untuk menunjukkan trend dari masa ke masa, yang tidak dapat ditangkap dengan baik oleh plot kotak.
Peta Haba: Berguna untuk memvisualisasikan dataset kompleks dengan pelbagai pembolehubah.
Pemilihan antara alternatif ini bergantung kepada sifat data dan pandangan spesifik yang ingin disampaikan.
Plot kotak dicipta oleh John Tukey pada tahun 1970 dan pertama kali muncul dalam bukunya "Exploratory Data Analysis" pada tahun 1977. Reka bentuk asal Tukey, yang dipanggil "plot skematik," hanya memaparkan median, kuartil, dan nilai ekstrem.
Perkembangan utama dalam sejarah plot kotak termasuk:
1978: McGill, Tukey, dan Larsen memperkenalkan plot kotak bertanda, yang menambah selang keyakinan untuk median.
1980-an: Konsep "poin luar biasa" dalam plot kotak menjadi lebih standard, biasanya ditakrifkan sebagai titik di luar 1.5 kali IQR dari kuartil.
1990-an-2000-an: Dengan kemunculan grafik komputer, variasi seperti plot kotak lebar berubah dan plot violin telah dibangunkan.
Hari ini: Plot kotak interaktif dan dinamik telah menjadi biasa dalam perisian visualisasi data, membolehkan pengguna meneroka titik data yang mendasari.
Plot kotak telah mengharungi ujian masa kerana kesederhanaan dan keberkesanannya dalam merumuskan dataset yang kompleks. Mereka terus menjadi pilihan utama dalam analisis data di pelbagai bidang.
Berikut adalah contoh cara untuk membuat plot kotak dalam pelbagai bahasa pengaturcaraan:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Median
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Minimum
5=MAX(A1:A100) ' Maksimum
6
1## Menganggap 'data' adalah vektor nombor anda
2boxplot(data)
3
1% Menganggap 'data' adalah vektor nombor anda
2boxplot(data)
3
1// Menggunakan D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* array data anda */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* array data anda */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* data anda */), "Siri 1", "Kategori 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Plot Kotak", "Kategori", "Nilai", dataset, true);
11
Temui lebih banyak alat yang mungkin berguna untuk aliran kerja anda