🛠️

Whiz Tools

Build • Create • Innovate

Box Plot Tool for Visualizing Your Dataset Analysis

Hasilkan analisis visual dataset anda menggunakan plot kotak dan misai. Alat ini mengira dan memaparkan ukuran statistik utama termasuk kuartil, median, dan nilai luar.

Pengira Plot Kotak

Pengira Plot Kotak

📚

Dokumentasi

Kalkulator Plot Kotak

Pengenalan

Plot kotak, juga dikenali sebagai plot kotak dan misai, adalah cara standard untuk memaparkan taburan data berdasarkan ringkasan lima nombor: minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan maksimum. Kalkulator ini membolehkan anda menghasilkan plot kotak daripada set data numerik yang diberikan, menyediakan alat yang berkuasa untuk visualisasi dan analisis data.

Cara Menggunakan Kalkulator Ini

  1. Masukkan data anda sebagai senarai nombor yang dipisahkan dengan koma atau ruang dalam medan input.
  2. Kalkulator akan secara automatik mengira statistik plot kotak dan memaparkan hasilnya.
  3. Representasi visual plot kotak akan ditunjukkan di bawah hasil.
  4. Anda boleh menyalin hasil yang dikira menggunakan butang "Salin Hasil".

Formula

Formula utama yang digunakan dalam pengiraan plot kotak adalah:

  1. Median (Q2): Untuk dataset teratur dengan n elemen,

    x_{\frac{n+1}{2}} & \text{jika n ganjil} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{jika n genap} \end{cases} $$
  2. Kuartil Pertama (Q1) dan Kuartil Ketiga (Q3): Q1=Median separuh bawah dataQ1 = \text{Median separuh bawah data} Q3=Median separuh atas dataQ3 = \text{Median separuh atas data}

  3. Julat Antara Kuartil (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. Misai: Misai Bawah=max(min(x),Q11.5IQR)\text{Misai Bawah} = \max({\min(x), Q1 - 1.5 * IQR}) Misai Atas=min(max(x),Q3+1.5IQR)\text{Misai Atas} = \min({\max(x), Q3 + 1.5 * IQR})

  5. Poin luar biasa: Sebarang titik data di bawah Misai Bawah atau di atas Misai Atas.

Pengiraan

Kalkulator melakukan langkah-langkah berikut untuk menghasilkan plot kotak:

  1. Susun data input dalam urutan menaik.
  2. Kira median (Q2):
    • Jika bilangan titik data adalah ganjil, median adalah nilai tengah.
    • Jika bilangan titik data adalah genap, median adalah purata daripada dua nilai tengah.
  3. Kira kuartil pertama (Q1):
    • Ini adalah median separuh bawah data.
    • Jika bilangan titik data adalah ganjil, median tidak termasuk dalam mana-mana separuh.
  4. Kira kuartil ketiga (Q3):
    • Ini adalah median separuh atas data.
    • Jika bilangan titik data adalah ganjil, median tidak termasuk dalam mana-mana separuh.
  5. Kira julat antara kuartil (IQR) = Q3 - Q1.
  6. Tentukan misai:
    • Misai bawah: Titik data terkecil yang lebih besar daripada atau sama dengan Q1 - 1.5 * IQR
    • Misai atas: Titik data terbesar yang kurang daripada atau sama dengan Q3 + 1.5 * IQR
  7. Kenal pasti poin luar biasa: Sebarang titik data di bawah misai bawah atau di atas misai atas.

Penting untuk diperhatikan bahawa terdapat pelbagai kaedah untuk mengira kuartil, terutamanya apabila berhadapan dengan dataset yang mempunyai bilangan elemen yang genap. Kaedah yang diterangkan di atas dikenali sebagai kaedah "eksklusif", tetapi kaedah lain seperti kaedah "inklusif" atau kaedah "median median" juga boleh digunakan. Pemilihan kaedah boleh sedikit mempengaruhi kedudukan Q1 dan Q3, terutamanya untuk dataset kecil.

Tafsiran

Q3 Median Q1 Min Max Komponen Plot Kotak
  • Kotak dalam plot mewakili julat antara kuartil (IQR), dengan bahagian bawah kotak pada Q1 dan bahagian atas pada Q3.
  • Garis di dalam kotak mewakili median (Q2).
  • Misai meluas dari kotak ke nilai minimum dan maksimum, tidak termasuk poin luar biasa.
  • Poin luar biasa dipaparkan sebagai titik individu di luar misai.

Plot kotak memberikan beberapa pandangan tentang data:

  • Kecenderungan pusat: Median menunjukkan nilai pusat dataset.
  • Variabiliti: IQR dan penyebaran keseluruhan dari minimum ke maksimum menunjukkan penyebaran data.
  • Kecenderungan: Jika median tidak terletak di tengah kotak, ia menunjukkan kecenderungan dalam data.
  • Poin luar biasa: Titik di luar misai menonjolkan potensi poin luar biasa atau nilai ekstrem.

Kes Penggunaan

Plot kotak berguna dalam pelbagai bidang, termasuk:

  1. Statistik: Untuk memvisualisasikan taburan dan kecenderungan data. Contohnya, membandingkan skor ujian di pelbagai sekolah atau kelas.

  2. Analisis Data: Untuk mengenal pasti poin luar biasa dan membandingkan taburan. Dalam perniagaan, ia boleh digunakan untuk menganalisis data jualan di pelbagai kawasan atau tempoh masa.

  3. Penyelidikan Saintifik: Untuk membentangkan hasil dan membandingkan kumpulan. Sebagai contoh, membandingkan keberkesanan pelbagai rawatan dalam kajian perubatan.

  4. Kawalan Kualiti: Untuk memantau pembolehubah proses dan mengenal pasti anomali. Dalam pembuatan, ia boleh digunakan untuk menjejaki dimensi produk dan memastikan ia berada dalam julat yang boleh diterima.

  5. Kewangan: Untuk menganalisis pergerakan harga saham dan metrik kewangan lain. Contohnya, membandingkan prestasi pelbagai dana bersama dari semasa ke semasa.

  6. Sains Alam Sekitar: Untuk menganalisis dan membandingkan data alam sekitar, seperti tahap pencemaran atau variasi suhu di pelbagai lokasi atau tempoh masa.

  7. Analisis Sukan: Untuk membandingkan statistik prestasi pemain di seluruh pasukan atau musim.

Alternatif

Walaupun plot kotak adalah alat yang berkuasa untuk visualisasi data, terdapat beberapa alternatif bergantung kepada keperluan analisis yang spesifik:

  1. Histogram: Berguna untuk menunjukkan taburan kekerapan dataset. Mereka memberikan lebih banyak butiran tentang bentuk taburan tetapi mungkin kurang berkesan untuk membandingkan pelbagai dataset.

  2. Plot Violin: Menggabungkan ciri-ciri plot kotak dengan plot ketumpatan kernel, menunjukkan ketumpatan kebarangkalian data pada nilai yang berbeza.

  3. Plot Scatter: Ideal untuk menunjukkan hubungan antara dua pembolehubah, yang tidak dapat dilakukan oleh plot kotak.

  4. Carta Bar: Sesuai untuk membandingkan nilai tunggal di pelbagai kategori.

  5. Graf Garis: Berkesan untuk menunjukkan trend dari masa ke masa, yang tidak dapat ditangkap dengan baik oleh plot kotak.

  6. Peta Haba: Berguna untuk memvisualisasikan dataset kompleks dengan pelbagai pembolehubah.

Pemilihan antara alternatif ini bergantung kepada sifat data dan pandangan spesifik yang ingin disampaikan.

Sejarah

Plot kotak dicipta oleh John Tukey pada tahun 1970 dan pertama kali muncul dalam bukunya "Exploratory Data Analysis" pada tahun 1977. Reka bentuk asal Tukey, yang dipanggil "plot skematik," hanya memaparkan median, kuartil, dan nilai ekstrem.

Perkembangan utama dalam sejarah plot kotak termasuk:

  1. 1978: McGill, Tukey, dan Larsen memperkenalkan plot kotak bertanda, yang menambah selang keyakinan untuk median.

  2. 1980-an: Konsep "poin luar biasa" dalam plot kotak menjadi lebih standard, biasanya ditakrifkan sebagai titik di luar 1.5 kali IQR dari kuartil.

  3. 1990-an-2000-an: Dengan kemunculan grafik komputer, variasi seperti plot kotak lebar berubah dan plot violin telah dibangunkan.

  4. Hari ini: Plot kotak interaktif dan dinamik telah menjadi biasa dalam perisian visualisasi data, membolehkan pengguna meneroka titik data yang mendasari.

Plot kotak telah mengharungi ujian masa kerana kesederhanaan dan keberkesanannya dalam merumuskan dataset yang kompleks. Mereka terus menjadi pilihan utama dalam analisis data di pelbagai bidang.

Petikan Kod

Berikut adalah contoh cara untuk membuat plot kotak dalam pelbagai bahasa pengaturcaraan:

1=QUARTILE(A1:A100,1)  ' Q1
2=MEDIAN(A1:A100)      ' Median
3=QUARTILE(A1:A100,3)  ' Q3
4=MIN(A1:A100)         ' Minimum
5=MAX(A1:A100)         ' Maksimum
6

Rujukan

  1. Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
  2. McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of Box Plots. The American Statistician, 32(1), 12-16.
  3. Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). The box plot: a simple visual method to interpret data. Annals of internal medicine, 110(11), 916-921.
  4. Wickham, H., & Stryjewski, L. (2011). 40 years of boxplots. Laporan teknikal, had.co.nz.
  5. Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). Some Implementations of the Boxplot. The American Statistician, 43(1), 50-54.