Kihesabu cha Mchoro wa Sanduku na Nyuzi kwa Takwimu
Zalisha uchambuzi wa kuona wa seti yako ya data kwa kutumia mchoro wa sanduku na nyuzi. Chombo hiki kinahesabu na kuonyesha vipimo muhimu vya takwimu ikiwa ni pamoja na quartiles, median, na vitu vya nje.
Kikokotoo cha Sanduku
Kikokotoo cha Sanduku
Hati
Kihesabu cha Sanduku
Utangulizi
Kihesabu cha sanduku, pia kinachojulikana kama kihesabu cha sanduku na nyuzi, ni njia iliyoandaliwa ya kuonyesha usambazaji wa data kulingana na muhtasari wa nambari tano: kiwango cha chini, quartile ya kwanza (Q1), median, quartile ya tatu (Q3), na kiwango cha juu. Kihesabu hiki kinakuruhusu kutengeneza kihesabu cha sanduku kutoka kwa seti fulani ya data za nambari, na kutoa zana yenye nguvu kwa ajili ya uonyeshaji wa data na uchambuzi.
Jinsi ya Kutumia Kihesabu Hiki
- Ingiza data yako kama orodha ya nambari iliyotenganishwa kwa koma au nafasi katika uwanja wa kuingiza.
- Kihesabu kitaweka moja kwa moja takwimu za kihesabu cha sanduku na kuonyesha matokeo.
- Uwakilishi wa picha wa kihesabu cha sanduku utaonyeshwa chini ya matokeo.
- Unaweza kunakili matokeo yaliyohesabiwa kwa kutumia kitufe cha "Nakili Matokeo".
Formula
Formu muhimu zinazotumika katika kihesabu cha sanduku ni:
-
Median (Q2): Kwa seti ya data iliyopangwa ya vipengele n,
x_{\frac{n+1}{2}} & \text{ikiwa n ni odd} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ikiwa n ni hata} \end{cases} $$ -
Quartile ya Kwanza (Q1) na Quartile ya Tatu (Q3):
-
Kiwango cha Kati (IQR):
-
Nyuzi:
-
Vipengele vya nje: Vipengele vyovyote vya data chini ya Nyuzi za Chini au juu ya Nyuzi za Juu.
Hesabu
Kihesabu kinachukua hatua zifuatazo ili kutengeneza kihesabu cha sanduku:
- Panga data ya kuingiza kwa mpangilio wa kuongezeka.
- Hesabu median (Q2):
- Ikiwa idadi ya vipengele vya data ni odd, median ni thamani ya kati.
- Ikiwa idadi ya vipengele vya data ni hata, median ni wastani wa thamani mbili za kati.
- Hesabu quartile ya kwanza (Q1):
- Hii ni median ya nusu ya chini ya data.
- Ikiwa idadi ya vipengele vya data ni odd, median haitajumuishwa katika nusu yoyote.
- Hesabu quartile ya tatu (Q3):
- Hii ni median ya nusu ya juu ya data.
- Ikiwa idadi ya vipengele vya data ni odd, median haitajumuishwa katika nusu yoyote.
- Hesabu kiwango cha kati (IQR) = Q3 - Q1.
- Tambua nyuzi:
- Nyuzi za chini: Thamani ndogo zaidi ya data iliyo kubwa kuliko au sawa na Q1 - 1.5 * IQR
- Nyuzi za juu: Thamani kubwa zaidi ya data iliyo ndogo kuliko au sawa na Q3 + 1.5 * IQR
- Tambua vipengele vya nje: Vipengele vyovyote vya data chini ya nyuzi za chini au juu ya nyuzi za juu.
Ni muhimu kutambua kuwa kuna njia tofauti za kuhesabu quartiles, hasa wakati wa kushughulikia seti za data ambazo zina idadi ya vipengele hata. Njia iliyoelezwa hapo juu inajulikana kama njia ya "kuchukuliwa", lakini njia nyingine kama "kuchukuliwa" au "median ya medians" pia zinaweza kutumika. Chaguo la njia linaweza kuathiri kidogo nafasi ya Q1 na Q3, hasa kwa seti ndogo za data.
Tafsiri
- Sanduku katika kihesabu kinawakilisha kiwango cha kati (IQR), huku chini ya sanduku ikiwa katika Q1 na juu ikiwa katika Q3.
- Mstari ndani ya sanduku unawakilisha median (Q2).
- Nyuzi zinapanuka kutoka kwa sanduku hadi thamani za chini na juu, bila kuzingatia vipengele vya nje.
- Vipengele vya nje vinapangwa kama alama za pekee zaidi ya nyuzi.
Kihesabu cha sanduku kinatoa maarifa kadhaa kuhusu data:
- Uelekeo wa kati: Median inaonyesha thamani ya kati ya seti ya data.
- Mabadiliko: IQR na kuenea kwa jumla kutoka kiwango cha chini hadi kiwango cha juu zinaonyesha usambazaji wa data.
- Uelekeo: Ikiwa median haiwezi kuzingatiwa katikati ya sanduku, inaonyesha uelekeo katika data.
- Vipengele vya nje: Alama zaidi ya nyuzi zinaonyesha vipengele vya nje au thamani za kipekee.
Matumizi
Kihesabu cha sanduku ni muhimu katika maeneo mbalimbali, ikiwa ni pamoja na:
-
Takwimu: Kuonyesha usambazaji na uelekeo wa data. Kwa mfano, kulinganisha alama za mtihani kati ya shule au madarasa tofauti.
-
Uchambuzi wa Data: Kutambua vipengele vya nje na kulinganisha usambazaji. Katika biashara, inaweza kutumika kuchambua data za mauzo kati ya maeneo tofauti au vipindi vya muda.
-
Utafiti wa Kisayansi: Kuonyesha matokeo na kulinganisha makundi. Kwa mfano, kulinganisha ufanisi wa matibabu tofauti katika tafiti za matibabu.
-
Udhibiti wa Ubora: Kuweka rekodi za mabadiliko ya mchakato na kutambua anomali. Katika utengenezaji, inaweza kutumika kufuatilia vipimo vya bidhaa na kuhakikisha vinaangukia ndani ya mipaka inayokubalika.
-
Fedha: Kuchambua mabadiliko ya bei za hisa na viashiria vingine vya kifedha. Kwa mfano, kulinganisha utendaji wa mifuko tofauti ya uwekezaji kwa muda.
-
Sayansi ya Mazingira: Kuchambua na kulinganisha data za mazingira, kama vile viwango vya uchafuzi au mabadiliko ya joto kati ya maeneo tofauti au vipindi vya muda.
-
Uchambuzi wa Michezo: Kulinganisha takwimu za utendaji wa wachezaji kati ya timu au misimu.
Mbadala
Ingawa kihesabu cha sanduku ni zana zenye nguvu za uonyeshaji wa data, kuna mbadala kadhaa kulingana na mahitaji maalum ya uchambuzi:
-
Histogramu: Ni muhimu kwa kuonyesha usambazaji wa mara kwa mara wa seti ya data. Zinatoa maelezo zaidi kuhusu umbo la usambazaji lakini zinaweza kuwa na ufanisi mdogo katika kulinganisha seti nyingi za data.
-
Violin Plots: Vinachanganya vipengele vya kihesabu cha sanduku na viwango vya wingi wa kernel, kuonyesha wingi wa uwezekano wa data katika thamani tofauti.
-
Mchoro wa Kupanua: Ni bora kwa kuonyesha uhusiano kati ya vipengele viwili, ambavyo kihesabu cha sanduku hakiwezi kufanya.
-
Mchoro wa Nguzo: Ni mzuri kwa kulinganisha thamani moja kati ya makundi tofauti.
-
Mchoro wa Mstari: Ni bora kwa kuonyesha mwelekeo wa muda, ambao kihesabu cha sanduku hakiwezi kuonyesha vizuri.
-
Ramani za Joto: Ni muhimu kwa kuonyesha seti za data ngumu zenye vipengele vingi.
Chaguo kati ya mbadala hizi inategemea asili ya data na maarifa maalum ambayo mtu anataka kuwasilisha.
Historia
Kihesabu cha sanduku kiligunduliwa na John Tukey mwaka 1970 na kilionekana kwa mara ya kwanza katika kitabu chake "Exploratory Data Analysis" mwaka 1977. Ubunifu wa awali wa Tukey, ulijulikana kama "mchoro wa kielelezo," ulionyesha tu median, quartiles, na thamani za mwisho.
Maendeleo muhimu katika historia ya kihesabu cha sanduku ni:
-
1978: McGill, Tukey, na Larsen walileta kihesabu cha sanduku kilichonakiliwa, ambacho kinajumuisha viwango vya kujiamini kwa median.
-
1980s: Dhana ya "vipengele vya nje" katika kihesabu cha sanduku ilianza kuwa ya kawaida, kwa kawaida ikifafanuliwa kama alama zaidi ya mara 1.5 IQR kutoka kwa quartiles.
-
1990s-2000s: Pamoja na kuibuka kwa picha za kompyuta, mabadiliko kama vile kihesabu cha sanduku chenye upana tofauti na viwango vya violin vilitengenezwa.
-
Siku hizi: Kihesabu cha sanduku kinachoweza kuingiliana na cha dynamic kimekuwa cha kawaida katika programu za uonyeshaji wa data, kikiruhusu watumiaji kuchunguza vipengele vya data vilivyomo.
Kihesabu cha sanduku kimeweza kudumu kwa muda kutokana na urahisi na ufanisi wake katika kufupisha seti ngumu za data. Bado ni kipengele muhimu katika uchambuzi wa data katika nyanja nyingi.
Mifano ya Kanuni
Hapa kuna mifano ya jinsi ya kuunda kihesabu cha sanduku katika lugha mbalimbali za programu:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Median
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Kiwango cha chini
5=MAX(A1:A100) ' Kiwango cha juu
6
1## Ikiwa 'data' ni vector yako ya nambari
2boxplot(data)
3
1% Ikiwa 'data' ni vector yako ya nambari
2boxplot(data)
3
1// Kutumia D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* orodha yako ya data */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* orodha yako ya data */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* data yako */), "Mfululizo 1", "Kikundi 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Kihesabu cha Sanduku", "Kikundi", "Thamani", dataset, true);
11
Marejeo
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of Box Plots. The American Statistician, 32(1), 12-16.
- Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). The box plot: a simple visual method to interpret data. Annals of internal medicine, 110(11), 916-921.
- Wickham, H., & Stryjewski, L. (2011). 40 years of boxplots. Ripoti ya kiufundi, had.co.nz.
- Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). Some Implementations of the Boxplot. The American Statistician, 43(1), 50-54.
Maoni
Bonyeza toast ya maoni kuanza kutoa maoni kuhusu zana hii
Zana Zinazohusiana
Gundua zana zaidi ambazo zinaweza kuwa na manufaa kwa mtiririko wako wa kazi