Zalisha uchambuzi wa kuona wa seti yako ya data kwa kutumia mchoro wa sanduku na nyuzi. Chombo hiki kinahesabu na kuonyesha vipimo muhimu vya takwimu ikiwa ni pamoja na quartiles, median, na vitu vya nje.
Kihesabu cha sanduku, pia kinachojulikana kama kihesabu cha sanduku na nyuzi, ni njia iliyoandaliwa ya kuonyesha usambazaji wa data kulingana na muhtasari wa nambari tano: kiwango cha chini, quartile ya kwanza (Q1), median, quartile ya tatu (Q3), na kiwango cha juu. Kihesabu hiki kinakuruhusu kutengeneza kihesabu cha sanduku kutoka kwa seti fulani ya data za nambari, na kutoa zana yenye nguvu kwa ajili ya uonyeshaji wa data na uchambuzi.
Formu muhimu zinazotumika katika kihesabu cha sanduku ni:
Median (Q2): Kwa seti ya data iliyopangwa ya vipengele n,
x_{\frac{n+1}{2}} & \text{ikiwa n ni odd} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ikiwa n ni hata} \end{cases} $$Quartile ya Kwanza (Q1) na Quartile ya Tatu (Q3):
Kiwango cha Kati (IQR):
Nyuzi:
Vipengele vya nje: Vipengele vyovyote vya data chini ya Nyuzi za Chini au juu ya Nyuzi za Juu.
Kihesabu kinachukua hatua zifuatazo ili kutengeneza kihesabu cha sanduku:
Ni muhimu kutambua kuwa kuna njia tofauti za kuhesabu quartiles, hasa wakati wa kushughulikia seti za data ambazo zina idadi ya vipengele hata. Njia iliyoelezwa hapo juu inajulikana kama njia ya "kuchukuliwa", lakini njia nyingine kama "kuchukuliwa" au "median ya medians" pia zinaweza kutumika. Chaguo la njia linaweza kuathiri kidogo nafasi ya Q1 na Q3, hasa kwa seti ndogo za data.
Kihesabu cha sanduku kinatoa maarifa kadhaa kuhusu data:
Kihesabu cha sanduku ni muhimu katika maeneo mbalimbali, ikiwa ni pamoja na:
Takwimu: Kuonyesha usambazaji na uelekeo wa data. Kwa mfano, kulinganisha alama za mtihani kati ya shule au madarasa tofauti.
Uchambuzi wa Data: Kutambua vipengele vya nje na kulinganisha usambazaji. Katika biashara, inaweza kutumika kuchambua data za mauzo kati ya maeneo tofauti au vipindi vya muda.
Utafiti wa Kisayansi: Kuonyesha matokeo na kulinganisha makundi. Kwa mfano, kulinganisha ufanisi wa matibabu tofauti katika tafiti za matibabu.
Udhibiti wa Ubora: Kuweka rekodi za mabadiliko ya mchakato na kutambua anomali. Katika utengenezaji, inaweza kutumika kufuatilia vipimo vya bidhaa na kuhakikisha vinaangukia ndani ya mipaka inayokubalika.
Fedha: Kuchambua mabadiliko ya bei za hisa na viashiria vingine vya kifedha. Kwa mfano, kulinganisha utendaji wa mifuko tofauti ya uwekezaji kwa muda.
Sayansi ya Mazingira: Kuchambua na kulinganisha data za mazingira, kama vile viwango vya uchafuzi au mabadiliko ya joto kati ya maeneo tofauti au vipindi vya muda.
Uchambuzi wa Michezo: Kulinganisha takwimu za utendaji wa wachezaji kati ya timu au misimu.
Ingawa kihesabu cha sanduku ni zana zenye nguvu za uonyeshaji wa data, kuna mbadala kadhaa kulingana na mahitaji maalum ya uchambuzi:
Histogramu: Ni muhimu kwa kuonyesha usambazaji wa mara kwa mara wa seti ya data. Zinatoa maelezo zaidi kuhusu umbo la usambazaji lakini zinaweza kuwa na ufanisi mdogo katika kulinganisha seti nyingi za data.
Violin Plots: Vinachanganya vipengele vya kihesabu cha sanduku na viwango vya wingi wa kernel, kuonyesha wingi wa uwezekano wa data katika thamani tofauti.
Mchoro wa Kupanua: Ni bora kwa kuonyesha uhusiano kati ya vipengele viwili, ambavyo kihesabu cha sanduku hakiwezi kufanya.
Mchoro wa Nguzo: Ni mzuri kwa kulinganisha thamani moja kati ya makundi tofauti.
Mchoro wa Mstari: Ni bora kwa kuonyesha mwelekeo wa muda, ambao kihesabu cha sanduku hakiwezi kuonyesha vizuri.
Ramani za Joto: Ni muhimu kwa kuonyesha seti za data ngumu zenye vipengele vingi.
Chaguo kati ya mbadala hizi inategemea asili ya data na maarifa maalum ambayo mtu anataka kuwasilisha.
Kihesabu cha sanduku kiligunduliwa na John Tukey mwaka 1970 na kilionekana kwa mara ya kwanza katika kitabu chake "Exploratory Data Analysis" mwaka 1977. Ubunifu wa awali wa Tukey, ulijulikana kama "mchoro wa kielelezo," ulionyesha tu median, quartiles, na thamani za mwisho.
Maendeleo muhimu katika historia ya kihesabu cha sanduku ni:
1978: McGill, Tukey, na Larsen walileta kihesabu cha sanduku kilichonakiliwa, ambacho kinajumuisha viwango vya kujiamini kwa median.
1980s: Dhana ya "vipengele vya nje" katika kihesabu cha sanduku ilianza kuwa ya kawaida, kwa kawaida ikifafanuliwa kama alama zaidi ya mara 1.5 IQR kutoka kwa quartiles.
1990s-2000s: Pamoja na kuibuka kwa picha za kompyuta, mabadiliko kama vile kihesabu cha sanduku chenye upana tofauti na viwango vya violin vilitengenezwa.
Siku hizi: Kihesabu cha sanduku kinachoweza kuingiliana na cha dynamic kimekuwa cha kawaida katika programu za uonyeshaji wa data, kikiruhusu watumiaji kuchunguza vipengele vya data vilivyomo.
Kihesabu cha sanduku kimeweza kudumu kwa muda kutokana na urahisi na ufanisi wake katika kufupisha seti ngumu za data. Bado ni kipengele muhimu katika uchambuzi wa data katika nyanja nyingi.
Hapa kuna mifano ya jinsi ya kuunda kihesabu cha sanduku katika lugha mbalimbali za programu:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Median
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Kiwango cha chini
5=MAX(A1:A100) ' Kiwango cha juu
6
1## Ikiwa 'data' ni vector yako ya nambari
2boxplot(data)
3
1% Ikiwa 'data' ni vector yako ya nambari
2boxplot(data)
3
1// Kutumia D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* orodha yako ya data */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* orodha yako ya data */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* data yako */), "Mfululizo 1", "Kikundi 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Kihesabu cha Sanduku", "Kikundi", "Thamani", dataset, true);
11
Gundua zana zaidi ambazo zinaweza kuwa na manufaa kwa mtiririko wako wa kazi