Izveidojiet vizuālu analīzi par savu datu kopu, izmantojot kastīšu un ūsas grafiku. Šis rīks aprēķina un parāda galvenos statistikas rādītājus, tostarp kvartilus, mediānu un novirzes.
Kastes grafiks, pazīstams arī kā kaste un ūsas grafiks, ir standartizēts veids, kā attēlot datu sadalījumu, pamatojoties uz piecu skaitļu kopsummu: minimālo, pirmo kvartilu (Q1), mediānu, trešo kvartilu (Q3) un maksimālo. Šis kalkulators ļauj jums ģenerēt kastes grafiku no dotā skaitļu datu kopas, nodrošinot jaudīgu rīku datu vizualizācijai un analīzei.
Galvenās formulas, kas izmantotas kastes grafika aprēķinos, ir:
Mediāna (Q2): Sakārtotai datu kopai ar n elementiem,
x_{\frac{n+1}{2}} & \text{ja n ir nepāra} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ja n ir pāra} \end{cases} $$Pirmais kvartils (Q1) un trešais kvartils (Q3):
Kvartilu intervāls (IQR):
Uzacis:
Novirzes: Jebkuri datu punkti, kas ir zem apakšējā uzacis vai virs augšējā uzacis.
Kalkulators veic šādas darbības, lai ģenerētu kastes grafiku:
Ir svarīgi atzīmēt, ka ir dažādas metodes kvartilu aprēķināšanai, īpaši, strādājot ar datu kopām, kurām ir pāra skaits elementu. Iepriekš aprakstītā metode ir pazīstama kā "ekskluzīvā" metode, taču var tikt izmantotas arī citas metodes, piemēram, "iekļaujošā" metode vai "mediānas mediānu" metode. Metodes izvēle var nedaudz ietekmēt Q1 un Q3 pozīciju, īpaši mazām datu kopām.
Kastes grafiks sniedz vairākas atziņas par datiem:
Kastes grafiki ir noderīgi dažādās jomās, tostarp:
Statistika: Datu sadalījuma un izliekuma vizualizēšanai. Piemēram, salīdzinot testu rezultātus dažādās skolās vai klasēs.
Datu analīze: Lai identificētu novirzes un salīdzinātu sadalījumus. Uzņēmējdarbībā tas var tikt izmantots, lai analizētu pārdošanas datus dažādās reģionos vai laika periodos.
Zinātniskie pētījumi: Lai prezentētu rezultātus un salīdzinātu grupas. Piemēram, salīdzinot dažādu ārstēšanas efektivitāti medicīnas pētījumos.
Kvalitātes kontrole: Lai uzraudzītu procesa mainīgos un identificētu anomālijas. Ražošanā to var izmantot, lai izsekotu produkta izmēriem un nodrošinātu, ka tie atbilst pieņemamām robežām.
Finanšu joma: Lai analizētu akciju cenu kustību un citus finanšu rādītājus. Piemēram, salīdzinot dažādu ieguldījumu fondu sniegumu laika gaitā.
Vides zinātne: Lai analizētu un salīdzinātu vides datus, piemēram, piesārņojuma līmeņus vai temperatūras svārstības dažādās vietās vai laika periodos.
Sporta analītika: Lai salīdzinātu spēlētāju snieguma statistiku starp komandām vai sezonām.
Lai gan kastes grafiki ir jaudīgi rīki datu vizualizācijai, ir vairākas alternatīvas atkarībā no konkrētajām analīzes vajadzībām:
Histogrammas: Noderīgas, lai parādītu datu kopas biežuma sadalījumu. Tās sniedz vairāk informācijas par sadalījuma formu, bet var būt mazāk efektīvas, salīdzinot vairākas datu kopas.
Vijolīšu grafiki: Apvieno kastes grafiku iezīmes ar kodolblīvuma grafikiem, parādot datu varbūtības blīvumu pie dažādām vērtībām.
Izkliedes grafiki: Ideāli piemēroti, lai parādītu divu mainīgo attiecības, ko kastes grafiki nevar darīt.
Stabiņu diagrammas: Piemērotas, lai salīdzinātu vienas vērtības dažādās kategorijās.
Līniju grafiki: Efektīvi, lai parādītu tendences laika gaitā, ko kastes grafiki neuztver labi.
Siltuma kartes: Noderīgas, lai vizualizētu sarežģītas datu kopas ar vairākiem mainīgajiem.
Izvēle starp šīm alternatīvām ir atkarīga no datu rakstura un konkrētajām atziņām, ko vēlaties nodot.
Kastes grafiku izgudroja Džons Tūkijs 1970. gadā, un tas pirmo reizi parādījās viņa grāmatā "Izpētes Datu Analīze" 1977. gadā. Tūkija oriģinālais dizains, ko sauc par "shēmas grafiku", attēloja tikai mediānu, kvartilus un ekstremālās vērtības.
Galvenie kastes grafiku vēstures attīstības notikumi ietver:
Mūsdienas: Interaktīvi un dinamiskie kastes grafiki ir kļuvuši izplatīti datu vizualizācijas programmatūrā, ļaujot lietotājiem izpētīt pamatdatus.
Kastes grafiki ir izturējuši laika pārbaudi, pateicoties to vienkāršībai un efektivitātei sarežģītu datu kopu kopsavilkuma sniegšanā. Tie joprojām ir pamatelements datu analīzē daudzās jomās.
Šeit ir piemēri, kā izveidot kastes grafiku dažādās programmēšanas valodās:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Mediāna
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Minimālais
5=MAX(A1:A100) ' Maksimālais
6
1## Pieņemot, ka 'data' ir jūsu skaitļu vektors
2boxplot(data)
3
1% Pieņemot, ka 'data' ir jūsu skaitļu vektors
2boxplot(data)
3
1// Izmantojot D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* jūsu datu masīvs */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* jūsu datu masīvs */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* jūsu dati */), "Sērija 1", "Kategorija 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Kastes Grafiks", "Kategorija", "Vērtība", dataset, true);
11
Atklājiet vairāk rīku, kas varētu būt noderīgi jūsu darbplūsmai