Generirajte vizualnu analizu vašeg skupa podataka koristeći kutni dijagram. Ovaj alat izračunava i prikazuje ključne statističke mjere uključujući kvartile, medijan i odstupanja.
Box plot, poznat i kao box-and-whisker plot, je standardizovani način prikazivanja raspodele podataka na osnovu pet brojeva: minimum, prvi kvartil (Q1), medijan, treći kvartil (Q3) i maksimum. Ovaj kalkulator vam omogućava da generišete box plot iz datog skupa numeričkih podataka, pružajući moćan alat za vizualizaciju i analizu podataka.
Ključne formule korišćene u izračunavanju box plota su:
Medijan (Q2): Za sortirani skup podataka od n elemenata,
x_{\frac{n+1}{2}} & \text{ako je n neparan} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ako je n paran} \end{cases} $$Prvi kvartil (Q1) i treći kvartil (Q3):
Interkvartilni opseg (IQR):
Brkovi:
Ekstremne vrednosti: Bilo koje tačke podataka ispod donjeg brka ili iznad gornjeg brka.
Kalkulator izvršava sledeće korake za generisanje box plota:
Važno je napomenuti da postoje različite metode za izračunavanje kvartila, posebno kada se radi o skupovima podataka koji imaju paran broj elemenata. Metoda opisana iznad poznata je kao "ekskluzivna" metoda, ali se mogu koristiti i druge metode poput "inkluzivne" metode ili "medijane medijana". Izbor metode može blago uticati na poziciju Q1 i Q3, posebno za male skupove podataka.
Box plot pruža nekoliko uvida o podacima:
Box plotovi su korisni u različitim oblastima, uključujući:
Statistika: Za vizualizaciju raspodele i asimetričnosti podataka. Na primer, upoređivanje rezultata testova između različitih škola ili razreda.
Analiza podataka: Za identifikaciju ekstremnih vrednosti i upoređivanje raspodela. U poslovanju, to bi moglo biti korišćeno za analizu podataka o prodaji u različitim regionima ili vremenskim periodima.
Naučna istraživanja: Za predstavljanje rezultata i upoređivanje grupa. Na primer, upoređivanje efikasnosti različitih tretmana u medicinskim studijama.
Kontrola kvaliteta: Za praćenje procesnih varijabli i identifikaciju anomalija. U proizvodnji, to bi moglo biti korišćeno za praćenje dimenzija proizvoda i osiguranje da se nalaze unutar prihvatljivih granica.
Finansije: Za analizu kretanja cena akcija i drugih finansijskih metrika. Na primer, upoređivanje performansi različitih uzajamnih fondova tokom vremena.
Ekološke nauke: Za analizu i upoređivanje ekoloških podataka, kao što su nivoi zagađenja ili varijacije temperature u različitim lokacijama ili vremenskim periodima.
Analitika sporta: Za upoređivanje statistike performansi igrača između timova ili sezona.
Iako su box plotovi moćni alati za vizualizaciju podataka, postoje nekoliko alternativa u zavisnosti od specifičnih potreba analize:
Histogrami: Korisni za prikazivanje raspodele frekvencija skupa podataka. Pružaju više detalja o obliku raspodele, ali mogu biti manje efikasni za upoređivanje više skupova podataka.
Violin plotovi: Kombinuju karakteristike box plotova sa kernel gustinskim plotovima, prikazujući verovatnoću gustine podataka na različitim vrednostima.
Tačkasti grafici: Idealni za prikazivanje odnosa između dve varijable, što box plotovi ne mogu učiniti.
Stubasti grafikoni: Pogodni za upoređivanje pojedinačnih vrednosti između različitih kategorija.
Linijski grafikoni: Efikasni za prikazivanje trendova tokom vremena, što box plotovi ne hvataju dobro.
Heatmap-ovi: Korisni za vizualizaciju složenih skupova podataka sa više varijabli.
Izbor između ovih alternativa zavisi od prirode podataka i specifičnih uvida koje želite da prenesete.
Box plot je izumio John Tukey 1970. godine i prvi put se pojavio u njegovoj knjizi "Exploratory Data Analysis" 1977. godine. Tukeyjev originalni dizajn, nazvan "schematic plot", prikazivao je samo medijan, kvartile i ekstremne vrednosti.
Ključni razvoj u istoriji box plotova uključuje:
1978: McGill, Tukey i Larsen su uveli notirani box plot, koji dodaje intervale poverenja za medijan.
1980-e: Koncept "ekstremnih vrednosti" u box plotovima postao je standardizovan, obično definisan kao tačke izvan 1.5 puta IQR od kvartila.
1990-e-2000-e: Sa pojavom računarskih grafika, razvijene su varijacije poput box plotova promenljive širine i violin plotova.
Danas: Interaktivni i dinamični box plotovi postali su uobičajeni u softveru za vizualizaciju podataka, omogućavajući korisnicima da istražuju osnovne tačke podataka.
Box plotovi su izdržali test vremena zbog svoje jednostavnosti i efikasnosti u sumiranju složenih skupova podataka. Oni i dalje ostaju osnovni alat u analizi podataka u mnogim oblastima.
Evo primera kako kreirati box plot u različitim programskim jezicima:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Medijan
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Minimum
5=MAX(A1:A100) ' Maksimum
6
1## Pretpostavljajući da je 'data' vaš vektor brojeva
2boxplot(data)
3
1% Pretpostavljajući da je 'data' vaš vektor brojeva
2boxplot(data)
3
1// Koristeći D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* vaš niz podataka */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* vaš niz podataka */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* vaši podaci */), "Serija 1", "Kategorija 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Box Plot", "Kategorija", "Vrednost", dataset, true);
11
Otkrijte više alata koji bi mogli biti korisni za vaš radni proces