Vygenerujte vizuálnu analýzu svojho datasetu pomocou box-and-whisker grafu. Tento nástroj vypočíta a zobrazí kľúčové štatistické ukazovatele vrátane kvartilov, mediánu a odľahlých hodnôt.
Krabicový diagram, známy aj ako krabicovo-čiarový diagram, je štandardizovaný spôsob zobrazenia rozdelenia údajov na základe piatich číselných súhrnov: minimum, prvý kvartil (Q1), medián, tretí kvartil (Q3) a maximum. Tento kalkulátor vám umožňuje generovať krabicový diagram z daného súboru číselných údajov, čo poskytuje mocný nástroj na vizualizáciu a analýzu údajov.
Kľúčové vzorce použité pri výpočtoch krabicového diagramu sú:
Medián (Q2): Pre usporiadaný dataset s n prvkami,
x_{\frac{n+1}{2}} & \text{ak je n nepárne} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ak je n párne} \end{cases} $$Prvý kvartil (Q1) a tretí kvartil (Q3):
Interkvartilový rozsah (IQR):
Fúzy:
Odľahlé hodnoty: Akékoľvek údaje nižšie ako dolný fúz alebo vyššie ako horný fúz.
Kalkulátor vykonáva nasledujúce kroky na generovanie krabicového diagramu:
Je dôležité poznamenať, že existujú rôzne metódy na výpočet kvartilov, najmä pri práci s datasetmi, ktoré majú párny počet prvkov. Metóda opísaná vyššie je známa ako „exkluzívna“ metóda, ale môžu sa použiť aj iné metódy, ako je „inkluzívna“ metóda alebo „medián mediánov“. Voľba metódy môže mierne ovplyvniť polohu Q1 a Q3, najmä pre malé dataset.
Krabicový diagram poskytuje niekoľko pohľadov na údaje:
Krabicové diagramy sú užitočné v rôznych oblastiach, vrátane:
Štatistika: Na vizualizáciu rozdelenia a skewness údajov. Napríklad porovnávanie výsledkov testov medzi rôznymi školami alebo triedami.
Analýza údajov: Na identifikáciu odľahlých hodnôt a porovnávanie rozdelení. V podnikaní by sa mohlo použiť na analýzu predajných údajov v rôznych regiónoch alebo časových obdobiach.
Vedecký výskum: Na prezentáciu výsledkov a porovnávanie skupín. Napríklad porovnávanie účinnosti rôznych liečebných postupov v lekárskych štúdiách.
Kvalitná kontrola: Na monitorovanie procesných premenných a identifikáciu anomálií. V výrobe by sa to mohlo použiť na sledovanie rozmerov produktov a zabezpečenie, že spadajú do prijateľných rozmedzí.
Financie: Na analýzu pohybov cien akcií a iných finančných metrík. Napríklad porovnávanie výkonnosti rôznych podielových fondov v priebehu času.
Environmentálna veda: Na analýzu a porovnávanie environmentálnych údajov, ako sú úrovne znečistenia alebo teplotné variácie v rôznych lokalitách alebo časových obdobiach.
Športová analytika: Na porovnávanie štatistík výkonu hráčov medzi tímami alebo sezónami.
Aj keď sú krabicové diagramy mocnými nástrojmi na vizualizáciu údajov, existuje niekoľko alternatív v závislosti od konkrétnych potrieb analýzy:
Histogramy: Užitečné na zobrazenie frekvenčného rozdelenia datasetu. Poskytujú viac detailov o tvare rozdelenia, ale môžu byť menej účinné pri porovnávaní viacerých datasetov.
Violínové diagramy: Kombinujú vlastnosti krabicových diagramov s grafmi hustoty jadra, ukazujúc pravdepodobnostnú hustotu údajov pri rôznych hodnotách.
Bodové grafy: Ideálne na zobrazenie vzťahu medzi dvoma premennými, čo krabicové diagramy nedokážu.
Stĺpcové grafy: Vhodné na porovnávanie jednotlivých hodnôt medzi rôznymi kategóriami.
Čiarové grafy: Efektívne na zobrazenie trendov v priebehu času, čo krabicové diagramy nezachytávajú dobre.
Teplotné mapy: Užitečné na vizualizáciu komplexných datasetov s viacerými premennými.
Voľba medzi týmito alternatívami závisí od povahy údajov a konkrétnych pohľadov, ktoré chce človek vyjadriť.
Krabicový diagram vynaliezol John Tukey v roku 1970 a prvýkrát sa objavil v jeho knihe „Exploratory Data Analysis“ v roku 1977. Pôvodný dizajn Tukeyho, nazývaný „schematický diagram“, zobrazoval iba medián, kvartily a extrémne hodnoty.
Hlavné vývojové udalosti v histórii krabicových diagramov zahŕňajú:
1978: McGill, Tukey a Larsen predstavili notovaný krabicový diagram, ktorý pridáva intervaly spoľahlivosti pre medián.
Súčasnosť: Interaktívne a dynamické krabicové diagramy sa stali bežnými v softvéri na vizualizáciu údajov, čo umožňuje používateľom preskúmať podkladové údaje.
Krabicové diagramy obstáli v skúške času vďaka svojej jednoduchosti a efektívnosti pri zhrnutí komplexných datasetov. Naďalej sú základným nástrojom v analýze údajov v mnohých oblastiach.
Tu sú príklady, ako vytvoriť krabicový diagram v rôznych programovacích jazykoch:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Medián
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Minimum
5=MAX(A1:A100) ' Maximum
6
1## Predpokladáme, že 'data' je váš vektor čísel
2boxplot(data)
3
1% Predpokladáme, že 'data' je váš vektor čísel
2boxplot(data)
3
1// Použitie D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* váš pole údajov */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* váš pole údajov */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* vaše údaje */), "Séria 1", "Kategória 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Krabicový diagram", "Kategória", "Hodnota", dataset, true);
11
Objavte ďalšie nástroje, ktoré by mohli byť užitočné pre vašu pracovnú postupnosť