Generuj wizualną analizę swojego zestawu danych za pomocą wykresu skrzynkowego. To narzędzie oblicza i wyświetla kluczowe miary statystyczne, w tym kwartyle, medianę i wartości odstające.
Wykres skrzynkowy, znany również jako wykres skrzynkowo-wąsowy, to ustandaryzowany sposób przedstawiania rozkładu danych na podstawie pięciocyfrowego podsumowania: minimum, pierwszy kwartyl (Q1), mediana, trzeci kwartyl (Q3) i maksimum. Ten kalkulator umożliwia generowanie wykresu skrzynkowego na podstawie podanego zestawu danych liczbowych, co stanowi potężne narzędzie do wizualizacji i analizy danych.
Kluczowe wzory używane w obliczeniach wykresu skrzynkowego to:
Mediana (Q2): Dla uporządkowanego zbioru danych o n elementach,
x_{\frac{n+1}{2}} & \text{jeśli n jest nieparzyste} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{jeśli n jest parzyste} \end{cases} $$Pierwszy kwartyl (Q1) i trzeci kwartyl (Q3):
Zakres międzykwartylowy (IQR):
Wąsy:
Wartości odstające: Jakiekolwiek punkty danych poniżej dolnego wąsa lub powyżej górnego wąsa.
Kalkulator wykonuje następujące kroki, aby wygenerować wykres skrzynkowy:
Ważne jest, aby zauważyć, że istnieją różne metody obliczania kwartylów, szczególnie w przypadku zbiorów danych o parzystej liczbie elementów. Opisana powyżej metoda jest znana jako metoda "ekskluzywna", ale można również stosować inne metody, takie jak metoda "inkluzji" lub metoda "mediany median". Wybór metody może nieznacznie wpłynąć na położenie Q1 i Q3, szczególnie w przypadku małych zbiorów danych.
Wykres skrzynkowy dostarcza wielu informacji na temat danych:
Wykresy skrzynkowe są przydatne w różnych dziedzinach, w tym:
Statystyka: Aby wizualizować rozkład i asymetrię danych. Na przykład, porównując wyniki testów w różnych szkołach lub klasach.
Analiza danych: Aby zidentyfikować wartości odstające i porównać rozkłady. W biznesie może być używany do analizy danych sprzedażowych w różnych regionach lub okresach czasu.
Badania naukowe: Aby przedstawić wyniki i porównać grupy. Na przykład, porównując skuteczność różnych terapii w badaniach medycznych.
Kontrola jakości: Aby monitorować zmienne procesowe i identyfikować anomalie. W produkcji może być używany do śledzenia wymiarów produktów i zapewnienia, że mieszczą się w akceptowalnych zakresach.
Finanse: Aby analizować ruchy cen akcji i inne wskaźniki finansowe. Na przykład, porównując wyniki różnych funduszy inwestycyjnych w czasie.
Nauki o środowisku: Aby analizować i porównywać dane środowiskowe, takie jak poziomy zanieczyszczenia lub wahania temperatury w różnych lokalizacjach lub okresach czasu.
Analiza sportowa: Aby porównywać statystyki wydajności graczy w różnych drużynach lub sezonach.
Chociaż wykresy skrzynkowe są potężnymi narzędziami do wizualizacji danych, istnieje kilka alternatyw w zależności od specyficznych potrzeb analizy:
Histogramy: Przydatne do pokazania rozkładu częstotliwości zbioru danych. Zapewniają więcej szczegółów na temat kształtu rozkładu, ale mogą być mniej skuteczne w porównywaniu wielu zbiorów danych.
Wykresy skrzynkowo-fioletowe: Łączą cechy wykresów skrzynkowych z wykresami gęstości jądra, pokazując prawdopodobieństwo gęstości danych w różnych wartościach.
Wykresy punktowe: Idealne do pokazywania zależności między dwiema zmiennymi, czego wykresy skrzynkowe nie mogą zrobić.
Wykresy słupkowe: Odpowiednie do porównywania pojedynczych wartości w różnych kategoriach.
Wykresy liniowe: Skuteczne w pokazywaniu trendów w czasie, czego wykresy skrzynkowe nie uchwycą dobrze.
Mapy cieplne: Przydatne do wizualizacji złożonych zbiorów danych z wieloma zmiennymi.
Wybór między tymi alternatywami zależy od charakteru danych i specyficznych spostrzeżeń, które chce się przekazać.
Wykres skrzynkowy został wynaleziony przez Johna Tukeya w 1970 roku i po raz pierwszy pojawił się w jego książce "Exploratory Data Analysis" w 1977 roku. Oryginalny projekt Tukeya, zwany "schematycznym wykresem", przedstawiał tylko medianę, kwartyle i wartości ekstremalne.
Kluczowe wydarzenia w historii wykresów skrzynkowych obejmują:
1978: McGill, Tukey i Larsen wprowadzili wykres skrzynkowy z wycięciem, który dodaje przedziały ufności dla mediany.
Lata 80.: Koncepcja "wartości odstających" w wykresach skrzynkowych stała się bardziej ustandaryzowana, zazwyczaj definiowana jako punkty poza 1.5 razy IQR od kwartylów.
Lata 90.-2000: Wraz z pojawieniem się grafiki komputerowej, opracowano warianty takie jak wykresy skrzynkowe o zmiennej szerokości i wykresy skrzynkowo-fioletowe.
Obecnie: Interaktywne i dynamiczne wykresy skrzynkowe stały się powszechne w oprogramowaniu do wizualizacji danych, umożliwiając użytkownikom eksplorację podstawowych punktów danych.
Wykresy skrzynkowe przetrwały próbę czasu dzięki swojej prostocie i skuteczności w podsumowywaniu złożonych zbiorów danych. Nadal są podstawą w analizie danych w wielu dziedzinach.
Oto przykłady, jak stworzyć wykres skrzynkowy w różnych językach programowania:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Mediana
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Minimum
5=MAX(A1:A100) ' Maksimum
6
1## Zakładając, że 'data' to wektor twoich liczb
2boxplot(data)
3
1% Zakładając, że 'data' to wektor twoich liczb
2boxplot(data)
3
1// Używając D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* twoja tablica danych */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* twoja tablica danych */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* twoje dane */), "Seria 1", "Kategoria 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Wykres Skrzynkowy", "Kategoria", "Wartość", dataset, true);
11
Odkryj więcej narzędzi, które mogą być przydatne dla Twojego przepływu pracy