Kalkulator kutnih dijagrama za analizu podataka
Generišite vizuelnu analizu vašeg skupa podataka koristeći kutni dijagram. Ovaj alat izračunava i prikazuje ključne statističke mere uključujući kvartile, medijanu i odstupanja.
Kalkulator kutijastog dijagrama
Kalkulator kutijastog dijagrama
Dokumentacija
КCalculator за Бок Плот
Увод
Бок плот, познат и као бок и длакасти график, је стандардизован начин приказивања расподеле података на основу пет бројчаних резимеа: минимум, први квартил (Q1), медијана, трећи квартил (Q3) и максимум. Овај калкулатор вам омогућава да генеришете бок плот из датог сета нумеричких података, пружајући моћан алат за визуализацију и анализу података.
Како користити овај калкулатор
- Унесите своје податке као списак бројева одвојених запетама или размацима у улазно поље.
- Калкулатор ће аутоматски израчунати статистику бок плота и приказати резултате.
- Визуелна репрезентација бок плота биће приказана испод резултата.
- Можете копирати израчунате резултате користећи дугме "Копирај резултат".
Формула
Кључне формуле коришћене у израчунавању бок плота су:
-
Медијана (Q2): За уређени скуп података од n елемената,
x_{\frac{n+1}{2}} & \text{ако је n непарно} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ако је n парно} \end{cases} $$ -
Први квартил (Q1) и трећи квартил (Q3):
-
Интерквартилни опсег (IQR):
-
Длаке:
-
Изузеци: Сви подаци испод доње длаке или изнад горње длаке.
Израчунавање
Калкулатор изводи следеће кораке да генерише бок плот:
- Уредите улазне податке у растућем редоследу.
- Израчунајте медијану (Q2):
- Ако је број података непаран, медијана је средња вредност.
- Ако је број података паран, медијана је просек две средње вредности.
- Израчунајте први квартил (Q1):
- Ово је медијана доњег дела података.
- Ако је број података непаран, медијана се не укључује у нижи део.
- Израчунајте трећи квартил (Q3):
- Ово је медијана горњег дела података.
- Ако је број података непаран, медијана се не укључује у нижи део.
- Израчунајте интерквартилни опсег (IQR) = Q3 - Q1.
- Одредите длаке:
- Доња длака: Најмања вредност података већа или једнака Q1 - 1.5 * IQR
- Горња длака: Највећа вредност података мања или једнака Q3 + 1.5 * IQR
- Идентификујте изузетке: Сви подаци испод доње длаке или изнад горње длаке.
Важно је напоменути да постоје различите методе за израчунавање квартилa, посебно када се ради о скупу података који има паран број елемената. Метода описана изнад позната је као "ексклузивна" метода, али се могу користити и друге методе попут "инклузивне" методе или "медијане медијана". Избор методе може мало утицати на позицију Q1 и Q3, посебно за мале скупине података.
Интерпретација
- Кутија у графику представља интерквартилни опсег (IQR), са дном кутије на Q1 и врхом на Q3.
- Линија унутар кутије представља медијану (Q2).
- Длаке се протежу од кутије до минималних и максималних вредности, искључујући изузетке.
- Изузеци су приказани као појединачне тачке изван длака.
Бок плот пружа неколико увида о подацима:
- Централна тенденција: Медијана показује централну вредност скупа података.
- Разноликост: IQR и укупно распростирање од минимума до максимума показују расподелу података.
- Искривљеност: Ако медијана није центрирана унутар кутије, то указује на искривљеност у подацима.
- Изузеци: Тачке изван длака истичу потенцијалне изузетке или екстремне вредности.
Случаеви коришћења
Бок плотови су корисни у различитим областима, укључујући:
-
Статистика: За визуализацију расподеле и искривљености података. На пример, упоређивање резултата тестова у различитим школама или разредима.
-
Анализа података: За идентификацију изузетака и упоређивање расподела. У пословању, могло би се користити за анализу података о продаји у различитим регионима или временским периодима.
-
Научна истраживања: За представљање резултата и упоређивање група. На пример, упоређивање ефикасности различитих третмана у медицинским студијама.
-
Контрола квалитета: За праћење процесних варијабли и идентификацију аномалија. У производњи, могло би се користити за праћење димензија производа и осигуравање да падају у прихватљиве границе.
-
Финансије: За анализу кретања цена акција и других финансијских метрика. На пример, упоређивање перформанси различитих инвестиционих фондова током времена.
-
Екологија: За анализу и упоређивање еколошких података, као што су нивои загађења или температурне варијације у различитим локацијама или временским периодима.
-
Спортска анализа: За упоређивање статистике перформанси играча у различитим тимовима или сезонама.
Алтернативе
Иако су бок плотови моћни алати за визуализацију података, постоји неколико алтернатива у зависности од специфичних потреба анализе:
-
Хистограми: Корисни за приказивање расподеле учесталости скупа података. Пружају више детаља о облику расподеле, али могу бити мање ефикасни за упоређивање више скупова података.
-
Виолин графикони: Комбинују карактеристике бок плотова са графиконима густине језгра, показујући вероватноћну густину података на различитим вредностима.
-
Распоредне табеле: Идеалне за приказивање односа између две променљиве, што бок плотови не могу да ураде.
-
Стубни графикони: Погодни за упоређивање појединачних вредности у различитим категоријама.
-
Линијски графикони: Ефикасни за приказивање трендова током времена, што бок плотови не могу добро да ухвате.
-
Топлотне мапе: Корисне за визуализацију сложених скупова података са више променљивих.
Избор између ових алтернатива зависи од природе података и специфичних увида које желите да пренесете.
Историја
Бок плот је изумео Џон Туки 1970. године и први пут се појавио у његовој књизи "Истраживачка анализа података" 1977. године. Тукијев оригинални дизајн, познат као "схематски графикон", приказивао је само медијану, квартиле и екстремне вредности.
Кључни развоји у историји бок плотова укључују:
-
1978: МекГил, Туки и Ларсен увели су графикон са жлебом, који додаје интервале поверења за медијану.
-
1980-их: Концепт "изузетака" у бок плотовима постао је стандардизован, обично дефинисан као тачке изван 1.5 пута IQR од квартила.
-
1990-их-2000-их: Са појавом компјутерске графике, развијене су варијације попут графикона бок плота променљиве ширине и виолин графикона.
-
Данас: Интерактивни и динамични бок плотови постали су уобичајени у софтверу за визуализацију података, омогућавајући корисницима да истражују основне податке.
Бок плотови су издржали тест времена због своје једноставности и ефикасности у резимирању сложених скупова података. Они и даље остају стандард у анализи података у многим областима.
Кодни фрагменти
Ево примера како да креирате бок плот у различитим програмским језицима:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Медијана
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Минимум
5=MAX(A1:A100) ' Максимум
6
1## Под претпоставком да је 'data' ваш вектор бројева
2boxplot(data)
3
1% Под претпоставком да је 'data' ваш вектор бројева
2boxplot(data)
3
1// Користећи D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* ваш низ података */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* ваш низ података */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* ваши подаци */), "Серија 1", "Категорија 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Бок Плот", "Категорија", "Вредност", dataset, true);
11
Референце
- Туки, Ј. В. (1977). Истраживачка анализа података. Аддисон-Весли.
- МекГил, Р., Туки, Ј. В., & Ларсен, В. А. (1978). Варијације бок плотова. Амерички статистичар, 32(1), 12-16.
- Вилијамсон, Д. Ф., Паркер, Р. А., & Кендрич, Ј. С. (1989). Бок плот: једноставна визуелна метода за интерпретацију података. Анали интерне медицине, 110(11), 916-921.
- Викам, Х., & Стријејевски, Л. (2011). 40 година бок плотова. Технички извештај, had.co.nz.
- Фригге, М., Хоглин, Д. Ц., & Иглевић, Б. (1989). Неколико имплементација бок плота. Амерички статистичар, 43(1), 50-54.
Povratne informacije
Kliknite na obaveštenje o povratnim informacijama da biste započeli davanje povratnih informacija o ovom alatu
Povezani alati
Otkrijte više alata koji bi mogli biti korisni za vaš radni tok