Generišite vizuelnu analizu vašeg skupa podataka koristeći kutni dijagram. Ovaj alat izračunava i prikazuje ključne statističke mere uključujući kvartile, medijanu i odstupanja.
Бок плот, познат и као бок и длакасти график, је стандардизован начин приказивања расподеле података на основу пет бројчаних резимеа: минимум, први квартил (Q1), медијана, трећи квартил (Q3) и максимум. Овај калкулатор вам омогућава да генеришете бок плот из датог сета нумеричких података, пружајући моћан алат за визуализацију и анализу података.
Кључне формуле коришћене у израчунавању бок плота су:
Медијана (Q2): За уређени скуп података од n елемената,
x_{\frac{n+1}{2}} & \text{ако је n непарно} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ако је n парно} \end{cases} $$Први квартил (Q1) и трећи квартил (Q3):
Интерквартилни опсег (IQR):
Длаке:
Изузеци: Сви подаци испод доње длаке или изнад горње длаке.
Калкулатор изводи следеће кораке да генерише бок плот:
Важно је напоменути да постоје различите методе за израчунавање квартилa, посебно када се ради о скупу података који има паран број елемената. Метода описана изнад позната је као "ексклузивна" метода, али се могу користити и друге методе попут "инклузивне" методе или "медијане медијана". Избор методе може мало утицати на позицију Q1 и Q3, посебно за мале скупине података.
Бок плот пружа неколико увида о подацима:
Бок плотови су корисни у различитим областима, укључујући:
Статистика: За визуализацију расподеле и искривљености података. На пример, упоређивање резултата тестова у различитим школама или разредима.
Анализа података: За идентификацију изузетака и упоређивање расподела. У пословању, могло би се користити за анализу података о продаји у различитим регионима или временским периодима.
Научна истраживања: За представљање резултата и упоређивање група. На пример, упоређивање ефикасности различитих третмана у медицинским студијама.
Контрола квалитета: За праћење процесних варијабли и идентификацију аномалија. У производњи, могло би се користити за праћење димензија производа и осигуравање да падају у прихватљиве границе.
Финансије: За анализу кретања цена акција и других финансијских метрика. На пример, упоређивање перформанси различитих инвестиционих фондова током времена.
Екологија: За анализу и упоређивање еколошких података, као што су нивои загађења или температурне варијације у различитим локацијама или временским периодима.
Спортска анализа: За упоређивање статистике перформанси играча у различитим тимовима или сезонама.
Иако су бок плотови моћни алати за визуализацију података, постоји неколико алтернатива у зависности од специфичних потреба анализе:
Хистограми: Корисни за приказивање расподеле учесталости скупа података. Пружају више детаља о облику расподеле, али могу бити мање ефикасни за упоређивање више скупова података.
Виолин графикони: Комбинују карактеристике бок плотова са графиконима густине језгра, показујући вероватноћну густину података на различитим вредностима.
Распоредне табеле: Идеалне за приказивање односа између две променљиве, што бок плотови не могу да ураде.
Стубни графикони: Погодни за упоређивање појединачних вредности у различитим категоријама.
Линијски графикони: Ефикасни за приказивање трендова током времена, што бок плотови не могу добро да ухвате.
Топлотне мапе: Корисне за визуализацију сложених скупова података са више променљивих.
Избор између ових алтернатива зависи од природе података и специфичних увида које желите да пренесете.
Бок плот је изумео Џон Туки 1970. године и први пут се појавио у његовој књизи "Истраживачка анализа података" 1977. године. Тукијев оригинални дизајн, познат као "схематски графикон", приказивао је само медијану, квартиле и екстремне вредности.
Кључни развоји у историји бок плотова укључују:
1978: МекГил, Туки и Ларсен увели су графикон са жлебом, који додаје интервале поверења за медијану.
1980-их: Концепт "изузетака" у бок плотовима постао је стандардизован, обично дефинисан као тачке изван 1.5 пута IQR од квартила.
1990-их-2000-их: Са појавом компјутерске графике, развијене су варијације попут графикона бок плота променљиве ширине и виолин графикона.
Данас: Интерактивни и динамични бок плотови постали су уобичајени у софтверу за визуализацију података, омогућавајући корисницима да истражују основне податке.
Бок плотови су издржали тест времена због своје једноставности и ефикасности у резимирању сложених скупова података. Они и даље остају стандард у анализи података у многим областима.
Ево примера како да креирате бок плот у различитим програмским језицима:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Медијана
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Минимум
5=MAX(A1:A100) ' Максимум
6
1## Под претпоставком да је 'data' ваш вектор бројева
2boxplot(data)
3
1% Под претпоставком да је 'data' ваш вектор бројева
2boxplot(data)
3
1// Користећи D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* ваш низ података */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* ваш низ података */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* ваши подаци */), "Серија 1", "Категорија 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Бок Плот", "Категорија", "Вредност", dataset, true);
11
Otkrijte više alata koji mogu biti korisni za vaš radni proces