🛠️

Whiz Tools

Build • Create • Innovate

Kalkulator kutnih dijagrama za analizu podataka

Generišite vizuelnu analizu vašeg skupa podataka koristeći kutni dijagram. Ovaj alat izračunava i prikazuje ključne statističke mere uključujući kvartile, medijanu i odstupanja.

Kalkulator kutijastog dijagrama

Kalkulator kutijastog dijagrama

📚

Dokumentacija

КCalculator за Бок Плот

Увод

Бок плот, познат и као бок и длакасти график, је стандардизован начин приказивања расподеле података на основу пет бројчаних резимеа: минимум, први квартил (Q1), медијана, трећи квартил (Q3) и максимум. Овај калкулатор вам омогућава да генеришете бок плот из датог сета нумеричких података, пружајући моћан алат за визуализацију и анализу података.

Како користити овај калкулатор

  1. Унесите своје податке као списак бројева одвојених запетама или размацима у улазно поље.
  2. Калкулатор ће аутоматски израчунати статистику бок плота и приказати резултате.
  3. Визуелна репрезентација бок плота биће приказана испод резултата.
  4. Можете копирати израчунате резултате користећи дугме "Копирај резултат".

Формула

Кључне формуле коришћене у израчунавању бок плота су:

  1. Медијана (Q2): За уређени скуп података од n елемената,

    x_{\frac{n+1}{2}} & \text{ако је n непарно} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ако је n парно} \end{cases} $$
  2. Први квартил (Q1) и трећи квартил (Q3): Q1=Медијана доњег дела податакаQ1 = \text{Медијана доњег дела података} Q3=Медијана горњег дела податакаQ3 = \text{Медијана горњег дела података}

  3. Интерквартилни опсег (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. Длаке: Доња длака=max(min(x),Q11.5IQR)\text{Доња длака} = \max({\min(x), Q1 - 1.5 * IQR}) Горња длака=min(max(x),Q3+1.5IQR)\text{Горња длака} = \min({\max(x), Q3 + 1.5 * IQR})

  5. Изузеци: Сви подаци испод доње длаке или изнад горње длаке.

Израчунавање

Калкулатор изводи следеће кораке да генерише бок плот:

  1. Уредите улазне податке у растућем редоследу.
  2. Израчунајте медијану (Q2):
    • Ако је број података непаран, медијана је средња вредност.
    • Ако је број података паран, медијана је просек две средње вредности.
  3. Израчунајте први квартил (Q1):
    • Ово је медијана доњег дела података.
    • Ако је број података непаран, медијана се не укључује у нижи део.
  4. Израчунајте трећи квартил (Q3):
    • Ово је медијана горњег дела података.
    • Ако је број података непаран, медијана се не укључује у нижи део.
  5. Израчунајте интерквартилни опсег (IQR) = Q3 - Q1.
  6. Одредите длаке:
    • Доња длака: Најмања вредност података већа или једнака Q1 - 1.5 * IQR
    • Горња длака: Највећа вредност података мања или једнака Q3 + 1.5 * IQR
  7. Идентификујте изузетке: Сви подаци испод доње длаке или изнад горње длаке.

Важно је напоменути да постоје различите методе за израчунавање квартилa, посебно када се ради о скупу података који има паран број елемената. Метода описана изнад позната је као "ексклузивна" метода, али се могу користити и друге методе попут "инклузивне" методе или "медијане медијана". Избор методе може мало утицати на позицију Q1 и Q3, посебно за мале скупине података.

Интерпретација

Q3 Медијана Q1 Мин Макс Компоненте Бок Плота
  • Кутија у графику представља интерквартилни опсег (IQR), са дном кутије на Q1 и врхом на Q3.
  • Линија унутар кутије представља медијану (Q2).
  • Длаке се протежу од кутије до минималних и максималних вредности, искључујући изузетке.
  • Изузеци су приказани као појединачне тачке изван длака.

Бок плот пружа неколико увида о подацима:

  • Централна тенденција: Медијана показује централну вредност скупа података.
  • Разноликост: IQR и укупно распростирање од минимума до максимума показују расподелу података.
  • Искривљеност: Ако медијана није центрирана унутар кутије, то указује на искривљеност у подацима.
  • Изузеци: Тачке изван длака истичу потенцијалне изузетке или екстремне вредности.

Случаеви коришћења

Бок плотови су корисни у различитим областима, укључујући:

  1. Статистика: За визуализацију расподеле и искривљености података. На пример, упоређивање резултата тестова у различитим школама или разредима.

  2. Анализа података: За идентификацију изузетака и упоређивање расподела. У пословању, могло би се користити за анализу података о продаји у различитим регионима или временским периодима.

  3. Научна истраживања: За представљање резултата и упоређивање група. На пример, упоређивање ефикасности различитих третмана у медицинским студијама.

  4. Контрола квалитета: За праћење процесних варијабли и идентификацију аномалија. У производњи, могло би се користити за праћење димензија производа и осигуравање да падају у прихватљиве границе.

  5. Финансије: За анализу кретања цена акција и других финансијских метрика. На пример, упоређивање перформанси различитих инвестиционих фондова током времена.

  6. Екологија: За анализу и упоређивање еколошких података, као што су нивои загађења или температурне варијације у различитим локацијама или временским периодима.

  7. Спортска анализа: За упоређивање статистике перформанси играча у различитим тимовима или сезонама.

Алтернативе

Иако су бок плотови моћни алати за визуализацију података, постоји неколико алтернатива у зависности од специфичних потреба анализе:

  1. Хистограми: Корисни за приказивање расподеле учесталости скупа података. Пружају више детаља о облику расподеле, али могу бити мање ефикасни за упоређивање више скупова података.

  2. Виолин графикони: Комбинују карактеристике бок плотова са графиконима густине језгра, показујући вероватноћну густину података на различитим вредностима.

  3. Распоредне табеле: Идеалне за приказивање односа између две променљиве, што бок плотови не могу да ураде.

  4. Стубни графикони: Погодни за упоређивање појединачних вредности у различитим категоријама.

  5. Линијски графикони: Ефикасни за приказивање трендова током времена, што бок плотови не могу добро да ухвате.

  6. Топлотне мапе: Корисне за визуализацију сложених скупова података са више променљивих.

Избор између ових алтернатива зависи од природе података и специфичних увида које желите да пренесете.

Историја

Бок плот је изумео Џон Туки 1970. године и први пут се појавио у његовој књизи "Истраживачка анализа података" 1977. године. Тукијев оригинални дизајн, познат као "схематски графикон", приказивао је само медијану, квартиле и екстремне вредности.

Кључни развоји у историји бок плотова укључују:

  1. 1978: МекГил, Туки и Ларсен увели су графикон са жлебом, који додаје интервале поверења за медијану.

  2. 1980-их: Концепт "изузетака" у бок плотовима постао је стандардизован, обично дефинисан као тачке изван 1.5 пута IQR од квартила.

  3. 1990-их-2000-их: Са појавом компјутерске графике, развијене су варијације попут графикона бок плота променљиве ширине и виолин графикона.

  4. Данас: Интерактивни и динамични бок плотови постали су уобичајени у софтверу за визуализацију података, омогућавајући корисницима да истражују основне податке.

Бок плотови су издржали тест времена због своје једноставности и ефикасности у резимирању сложених скупова података. Они и даље остају стандард у анализи података у многим областима.

Кодни фрагменти

Ево примера како да креирате бок плот у различитим програмским језицима:

1=QUARTILE(A1:A100,1)  ' Q1
2=MEDIAN(A1:A100)      ' Медијана
3=QUARTILE(A1:A100,3)  ' Q3
4=MIN(A1:A100)         ' Минимум
5=MAX(A1:A100)         ' Максимум
6

Референце

  1. Туки, Ј. В. (1977). Истраживачка анализа података. Аддисон-Весли.
  2. МекГил, Р., Туки, Ј. В., & Ларсен, В. А. (1978). Варијације бок плотова. Амерички статистичар, 32(1), 12-16.
  3. Вилијамсон, Д. Ф., Паркер, Р. А., & Кендрич, Ј. С. (1989). Бок плот: једноставна визуелна метода за интерпретацију података. Анали интерне медицине, 110(11), 916-921.
  4. Викам, Х., & Стријејевски, Л. (2011). 40 година бок плотова. Технички извештај, had.co.nz.
  5. Фригге, М., Хоглин, Д. Ц., & Иглевић, Б. (1989). Неколико имплементација бок плота. Амерички статистичар, 43(1), 50-54.