🛠️

Whiz Tools

Build • Create • Innovate

Box Plot Számoló: Vizuális Elemzés és Statisztikai Mutatók

Generálj vizuális elemzést az adatállományodról egy box-and-whisker diagram segítségével. Ez az eszköz kiszámítja és megjeleníti a kulcsfontosságú statisztikai mutatókat, beleértve a kvartiliseket, a mediánt és a kiugró értékeket.

Box Plot Számító

Box Plot Számító

📚

Dokumentáció

Box Plot Számológép

Bevezetés

A box plot, más néven box-and-whisker plot, egy standardizált módja az adatok eloszlásának megjelenítésére egy öt számjegyű összegzés alapján: minimum, első kvartilis (Q1), medián, harmadik kvartilis (Q3) és maximum. Ez a számológép lehetővé teszi, hogy egy adott numerikus adathalmazból box plot-ot generáljunk, amely egy hatékony eszköz az adatok vizualizálásához és elemzéséhez.

Használati útmutató

  1. Írd be az adataidat egy vesszővel vagy szóközzel elválasztott számok listájaként a bemeneti mezőbe.
  2. A számológép automatikusan kiszámítja a box plot statisztikákat és megjeleníti az eredményeket.
  3. Az alábbiakban a box plot vizuális ábrázolása lesz látható.
  4. Az "Eredmény másolása" gomb segítségével másolhatod a kiszámított eredményeket.

Képlet

A box plot számításokhoz használt kulcsformulák a következők:

  1. Medián (Q2): Egy rendezett n elemű adathalmazon,

    x_{\frac{n+1}{2}} & \text{ha n páratlan} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ha n páros} \end{cases} $$
  2. Első kvartilis (Q1) és harmadik kvartilis (Q3): Q1=Az alsoˊ feˊl mediaˊnjaQ1 = \text{Az alsó fél mediánja} Q3=A felso˝ feˊl mediaˊnjaQ3 = \text{A felső fél mediánja}

  3. Interkvartilis tartomány (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. Pálcák: Alsoˊ paˊlca=max(min(x),Q11.5IQR)\text{Alsó pálca} = \max({\min(x), Q1 - 1.5 * IQR}) Felso˝ paˊlca=min(max(x),Q3+1.5IQR)\text{Felső pálca} = \min({\max(x), Q3 + 1.5 * IQR})

  5. Kiugró értékek: Bármely adatpont, amely az alsó pálca alatt vagy a felső pálca felett található.

Számítás

A számológép a következő lépéseket hajtja végre a box plot generálásához:

  1. Rendezze az input adatokat növekvő sorrendbe.
  2. Számítsa ki a mediánt (Q2):
    • Ha a számadatok száma páratlan, a medián a középső érték.
    • Ha a számadatok száma páros, a medián a két középső érték átlaga.
  3. Számítsa ki az első kvartilist (Q1):
    • Ez az alsó fél mediánja.
    • Ha a számadatok száma páratlan, a medián nem szerepel egyik félben sem.
  4. Számítsa ki a harmadik kvartilist (Q3):
    • Ez a felső fél mediánja.
    • Ha a számadatok száma páratlan, a medián nem szerepel egyik félben sem.
  5. Számítsa ki az interkvartilis tartományt (IQR) = Q3 - Q1.
  6. Határozza meg a pálcákat:
    • Alsó pálca: A legkisebb adatpont, amely nagyobb vagy egyenlő Q1 - 1.5 * IQR-nél
    • Felső pálca: A legnagyobb adatpont, amely kisebb vagy egyenlő Q3 + 1.5 * IQR-nél
  7. Azonosítsa a kiugró értékeket: Bármely adatpont, amely az alsó pálca alatt vagy a felső pálca felett található.

Fontos megjegyezni, hogy különböző módszerek léteznek a kvartilisek kiszámítására, különösen páros számú elemeket tartalmazó adathalmazon. A fent leírt módszer az "exkluzív" módszer néven ismert, de más módszerek, mint az "inkluzív" módszer vagy a "mediánok mediánja" módszer is alkalmazhatók. A módszer megválasztása enyhén befolyásolhatja Q1 és Q3 helyét, különösen kis adathalmazon.

Értelmezés

Q3 Medián Q1 Min Max Box Plot Elemei
  • A plotban a doboz az interkvartilis tartományt (IQR) képviseli, az alsó doboz Q1-nél, a felső pedig Q3-nál található.
  • A dobozon belüli vonal a mediánt (Q2) jelöli.
  • A pálcák a dobozból a minimum és maximum értékekhez nyúlnak, a kiugró értékeket kizárva.
  • A kiugró értékek egyedi pontokként jelennek meg a pálcákon túl.

A box plot számos betekintést nyújt az adatokkal kapcsolatban:

  • Középpont: A medián a dataset középső értékét mutatja.
  • Variabilitás: Az IQR és a minimum és maximum közötti teljes terjedés mutatja az adatok szóródását.
  • Ferdeség: Ha a medián nem középen helyezkedik el a dobozban, az az adatok ferdeségét jelzi.
  • Kiugró értékek: A pálcákon túli pontok kiemelik a potenciális kiugró értékeket vagy szélsőséges értékeket.

Felhasználási esetek

A box plotok hasznosak különböző területeken, beleértve:

  1. Statisztika: Az adatok eloszlásának és ferdeségének vizualizálására. Például tesztpontszámok összehasonlítása különböző iskolák vagy osztályok között.

  2. Adatelemzés: Kiugró értékek azonosítása és eloszlások összehasonlítása. Az üzleti életben például az értékesítési adatok elemzésére különböző régiók vagy időszakok között.

  3. Tudományos kutatás: Eredmények bemutatása és csoportok összehasonlítása. Például különböző kezelések hatékonyságának összehasonlítása orvosi tanulmányokban.

  4. Minőségellenőrzés: Folyamatváltozók nyomon követése és rendellenességek azonosítása. Gyártásban például a termékek méretének nyomon követésére és biztosítására használható, hogy azok elfogadható tartományon belül legyenek.

  5. Pénzügy: Részvényárfolyamok és egyéb pénzügyi mutatók elemzése. Például különböző befektetési alapok teljesítményének összehasonlítása az idő múlásával.

  6. Környezettudomány: Környezeti adatok elemzése és összehasonlítása, például szennyezési szintek vagy hőmérséklet-változások különböző helyszínek vagy időszakok között.

  7. Sportelemzés: Játékos teljesítmény statisztikák összehasonlítása csapatok vagy szezonok között.

Alternatívák

Bár a box plotok hatékony eszközök az adatok vizualizálására, számos alternatíva létezik a konkrét elemzési igények függvényében:

  1. Histogramok: Hasznosak az adathalmazon belüli frekvenciaeloszlás megjelenítésére. Részletesebb információt nyújtanak az eloszlás alakjáról, de kevésbé hatékonyak több adathalaz összehasonlítására.

  2. Violin Plots: A box plotok és a kernel sűrűség plotok kombinálása, amelyek a különböző értékeknél az adatok valószínűségi sűrűségét mutatják.

  3. Szórásdiagramok: Ideálisak két változó közötti kapcsolat bemutatására, amit a box plotok nem tudnak megtenni.

  4. Oszlopdiagramok: Alkalmasak egyes értékek összehasonlítására különböző kategóriák között.

  5. Vonaldiagramok: Hatékonyak az időbeli trendek bemutatására, amit a box plotok nem tudnak jól rögzíteni.

  6. Hőtérképek: Hasznosak a komplex adathalmazon belüli több változó vizualizálására.

A választás a fenti alternatívák között az adatok természetétől és az átadni kívánt konkrét betekintésektől függ.

Történelem

A box plotot John Tukey találta fel 1970-ben, és először a "Felfedező Adatelemzés" című könyvében jelent meg 1977-ben. Tukey eredeti terve, amelyet "schematic plot"-nak neveztek, csak a mediánt, kvartiliseket és szélső értékeket mutatta be.

A box plot történetének kulcsfejleményei a következők:

  1. 1978: McGill, Tukey és Larsen bevezették a notcholt box plotot, amely a medián bizalmi intervallumait is hozzáadja.

  2. 1980-as évek: A box plotokban a "kiugró értékek" fogalma standardizálódott, általában az 1.5-szörös IQR-nél a kvartilisekből kifelé eső pontokként definiálva.

  3. 1990-es évek - 2000-es évek: A számítógépes grafika megjelenésével olyan változatok, mint a változó szélességű box plotok és a violin plotok alakultak ki.

  4. Jelen: Az interaktív és dinamikus box plotok elterjedtek az adatok vizualizáló szoftverekben, lehetővé téve a felhasználók számára az alapul szolgáló adatok felfedezését.

A box plotok időtállónak bizonyultak egyszerűségük és hatékonyságuk miatt a komplex adathalmazon. Továbbra is alapvető szerepet játszanak az adatelemzésben számos területen.

Kódpéldák

Itt vannak példák arra, hogyan lehet box plotot létrehozni különböző programozási nyelvekben:

1=QUARTILE(A1:A100,1)  ' Q1
2=MEDIAN(A1:A100)      ' Medián
3=QUARTILE(A1:A100,3)  ' Q3
4=MIN(A1:A100)         ' Minimum
5=MAX(A1:A100)         ' Maximum
6

Referenciák

  1. Tukey, J. W. (1977). Felfedező Adatelemzés. Addison-Wesley.
  2. McGill, R., Tukey, J. W., & Larsen, W. A. (1978). A Box Plot Variációi. The American Statistician, 32(1), 12-16.
  3. Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). A box plot: egy egyszerű vizuális módszer az adatok értelmezésére. Annals of internal medicine, 110(11), 916-921.
  4. Wickham, H., & Stryjewski, L. (2011). 40 év box plotok. Műszaki jelentés, had.co.nz.
  5. Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). A Boxplot néhány megvalósítása. The American Statistician, 43(1), 50-54.