Калькулятор бокових графіків для візуалізації даних
Створіть візуальний аналіз вашого набору даних за допомогою бокового графіка. Цей інструмент розраховує та відображає основні статистичні показники, включаючи квартилі, медіану та викиди.
Калькулятор коробкових діаграм
Калькулятор коробкових діаграм
Документація
Калькулятор коробкових діаграм
Вступ
Коробкова діаграма, також відома як діаграма «коробка з вусами», є стандартизованим способом відображення розподілу даних на основі п'яти чисел: мінімум, перший квартиль (Q1), медіана, третій квартиль (Q3) та максимум. Цей калькулятор дозволяє генерувати коробкову діаграму з даного набору числових даних, надаючи потужний інструмент для візуалізації та аналізу даних.
Як користуватися цим калькулятором
- Введіть свої дані у вигляді списку чисел, розділених комами або пробілами, у полі введення.
- Калькулятор автоматично обчислить статистику коробкової діаграми та відобразить результати.
- Візуальне представлення коробкової діаграми буде показано нижче результатів.
- Ви можете скопіювати обчислені результати, використовуючи кнопку «Скопіювати результат».
Формула
Ключові формули, що використовуються в обчисленнях коробкових діаграм, включають:
-
Медіана (Q2): Для упорядкованого набору даних з n елементами,
x_{\frac{n+1}{2}} & \text{якщо n непарне} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{якщо n парне} \end{cases} $$ -
Перший квартиль (Q1) та третій квартиль (Q3):
-
Інтерквартильний діапазон (IQR):
-
Вуса:
-
Викиди: Будь-які дані, що нижче нижнього вуса або вище верхнього вуса.
Обчислення
Калькулятор виконує такі кроки для генерації коробкової діаграми:
- Відсортуйте введені дані у зростаючому порядку.
- Обчисліть медіану (Q2):
- Якщо кількість даних непарна, медіана є середнім значенням.
- Якщо кількість даних парна, медіана є середнім значенням двох середніх значень.
- Обчисліть перший квартиль (Q1):
- Це медіана нижньої половини даних.
- Якщо кількість даних непарна, медіана не включається в жодну половину.
- Обчисліть третій квартиль (Q3):
- Це медіана верхньої половини даних.
- Якщо кількість даних непарна, медіана не включається в жодну половину.
- Обчисліть інтерквартильний діапазон (IQR) = Q3 - Q1.
- Визначте вуса:
- Нижній вус: Найменше значення даних, що більше або дорівнює Q1 - 1.5 * IQR
- Верхній вус: Найбільше значення даних, що менше або дорівнює Q3 + 1.5 * IQR
- Визначте викиди: Будь-які дані, що нижче нижнього вуса або вище верхнього вуса.
Важливо зазначити, що існують різні методи обчислення квартилів, особливо при роботі з наборами даних, які мають парну кількість елементів. Метод, описаний вище, відомий як «ексклюзивний» метод, але також можуть використовуватися інші методи, такі як «включений» метод або «медіана медіан». Вибір методу може трохи вплинути на положення Q1 та Q3, особливо для малих наборів даних.
Інтерпретація
- Коробка на діаграмі представляє інтерквартильний діапазон (IQR), з нижньою частиною коробки на Q1 і верхньою на Q3.
- Лінія всередині коробки представляє медіану (Q2).
- Вуса простягаються від коробки до мінімальних і максимальних значень, виключаючи викиди.
- Викиди відображаються як окремі точки за межами вусів.
Коробкова діаграма надає кілька уявлень про дані:
- Центральна тенденція: Медіана показує центральне значення набору даних.
- Варіабельність: IQR та загальний розподіл від мінімуму до максимуму показують розсіювання даних.
- Скошеність: Якщо медіана не зосереджена всередині коробки, це вказує на скошеність даних.
- Викиди: Точки за межами вусів підкреслюють потенційні викиди або екстремальні значення.
Варіанти використання
Коробкові діаграми корисні в різних сферах, включаючи:
-
Статистика: Для візуалізації розподілу та скошеності даних. Наприклад, порівняння оцінок тестів у різних школах або класах.
-
Аналіз даних: Для виявлення викидів і порівняння розподілів. У бізнесі це може бути використано для аналізу даних про продажі в різних регіонах або періодах часу.
-
Наукові дослідження: Для представлення результатів і порівняння груп. Наприклад, порівняння ефективності різних лікувань у медичних дослідженнях.
-
Контроль якості: Для моніторингу змінних процесу та виявлення аномалій. У виробництві це може бути використано для відстеження розмірів продукції та забезпечення їх відповідності прийнятним межам.
-
Фінанси: Для аналізу руху цін на акції та інших фінансових показників. Наприклад, порівняння продуктивності різних пайових фондів з часом.
-
Екологічна наука: Для аналізу та порівняння екологічних даних, таких як рівні забруднення або температурні коливання в різних місцях або періодах часу.
-
Спортивна аналітика: Для порівняння статистики ефективності гравців у командах або сезонах.
Альтернативи
Хоча коробкові діаграми є потужними інструментами для візуалізації даних, існує кілька альтернатив залежно від конкретних потреб аналізу:
-
Гістограми: Корисні для показу частотного розподілу набору даних. Вони надають більше деталей про форму розподілу, але можуть бути менш ефективними для порівняння кількох наборів даних.
-
Віолінові діаграми: Поєднують особливості коробкових діаграм з графіками ядерної щільності, показуючи ймовірнісну щільність даних на різних значеннях.
-
Діаграми розсіювання: Ідеально підходять для показу взаємозв'язку між двома змінними, що коробкові діаграми не можуть зробити.
-
Стовпчикові діаграми: Підходять для порівняння окремих значень між різними категоріями.
-
Лінійні графіки: Ефективні для показу тенденцій з часом, що коробкові діаграми не відображають добре.
-
Теплові карти: Корисні для візуалізації складних наборів даних з кількома змінними.
Вибір між цими альтернативами залежить від природи даних і конкретних уявлень, які потрібно передати.
Історія
Коробкова діаграма була винайдена Джоном Такі у 1970 році і вперше з'явилася в його книзі «Експлораційний аналіз даних» у 1977 році. Оригінальний дизайн Такі, названий «схематичною діаграмою», відображав лише медіану, квартилі та екстремальні значення.
Ключові події в історії коробкових діаграм включають:
-
1978: МакГілл, Такі та Ларсен представили «ноточну коробкову діаграму», яка додає довірчі інтервали для медіани.
-
1980-ті: Концепція «викидів» у коробкових діаграмах стала більш стандартизованою, зазвичай визначається як точки за межами 1.5 разів IQR від квартилів.
-
1990-ті-2000-і: З появою комп'ютерної графіки були розроблені варіації, такі як коробкові діаграми змінної ширини та віолінові діаграми.
-
Сучасність: Інтерактивні та динамічні коробкові діаграми стали поширеними в програмному забезпеченні для візуалізації даних, дозволяючи користувачам досліджувати основні дані.
Коробкові діаграми витримали випробування часом завдяки своїй простоті та ефективності в узагальненні складних наборів даних. Вони продовжують бути основним елементом в аналізі даних у багатьох сферах.
Кодові фрагменти
Ось приклади того, як створити коробкову діаграму в різних мовах програмування:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' Медіана
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' Мінімум
5=MAX(A1:A100) ' Максимум
6
1## Припустимо, що 'data' — це ваш вектор чисел
2boxplot(data)
3
1% Припустимо, що 'data' — це ваш вектор чисел
2boxplot(data)
3
1// Використовуючи D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* ваш масив даних */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* ваш масив даних */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* ваші дані */), "Серія 1", "Категорія 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "Коробкова діаграма", "Категорія", "Значення", dataset, true);
11
Посилання
- Tukey, J. W. (1977). Експлораційний аналіз даних. Addison-Wesley.
- McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Варіації коробкових діаграм. The American Statistician, 32(1), 12-16.
- Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). Коробкова діаграма: простий візуальний метод для інтерпретації даних. Annals of internal medicine, 110(11), 916-921.
- Wickham, H., & Stryjewski, L. (2011). 40 років коробкових діаграм. Технічний звіт, had.co.nz.
- Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). Деякі реалізації коробкової діаграми. The American Statistician, 43(1), 50-54.
Відгуки
Натисніть на тост відгуку, щоб почати залишати відгук про цей інструмент
Супутні інструменти
Відкрийте для себе більше інструментів, які можуть бути корисними для вашого робочого процесу