สร้างการวิเคราะห์เชิงภาพของชุดข้อมูลของคุณโดยใช้กราฟกล่องและหนวดเครื่องมือ นี้คำนวณและแสดงมาตรการทางสถิติที่สำคัญรวมถึงควอไทล์, มัธยฐาน, และค่าผิดปกติ
กราฟกล่อง หรือที่เรียกว่ากราฟกล่องและหนวด เป็นวิธีการแสดงการกระจายของข้อมูลที่มีมาตรฐาน โดยอิงจากสรุปห้าหมายเลข: ค่าต่ำสุด, ควอไทล์แรก (Q1), มัธยฐาน, ควอไทล์ที่สาม (Q3), และค่ามากสุด เครื่องคิดเลขนี้ช่วยให้คุณสร้างกราฟกล่องจากชุดข้อมูลเชิงตัวเลขที่กำหนด ซึ่งเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการแสดงผลและการวิเคราะห์ข้อมูล
สูตรสำคัญที่ใช้ในการคำนวณกราฟกล่องมีดังนี้:
มัธยฐาน (Q2): สำหรับชุดข้อมูลที่เรียงลำดับแล้วมี n องค์ประกอบ,
x_{\frac{n+1}{2}} & \text{ถ้า n เป็นเลขคี่} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ถ้า n เป็นเลขคู่} \end{cases} $$ควอไทล์แรก (Q1) และควอไทล์ที่สาม (Q3):
ช่วงระหว่างควอไทล์ (IQR):
หนวด:
จุดเบี่ยงเบน: จุดข้อมูลใด ๆ ที่ต่ำกว่าหนวดล่างหรือสูงกว่าหนวดบน
เครื่องคิดเลขจะทำตามขั้นตอนต่อไปนี้เพื่อสร้างกราฟกล่อง:
สิ่งสำคัญที่ต้องทราบคือมีวิธีการต่าง ๆ ในการคำนวณควอไทล์ โดยเฉพาะเมื่อจัดการกับชุดข้อมูลที่มีจำนวนองค์ประกอบเป็นเลขคู่ วิธีการที่อธิบายข้างต้นเรียกว่า "วิธีการพิเศษ" แต่มีวิธีการอื่น ๆ เช่น "วิธีการรวม" หรือ "มัธยฐานของมัธยฐาน" ก็สามารถใช้ได้ การเลือกวิธีการอาจส่งผลต่อการกำหนดตำแหน่งของ Q1 และ Q3 เล็กน้อย โดยเฉพาะสำหรับชุดข้อมูลขนาดเล็ก
กราฟกล่องให้ข้อมูลเชิงลึกหลายประการเกี่ยวกับข้อมูล:
กราฟกล่องมีประโยชน์ในหลายสาขา รวมถึง:
สถิติ: เพื่อแสดงการกระจายและความเอียงของข้อมูล ตัวอย่างเช่น การเปรียบเทียบคะแนนสอบระหว่างโรงเรียนหรือชั้นเรียนต่าง ๆ
การวิเคราะห์ข้อมูล: เพื่อระบุจุดเบี่ยงเบนและเปรียบเทียบการกระจาย ในธุรกิจอาจใช้วิเคราะห์ข้อมูลการขายในแต่ละภูมิภาคหรือช่วงเวลา
การวิจัยทางวิทยาศาสตร์: เพื่อนำเสนอผลลัพธ์และเปรียบเทียบกลุ่ม ตัวอย่างเช่น การเปรียบเทียบประสิทธิภาพของการรักษาที่แตกต่างกันในการศึกษาทางการแพทย์
การควบคุมคุณภาพ: เพื่อติดตามตัวแปรในกระบวนการและระบุความผิดปกติ ในการผลิตอาจใช้ติดตามขนาดของผลิตภัณฑ์และตรวจสอบให้แน่ใจว่าตกอยู่ในช่วงที่ยอมรับได้
การเงิน: เพื่อวิเคราะห์การเคลื่อนไหวของราคาหุ้นและเมตริกทางการเงินอื่น ๆ ตัวอย่างเช่น การเปรียบเทียบประสิทธิภาพของกองทุนรวมที่แตกต่างกันในช่วงเวลา
วิทยาศาสตร์สิ่งแวดล้อม: เพื่อวิเคราะห์และเปรียบเทียบข้อมูลสิ่งแวดล้อม เช่น ระดับมลพิษหรือการเปลี่ยนแปลงอุณหภูมิในสถานที่หรือช่วงเวลาที่แตกต่างกัน
การวิเคราะห์กีฬา: เพื่อเปรียบเทียบสถิติการแสดงของผู้เล่นระหว่างทีมต่าง ๆ หรือฤดูกาล
แม้ว่ากราฟกล่องจะเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการแสดงผลข้อมูล แต่ก็มีทางเลือกหลายอย่างขึ้นอยู่กับความต้องการเฉพาะของการวิเคราะห์:
ฮิสโตแกรม: มีประโยชน์ในการแสดงการกระจายความถี่ของชุดข้อมูล พวกเขาให้รายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบของการกระจาย แต่ไม่อาจเปรียบเทียบชุดข้อมูลหลายชุดได้อย่างมีประสิทธิภาพ
กราฟไวโอลิน: รวมคุณสมบัติของกราฟกล่องกับกราฟความหนาแน่นของเคอร์เนล แสดงความหนาแน่นของความน่าจะเป็นของข้อมูลที่ค่าต่าง ๆ
กราฟกระจาย: เหมาะสำหรับการแสดงความสัมพันธ์ระหว่างสองตัวแปร ซึ่งกราฟกล่องไม่สามารถทำได้
กราฟแท่ง: เหมาะสำหรับการเปรียบเทียบค่าคงที่ในหมวดหมู่ต่าง ๆ
กราฟเส้น: มีประสิทธิภาพในการแสดงแนวโน้มตามเวลา ซึ่งกราฟกล่องไม่สามารถจับภาพได้ดี
แผนที่ความร้อน: มีประโยชน์ในการแสดงข้อมูลที่ซับซ้อนที่มีหลายตัวแปร
การเลือกใช้ทางเลือกเหล่านี้ขึ้นอยู่กับลักษณะของข้อมูลและข้อมูลเชิงลึกเฉพาะที่ต้องการสื่อสาร
กราฟกล่องถูกคิดค้นโดย John Tukey ในปี 1970 และปรากฏครั้งแรกในหนังสือของเขา "Exploratory Data Analysis" ในปี 1977 การออกแบบดั้งเดิมของ Tukey เรียกว่า "กราฟสัญลักษณ์" แสดงเฉพาะมัธยฐาน ควอไทล์ และค่าขั้นสูงสุด
การพัฒนาที่สำคัญในประวัติศาสตร์ของกราฟกล่องรวมถึง:
1978: McGill, Tukey, และ Larsen แนะนำกราฟกล่องที่มีรอยหยัก ซึ่งเพิ่มช่วงความเชื่อมั่นสำหรับมัธยฐาน
1980s: แนวคิดของ "จุดเบี่ยงเบน" ในกราฟกล่องเริ่มมีมาตรฐานมากขึ้น โดยทั่วไปจะกำหนดว่าเป็นจุดที่อยู่นอก 1.5 เท่าของ IQR จากควอไทล์
1990s-2000s: ด้วยการเกิดขึ้นของกราฟิกคอมพิวเตอร์ รูปแบบต่าง ๆ เช่น กราฟกล่องที่มีความกว้างแตกต่างกันและกราฟไวโอลินได้รับการพัฒนา
ปัจจุบัน: กราฟกล่องที่โต้ตอบได้และมีพลศาสตร์ได้กลายเป็นเรื่องปกติในซอฟต์แวร์การแสดงข้อมูล ช่วยให้ผู้ใช้สำรวจจุดข้อมูลพื้นฐานได้
กราฟกล่องยังคงยืนหยัดต่อเวลาเนื่องจากความเรียบง่ายและประสิทธิภาพในการสรุปชุดข้อมูลที่ซับซ้อน พวกเขายังคงเป็นเครื่องมือหลักในด้านการวิเคราะห์ข้อมูลในหลายสาขา
นี่คือตัวอย่างวิธีการสร้างกราฟกล่องในหลายภาษาโปรแกรม:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' มัธยฐาน
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' ค่าต่ำสุด
5=MAX(A1:A100) ' ค่ามากสุด
6
1## สมมติว่า 'data' คือเวกเตอร์ของตัวเลขของคุณ
2boxplot(data)
3
1% สมมติว่า 'data' คือเวกเตอร์ของตัวเลขของคุณ
2boxplot(data)
3
1// ใช้ D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* อาร์เรย์ข้อมูลของคุณ */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* อาร์เรย์ข้อมูลของคุณ */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* ข้อมูลของคุณ */), "ชุดที่ 1", "หมวดหมู่ที่ 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "กราฟกล่อง", "หมวดหมู่", "ค่า", dataset, true);
11
ค้นพบเครื่องมือเพิ่มเติมที่อาจมีประโยชน์สำหรับการทำงานของคุณ