เครื่องคำนวณกราฟกล่องและหนวดสำหรับการวิเคราะห์
สร้างการวิเคราะห์เชิงภาพของชุดข้อมูลของคุณโดยใช้กราฟกล่องและหนวดเครื่องมือ นี้คำนวณและแสดงมาตรการทางสถิติที่สำคัญรวมถึงควอไทล์, มัธยฐาน, และค่าผิดปกติ
เครื่องคำนวณกราฟกล่อง
เครื่องคำนวณกราฟกล่อง
เอกสารประกอบ
เครื่องคิดเลขกราฟกล่อง
บทนำ
กราฟกล่อง หรือที่เรียกว่ากราฟกล่องและหนวด เป็นวิธีการแสดงการกระจายของข้อมูลที่มีมาตรฐาน โดยอิงจากสรุปห้าหมายเลข: ค่าต่ำสุด, ควอไทล์แรก (Q1), มัธยฐาน, ควอไทล์ที่สาม (Q3), และค่ามากสุด เครื่องคิดเลขนี้ช่วยให้คุณสร้างกราฟกล่องจากชุดข้อมูลเชิงตัวเลขที่กำหนด ซึ่งเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการแสดงผลและการวิเคราะห์ข้อมูล
วิธีการใช้เครื่องคิดเลขนี้
- ป้อนข้อมูลของคุณเป็นรายการของตัวเลขที่คั่นด้วยเครื่องหมายจุลภาคหรือช่องว่างในช่องป้อนข้อมูล
- เครื่องคิดเลขจะคำนวณสถิติกราฟกล่องโดยอัตโนมัติและแสดงผลลัพธ์
- การแสดงผลภาพของกราฟกล่องจะปรากฏด้านล่างผลลัพธ์
- คุณสามารถคัดลอกผลลัพธ์ที่คำนวณได้โดยใช้ปุ่ม "คัดลอกผลลัพธ์"
สูตร
สูตรสำคัญที่ใช้ในการคำนวณกราฟกล่องมีดังนี้:
-
มัธยฐาน (Q2): สำหรับชุดข้อมูลที่เรียงลำดับแล้วมี n องค์ประกอบ,
x_{\frac{n+1}{2}} & \text{ถ้า n เป็นเลขคี่} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ถ้า n เป็นเลขคู่} \end{cases} $$ -
ควอไทล์แรก (Q1) และควอไทล์ที่สาม (Q3):
-
ช่วงระหว่างควอไทล์ (IQR):
-
หนวด:
-
จุดเบี่ยงเบน: จุดข้อมูลใด ๆ ที่ต่ำกว่าหนวดล่างหรือสูงกว่าหนวดบน
การคำนวณ
เครื่องคิดเลขจะทำตามขั้นตอนต่อไปนี้เพื่อสร้างกราฟกล่อง:
- เรียงข้อมูลที่ป้อนในลำดับจากน้อยไปหามาก
- คำนวณมัธยฐาน (Q2):
- ถ้าจำนวนจุดข้อมูลเป็นเลขคี่ มัธยฐานจะเป็นค่ากลาง
- ถ้าจำนวนจุดข้อมูลเป็นเลขคู่ มัธยฐานจะเป็นค่าเฉลี่ยของสองค่ากลาง
- คำนวณควอไทล์แรก (Q1):
- นี่คือมัธยฐานของครึ่งล่างของข้อมูล
- ถ้าจำนวนจุดข้อมูลเป็นเลขคี่ มัธยฐานจะไม่ถูกนับในครึ่งใด ๆ
- คำนวณควอไทล์ที่สาม (Q3):
- นี่คือมัธยฐานของครึ่งบนของข้อมูล
- ถ้าจำนวนจุดข้อมูลเป็นเลขคี่ มัธยฐานจะไม่ถูกนับในครึ่งใด ๆ
- คำนวณช่วงระหว่างควอไทล์ (IQR) = Q3 - Q1
- กำหนดหนวด:
- หนวดล่าง: ค่าข้อมูลที่เล็กที่สุดที่มากกว่าหรือเท่ากับ Q1 - 1.5 * IQR
- หนวดบน: ค่าข้อมูลที่ใหญ่ที่สุดที่น้อยกว่าหรือเท่ากับ Q3 + 1.5 * IQR
- ระบุจุดเบี่ยงเบน: จุดข้อมูลใด ๆ ที่ต่ำกว่าหนวดล่างหรือสูงกว่าหนวดบน
สิ่งสำคัญที่ต้องทราบคือมีวิธีการต่าง ๆ ในการคำนวณควอไทล์ โดยเฉพาะเมื่อจัดการกับชุดข้อมูลที่มีจำนวนองค์ประกอบเป็นเลขคู่ วิธีการที่อธิบายข้างต้นเรียกว่า "วิธีการพิเศษ" แต่มีวิธีการอื่น ๆ เช่น "วิธีการรวม" หรือ "มัธยฐานของมัธยฐาน" ก็สามารถใช้ได้ การเลือกวิธีการอาจส่งผลต่อการกำหนดตำแหน่งของ Q1 และ Q3 เล็กน้อย โดยเฉพาะสำหรับชุดข้อมูลขนาดเล็ก
การตีความ
- กล่องในกราฟแสดงถึงช่วงระหว่างควอไทล์ (IQR) โดยที่ด้านล่างของกล่องอยู่ที่ Q1 และด้านบนอยู่ที่ Q3
- เส้นภายในกล่องแสดงถึงมัธยฐาน (Q2)
- หนวดจะยืดออกจากกล่องไปยังค่าต่ำสุดและค่ามากสุด โดยไม่รวมจุดเบี่ยงเบน
- จุดเบี่ยงเบนจะแสดงเป็นจุดเดี่ยวที่อยู่นอกหนวด
กราฟกล่องให้ข้อมูลเชิงลึกหลายประการเกี่ยวกับข้อมูล:
- แนวโน้มกลาง: มัธยฐานแสดงถึงค่ากลางของชุดข้อมูล
- ความแปรปรวน: IQR และการกระจายโดยรวมจากค่าต่ำสุดไปยังค่ามากสุดแสดงถึงการกระจายของข้อมูล
- ความเอียง: ถ้ามัธยฐานไม่อยู่ตรงกลางของกล่อง แสดงว่ามีความเอียงในข้อมูล
- จุดเบี่ยงเบน: จุดที่อยู่นอกหนวดแสดงถึงจุดเบี่ยงเบนหรือค่าผิดปกติที่อาจเกิดขึ้น
กรณีการใช้งาน
กราฟกล่องมีประโยชน์ในหลายสาขา รวมถึง:
-
สถิติ: เพื่อแสดงการกระจายและความเอียงของข้อมูล ตัวอย่างเช่น การเปรียบเทียบคะแนนสอบระหว่างโรงเรียนหรือชั้นเรียนต่าง ๆ
-
การวิเคราะห์ข้อมูล: เพื่อระบุจุดเบี่ยงเบนและเปรียบเทียบการกระจาย ในธุรกิจอาจใช้วิเคราะห์ข้อมูลการขายในแต่ละภูมิภาคหรือช่วงเวลา
-
การวิจัยทางวิทยาศาสตร์: เพื่อนำเสนอผลลัพธ์และเปรียบเทียบกลุ่ม ตัวอย่างเช่น การเปรียบเทียบประสิทธิภาพของการรักษาที่แตกต่างกันในการศึกษาทางการแพทย์
-
การควบคุมคุณภาพ: เพื่อติดตามตัวแปรในกระบวนการและระบุความผิดปกติ ในการผลิตอาจใช้ติดตามขนาดของผลิตภัณฑ์และตรวจสอบให้แน่ใจว่าตกอยู่ในช่วงที่ยอมรับได้
-
การเงิน: เพื่อวิเคราะห์การเคลื่อนไหวของราคาหุ้นและเมตริกทางการเงินอื่น ๆ ตัวอย่างเช่น การเปรียบเทียบประสิทธิภาพของกองทุนรวมที่แตกต่างกันในช่วงเวลา
-
วิทยาศาสตร์สิ่งแวดล้อม: เพื่อวิเคราะห์และเปรียบเทียบข้อมูลสิ่งแวดล้อม เช่น ระดับมลพิษหรือการเปลี่ยนแปลงอุณหภูมิในสถานที่หรือช่วงเวลาที่แตกต่างกัน
-
การวิเคราะห์กีฬา: เพื่อเปรียบเทียบสถิติการแสดงของผู้เล่นระหว่างทีมต่าง ๆ หรือฤดูกาล
ทางเลือก
แม้ว่ากราฟกล่องจะเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการแสดงผลข้อมูล แต่ก็มีทางเลือกหลายอย่างขึ้นอยู่กับความต้องการเฉพาะของการวิเคราะห์:
-
ฮิสโตแกรม: มีประโยชน์ในการแสดงการกระจายความถี่ของชุดข้อมูล พวกเขาให้รายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบของการกระจาย แต่ไม่อาจเปรียบเทียบชุดข้อมูลหลายชุดได้อย่างมีประสิทธิภาพ
-
กราฟไวโอลิน: รวมคุณสมบัติของกราฟกล่องกับกราฟความหนาแน่นของเคอร์เนล แสดงความหนาแน่นของความน่าจะเป็นของข้อมูลที่ค่าต่าง ๆ
-
กราฟกระจาย: เหมาะสำหรับการแสดงความสัมพันธ์ระหว่างสองตัวแปร ซึ่งกราฟกล่องไม่สามารถทำได้
-
กราฟแท่ง: เหมาะสำหรับการเปรียบเทียบค่าคงที่ในหมวดหมู่ต่าง ๆ
-
กราฟเส้น: มีประสิทธิภาพในการแสดงแนวโน้มตามเวลา ซึ่งกราฟกล่องไม่สามารถจับภาพได้ดี
-
แผนที่ความร้อน: มีประโยชน์ในการแสดงข้อมูลที่ซับซ้อนที่มีหลายตัวแปร
การเลือกใช้ทางเลือกเหล่านี้ขึ้นอยู่กับลักษณะของข้อมูลและข้อมูลเชิงลึกเฉพาะที่ต้องการสื่อสาร
ประวัติ
กราฟกล่องถูกคิดค้นโดย John Tukey ในปี 1970 และปรากฏครั้งแรกในหนังสือของเขา "Exploratory Data Analysis" ในปี 1977 การออกแบบดั้งเดิมของ Tukey เรียกว่า "กราฟสัญลักษณ์" แสดงเฉพาะมัธยฐาน ควอไทล์ และค่าขั้นสูงสุด
การพัฒนาที่สำคัญในประวัติศาสตร์ของกราฟกล่องรวมถึง:
-
1978: McGill, Tukey, และ Larsen แนะนำกราฟกล่องที่มีรอยหยัก ซึ่งเพิ่มช่วงความเชื่อมั่นสำหรับมัธยฐาน
-
1980s: แนวคิดของ "จุดเบี่ยงเบน" ในกราฟกล่องเริ่มมีมาตรฐานมากขึ้น โดยทั่วไปจะกำหนดว่าเป็นจุดที่อยู่นอก 1.5 เท่าของ IQR จากควอไทล์
-
1990s-2000s: ด้วยการเกิดขึ้นของกราฟิกคอมพิวเตอร์ รูปแบบต่าง ๆ เช่น กราฟกล่องที่มีความกว้างแตกต่างกันและกราฟไวโอลินได้รับการพัฒนา
-
ปัจจุบัน: กราฟกล่องที่โต้ตอบได้และมีพลศาสตร์ได้กลายเป็นเรื่องปกติในซอฟต์แวร์การแสดงข้อมูล ช่วยให้ผู้ใช้สำรวจจุดข้อมูลพื้นฐานได้
กราฟกล่องยังคงยืนหยัดต่อเวลาเนื่องจากความเรียบง่ายและประสิทธิภาพในการสรุปชุดข้อมูลที่ซับซ้อน พวกเขายังคงเป็นเครื่องมือหลักในด้านการวิเคราะห์ข้อมูลในหลายสาขา
โค้ดตัวอย่าง
นี่คือตัวอย่างวิธีการสร้างกราฟกล่องในหลายภาษาโปรแกรม:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' มัธยฐาน
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' ค่าต่ำสุด
5=MAX(A1:A100) ' ค่ามากสุด
6
1## สมมติว่า 'data' คือเวกเตอร์ของตัวเลขของคุณ
2boxplot(data)
3
1% สมมติว่า 'data' คือเวกเตอร์ของตัวเลขของคุณ
2boxplot(data)
3
1// ใช้ D3.js
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* อาร์เรย์ข้อมูลของคุณ */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* อาร์เรย์ข้อมูลของคุณ */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* ข้อมูลของคุณ */), "ชุดที่ 1", "หมวดหมู่ที่ 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "กราฟกล่อง", "หมวดหมู่", "ค่า", dataset, true);
11
อ้างอิง
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
- McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of Box Plots. The American Statistician, 32(1), 12-16.
- Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). The box plot: a simple visual method to interpret data. Annals of internal medicine, 110(11), 916-921.
- Wickham, H., & Stryjewski, L. (2011). 40 years of boxplots. Technical report, had.co.nz.
- Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). Some Implementations of the Boxplot. The American Statistician, 43(1), 50-54.
ข้อเสนอแนะแสดงความคิดเห็น
คลิกที่ข้อเสนอแนะแสดงความคิดเห็นเพื่อเริ่มให้ข้อเสนอแนะแก่เครื่องมือนี้
เครื่องมือที่เกี่ยวข้อง
ค้นพบเครื่องมือเพิ่มเติมที่อาจมีประโยชน์สำหรับการทำงานของคุณ