🛠️

Whiz Tools

Build • Create • Innovate

เครื่องคำนวณกราฟกล่องและหนวดสำหรับการวิเคราะห์

สร้างการวิเคราะห์เชิงภาพของชุดข้อมูลของคุณโดยใช้กราฟกล่องและหนวดเครื่องมือ นี้คำนวณและแสดงมาตรการทางสถิติที่สำคัญรวมถึงควอไทล์, มัธยฐาน, และค่าผิดปกติ

เครื่องคำนวณกราฟกล่อง

เครื่องคำนวณกราฟกล่อง

📚

เอกสารประกอบ

เครื่องคิดเลขกราฟกล่อง

บทนำ

กราฟกล่อง หรือที่เรียกว่ากราฟกล่องและหนวด เป็นวิธีการแสดงการกระจายของข้อมูลที่มีมาตรฐาน โดยอิงจากสรุปห้าหมายเลข: ค่าต่ำสุด, ควอไทล์แรก (Q1), มัธยฐาน, ควอไทล์ที่สาม (Q3), และค่ามากสุด เครื่องคิดเลขนี้ช่วยให้คุณสร้างกราฟกล่องจากชุดข้อมูลเชิงตัวเลขที่กำหนด ซึ่งเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการแสดงผลและการวิเคราะห์ข้อมูล

วิธีการใช้เครื่องคิดเลขนี้

  1. ป้อนข้อมูลของคุณเป็นรายการของตัวเลขที่คั่นด้วยเครื่องหมายจุลภาคหรือช่องว่างในช่องป้อนข้อมูล
  2. เครื่องคิดเลขจะคำนวณสถิติกราฟกล่องโดยอัตโนมัติและแสดงผลลัพธ์
  3. การแสดงผลภาพของกราฟกล่องจะปรากฏด้านล่างผลลัพธ์
  4. คุณสามารถคัดลอกผลลัพธ์ที่คำนวณได้โดยใช้ปุ่ม "คัดลอกผลลัพธ์"

สูตร

สูตรสำคัญที่ใช้ในการคำนวณกราฟกล่องมีดังนี้:

  1. มัธยฐาน (Q2): สำหรับชุดข้อมูลที่เรียงลำดับแล้วมี n องค์ประกอบ,

    x_{\frac{n+1}{2}} & \text{ถ้า n เป็นเลขคี่} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{ถ้า n เป็นเลขคู่} \end{cases} $$
  2. ควอไทล์แรก (Q1) และควอไทล์ที่สาม (Q3): Q1=มัธยฐานของครึ่งล่างของข้อมูลQ1 = \text{มัธยฐานของครึ่งล่างของข้อมูล} Q3=มัธยฐานของครึ่งบนของข้อมูลQ3 = \text{มัธยฐานของครึ่งบนของข้อมูล}

  3. ช่วงระหว่างควอไทล์ (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. หนวด: หนวดล่าง=max(min(x),Q11.5IQR)\text{หนวดล่าง} = \max({\min(x), Q1 - 1.5 * IQR}) หนวดบน=min(max(x),Q3+1.5IQR)\text{หนวดบน} = \min({\max(x), Q3 + 1.5 * IQR})

  5. จุดเบี่ยงเบน: จุดข้อมูลใด ๆ ที่ต่ำกว่าหนวดล่างหรือสูงกว่าหนวดบน

การคำนวณ

เครื่องคิดเลขจะทำตามขั้นตอนต่อไปนี้เพื่อสร้างกราฟกล่อง:

  1. เรียงข้อมูลที่ป้อนในลำดับจากน้อยไปหามาก
  2. คำนวณมัธยฐาน (Q2):
    • ถ้าจำนวนจุดข้อมูลเป็นเลขคี่ มัธยฐานจะเป็นค่ากลาง
    • ถ้าจำนวนจุดข้อมูลเป็นเลขคู่ มัธยฐานจะเป็นค่าเฉลี่ยของสองค่ากลาง
  3. คำนวณควอไทล์แรก (Q1):
    • นี่คือมัธยฐานของครึ่งล่างของข้อมูล
    • ถ้าจำนวนจุดข้อมูลเป็นเลขคี่ มัธยฐานจะไม่ถูกนับในครึ่งใด ๆ
  4. คำนวณควอไทล์ที่สาม (Q3):
    • นี่คือมัธยฐานของครึ่งบนของข้อมูล
    • ถ้าจำนวนจุดข้อมูลเป็นเลขคี่ มัธยฐานจะไม่ถูกนับในครึ่งใด ๆ
  5. คำนวณช่วงระหว่างควอไทล์ (IQR) = Q3 - Q1
  6. กำหนดหนวด:
    • หนวดล่าง: ค่าข้อมูลที่เล็กที่สุดที่มากกว่าหรือเท่ากับ Q1 - 1.5 * IQR
    • หนวดบน: ค่าข้อมูลที่ใหญ่ที่สุดที่น้อยกว่าหรือเท่ากับ Q3 + 1.5 * IQR
  7. ระบุจุดเบี่ยงเบน: จุดข้อมูลใด ๆ ที่ต่ำกว่าหนวดล่างหรือสูงกว่าหนวดบน

สิ่งสำคัญที่ต้องทราบคือมีวิธีการต่าง ๆ ในการคำนวณควอไทล์ โดยเฉพาะเมื่อจัดการกับชุดข้อมูลที่มีจำนวนองค์ประกอบเป็นเลขคู่ วิธีการที่อธิบายข้างต้นเรียกว่า "วิธีการพิเศษ" แต่มีวิธีการอื่น ๆ เช่น "วิธีการรวม" หรือ "มัธยฐานของมัธยฐาน" ก็สามารถใช้ได้ การเลือกวิธีการอาจส่งผลต่อการกำหนดตำแหน่งของ Q1 และ Q3 เล็กน้อย โดยเฉพาะสำหรับชุดข้อมูลขนาดเล็ก

การตีความ

Q3 มัธยฐาน Q1 ค่าต่ำสุด ค่ามากสุด ส่วนประกอบของกราฟกล่อง
  • กล่องในกราฟแสดงถึงช่วงระหว่างควอไทล์ (IQR) โดยที่ด้านล่างของกล่องอยู่ที่ Q1 และด้านบนอยู่ที่ Q3
  • เส้นภายในกล่องแสดงถึงมัธยฐาน (Q2)
  • หนวดจะยืดออกจากกล่องไปยังค่าต่ำสุดและค่ามากสุด โดยไม่รวมจุดเบี่ยงเบน
  • จุดเบี่ยงเบนจะแสดงเป็นจุดเดี่ยวที่อยู่นอกหนวด

กราฟกล่องให้ข้อมูลเชิงลึกหลายประการเกี่ยวกับข้อมูล:

  • แนวโน้มกลาง: มัธยฐานแสดงถึงค่ากลางของชุดข้อมูล
  • ความแปรปรวน: IQR และการกระจายโดยรวมจากค่าต่ำสุดไปยังค่ามากสุดแสดงถึงการกระจายของข้อมูล
  • ความเอียง: ถ้ามัธยฐานไม่อยู่ตรงกลางของกล่อง แสดงว่ามีความเอียงในข้อมูล
  • จุดเบี่ยงเบน: จุดที่อยู่นอกหนวดแสดงถึงจุดเบี่ยงเบนหรือค่าผิดปกติที่อาจเกิดขึ้น

กรณีการใช้งาน

กราฟกล่องมีประโยชน์ในหลายสาขา รวมถึง:

  1. สถิติ: เพื่อแสดงการกระจายและความเอียงของข้อมูล ตัวอย่างเช่น การเปรียบเทียบคะแนนสอบระหว่างโรงเรียนหรือชั้นเรียนต่าง ๆ

  2. การวิเคราะห์ข้อมูล: เพื่อระบุจุดเบี่ยงเบนและเปรียบเทียบการกระจาย ในธุรกิจอาจใช้วิเคราะห์ข้อมูลการขายในแต่ละภูมิภาคหรือช่วงเวลา

  3. การวิจัยทางวิทยาศาสตร์: เพื่อนำเสนอผลลัพธ์และเปรียบเทียบกลุ่ม ตัวอย่างเช่น การเปรียบเทียบประสิทธิภาพของการรักษาที่แตกต่างกันในการศึกษาทางการแพทย์

  4. การควบคุมคุณภาพ: เพื่อติดตามตัวแปรในกระบวนการและระบุความผิดปกติ ในการผลิตอาจใช้ติดตามขนาดของผลิตภัณฑ์และตรวจสอบให้แน่ใจว่าตกอยู่ในช่วงที่ยอมรับได้

  5. การเงิน: เพื่อวิเคราะห์การเคลื่อนไหวของราคาหุ้นและเมตริกทางการเงินอื่น ๆ ตัวอย่างเช่น การเปรียบเทียบประสิทธิภาพของกองทุนรวมที่แตกต่างกันในช่วงเวลา

  6. วิทยาศาสตร์สิ่งแวดล้อม: เพื่อวิเคราะห์และเปรียบเทียบข้อมูลสิ่งแวดล้อม เช่น ระดับมลพิษหรือการเปลี่ยนแปลงอุณหภูมิในสถานที่หรือช่วงเวลาที่แตกต่างกัน

  7. การวิเคราะห์กีฬา: เพื่อเปรียบเทียบสถิติการแสดงของผู้เล่นระหว่างทีมต่าง ๆ หรือฤดูกาล

ทางเลือก

แม้ว่ากราฟกล่องจะเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการแสดงผลข้อมูล แต่ก็มีทางเลือกหลายอย่างขึ้นอยู่กับความต้องการเฉพาะของการวิเคราะห์:

  1. ฮิสโตแกรม: มีประโยชน์ในการแสดงการกระจายความถี่ของชุดข้อมูล พวกเขาให้รายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบของการกระจาย แต่ไม่อาจเปรียบเทียบชุดข้อมูลหลายชุดได้อย่างมีประสิทธิภาพ

  2. กราฟไวโอลิน: รวมคุณสมบัติของกราฟกล่องกับกราฟความหนาแน่นของเคอร์เนล แสดงความหนาแน่นของความน่าจะเป็นของข้อมูลที่ค่าต่าง ๆ

  3. กราฟกระจาย: เหมาะสำหรับการแสดงความสัมพันธ์ระหว่างสองตัวแปร ซึ่งกราฟกล่องไม่สามารถทำได้

  4. กราฟแท่ง: เหมาะสำหรับการเปรียบเทียบค่าคงที่ในหมวดหมู่ต่าง ๆ

  5. กราฟเส้น: มีประสิทธิภาพในการแสดงแนวโน้มตามเวลา ซึ่งกราฟกล่องไม่สามารถจับภาพได้ดี

  6. แผนที่ความร้อน: มีประโยชน์ในการแสดงข้อมูลที่ซับซ้อนที่มีหลายตัวแปร

การเลือกใช้ทางเลือกเหล่านี้ขึ้นอยู่กับลักษณะของข้อมูลและข้อมูลเชิงลึกเฉพาะที่ต้องการสื่อสาร

ประวัติ

กราฟกล่องถูกคิดค้นโดย John Tukey ในปี 1970 และปรากฏครั้งแรกในหนังสือของเขา "Exploratory Data Analysis" ในปี 1977 การออกแบบดั้งเดิมของ Tukey เรียกว่า "กราฟสัญลักษณ์" แสดงเฉพาะมัธยฐาน ควอไทล์ และค่าขั้นสูงสุด

การพัฒนาที่สำคัญในประวัติศาสตร์ของกราฟกล่องรวมถึง:

  1. 1978: McGill, Tukey, และ Larsen แนะนำกราฟกล่องที่มีรอยหยัก ซึ่งเพิ่มช่วงความเชื่อมั่นสำหรับมัธยฐาน

  2. 1980s: แนวคิดของ "จุดเบี่ยงเบน" ในกราฟกล่องเริ่มมีมาตรฐานมากขึ้น โดยทั่วไปจะกำหนดว่าเป็นจุดที่อยู่นอก 1.5 เท่าของ IQR จากควอไทล์

  3. 1990s-2000s: ด้วยการเกิดขึ้นของกราฟิกคอมพิวเตอร์ รูปแบบต่าง ๆ เช่น กราฟกล่องที่มีความกว้างแตกต่างกันและกราฟไวโอลินได้รับการพัฒนา

  4. ปัจจุบัน: กราฟกล่องที่โต้ตอบได้และมีพลศาสตร์ได้กลายเป็นเรื่องปกติในซอฟต์แวร์การแสดงข้อมูล ช่วยให้ผู้ใช้สำรวจจุดข้อมูลพื้นฐานได้

กราฟกล่องยังคงยืนหยัดต่อเวลาเนื่องจากความเรียบง่ายและประสิทธิภาพในการสรุปชุดข้อมูลที่ซับซ้อน พวกเขายังคงเป็นเครื่องมือหลักในด้านการวิเคราะห์ข้อมูลในหลายสาขา

โค้ดตัวอย่าง

นี่คือตัวอย่างวิธีการสร้างกราฟกล่องในหลายภาษาโปรแกรม:

1=QUARTILE(A1:A100,1)  ' Q1
2=MEDIAN(A1:A100)      ' มัธยฐาน
3=QUARTILE(A1:A100,3)  ' Q3
4=MIN(A1:A100)         ' ค่าต่ำสุด
5=MAX(A1:A100)         ' ค่ามากสุด
6

อ้างอิง

  1. Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.
  2. McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of Box Plots. The American Statistician, 32(1), 12-16.
  3. Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). The box plot: a simple visual method to interpret data. Annals of internal medicine, 110(11), 916-921.
  4. Wickham, H., & Stryjewski, L. (2011). 40 years of boxplots. Technical report, had.co.nz.
  5. Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). Some Implementations of the Boxplot. The American Statistician, 43(1), 50-54.