اپنے ڈیٹا سیٹ کا بصری تجزیہ باکس اور وسکر پلاٹ کا استعمال کرتے ہوئے تیار کریں۔ یہ ٹول اہم شماریاتی اقدامات جیسے کہ کوارٹائلز، اوسط، اور آؤٹ لائرز کا حساب لگاتا ہے اور دکھاتا ہے۔
باکس پلاٹ، جسے باکس اینڈ وسکر پلاٹ بھی کہا جاتا ہے، ایک معیاری طریقہ ہے جو پانچ عددی خلاصے کی بنیاد پر ڈیٹا کی تقسیم کو ظاہر کرنے کے لیے استعمال ہوتا ہے: کم از کم، پہلا کوارٹائل (Q1)، میڈین، تیسرا کوارٹائل (Q3)، اور زیادہ سے زیادہ۔ یہ کیلکولیٹر آپ کو دی گئی عددی ڈیٹا کے سیٹ سے باکس پلاٹ تیار کرنے کی اجازت دیتا ہے، جو ڈیٹا کی بصری نمائندگی اور تجزیے کے لیے ایک طاقتور ٹول فراہم کرتا ہے۔
باکس پلاٹ کی کیلکولیشن میں استعمال ہونے والے اہم فارمولے یہ ہیں:
میڈین (Q2): n عناصر کے ترتیب دیے گئے ڈیٹا سیٹ کے لیے،
x_{\frac{n+1}{2}} & \text{اگر n طاق ہے} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{اگر n جفت ہے} \end{cases} $$پہلا کوارٹائل (Q1) اور تیسرا کوارٹائل (Q3):
انٹرکوارٹائل رینج (IQR):
وسکرز:
آؤٹ لائرز: وہ ڈیٹا پوائنٹس جو Lower Whisker سے نیچے یا Upper Whisker سے اوپر ہیں۔
کیلکولیٹر باکس پلاٹ تیار کرنے کے لیے درج ذیل مراحل انجام دیتا ہے:
یہ نوٹ کرنا اہم ہے کہ کوارٹائلز کے حساب کے لیے مختلف طریقے ہیں، خاص طور پر جب جفت تعداد میں عناصر والے ڈیٹا سیٹس کی بات ہو۔ اوپر بیان کردہ طریقہ "خارجی" طریقہ کہلاتا ہے، لیکن "شامل" طریقہ یا "میڈین آف میڈینز" طریقہ بھی استعمال کیا جا سکتا ہے۔ طریقے کا انتخاب Q1 اور Q3 کی جگہ کو تھوڑا متاثر کر سکتا ہے، خاص طور پر چھوٹے ڈیٹا سیٹس کے لیے۔
باکس پلاٹ ڈیٹا کے بارے میں کئی بصیرتیں فراہم کرتا ہے:
باکس پلاٹس مختلف شعبوں میں مفید ہیں، بشمول:
اعدادوشمار: ڈیٹا کی تقسیم اور جھکاؤ کو بصری طور پر ظاہر کرنے کے لیے۔ مثال کے طور پر، مختلف اسکولوں یا کلاسوں کے درمیان امتحانی نتائج کا موازنہ کرنا۔
ڈیٹا تجزیہ: آؤٹ لائرز کی شناخت اور تقسیموں کا موازنہ کرنا۔ کاروبار میں، یہ مختلف علاقوں یا وقت کی مدت میں سیلز ڈیٹا کا تجزیہ کرنے کے لیے استعمال ہو سکتا ہے۔
سائنسی تحقیق: نتائج پیش کرنے اور گروپوں کا موازنہ کرنے کے لیے۔ مثال کے طور پر، طبی مطالعات میں مختلف علاج کی مؤثریت کا موازنہ کرنا۔
معیار کنٹرول: عمل کے متغیرات کی نگرانی اور بے قاعدگیوں کی شناخت کرنا۔ مینوفیکچرنگ میں، یہ مصنوعات کے ابعاد کو ٹریک کرنے کے لیے استعمال ہو سکتا ہے اور یہ یقینی بناتا ہے کہ وہ قابل قبول حدود میں ہیں۔
مالیات: اسٹاک کی قیمتوں کی حرکات اور دیگر مالیاتی میٹرکس کا تجزیہ کرنا۔ مثال کے طور پر، مختلف میوچل فنڈز کی کارکردگی کا وقت کے ساتھ موازنہ کرنا۔
ماحولیاتی سائنس: ماحولیاتی ڈیٹا کا تجزیہ اور موازنہ کرنا، جیسے مختلف مقامات یا وقت کی مدت کے دوران آلودگی کی سطح یا درجہ حرارت کی تبدیلیاں۔
کھیلوں کی تجزیات: ٹیموں یا سیزن کے درمیان کھلاڑی کی کارکردگی کے اعدادوشمار کا موازنہ کرنا۔
اگرچہ باکس پلاٹس ڈیٹا کی بصری نمائندگی کے لیے طاقتور ٹول ہیں، تجزیے کی مخصوص ضروریات کے لحاظ سے کئی متبادل ہیں:
ہسٹگرام: ڈیٹا سیٹ کی تعدادی تقسیم کو ظاہر کرنے کے لیے مفید۔ یہ تقسیم کی شکل کے بارے میں مزید تفصیلات فراہم کرتے ہیں لیکن کئی ڈیٹا سیٹس کا موازنہ کرنے کے لیے کم موثر ہو سکتے ہیں۔
وایولن پلاٹس: باکس پلاٹس کی خصوصیات کو کرنل کثافت پلاٹس کے ساتھ ملا دیتے ہیں، جو مختلف قیمتوں پر ڈیٹا کی احتمال کی کثافت کو ظاہر کرتے ہیں۔
اسکیٹر پلاٹس: دو متغیرات کے درمیان تعلق کو ظاہر کرنے کے لیے مثالی، جو باکس پلاٹس نہیں کر سکتے۔
بار چارٹس: مختلف زمرے میں ایک ہی قیمتوں کا موازنہ کرنے کے لیے موزوں۔
لائن گراف: وقت کے ساتھ رجحانات کو ظاہر کرنے کے لیے مؤثر، جو باکس پلاٹس اچھی طرح سے نہیں پکڑتے۔
ہیٹ میپس: پیچیدہ ڈیٹا سیٹس کی بصری نمائندگی کے لیے مفید جو متعدد متغیرات رکھتے ہیں۔
ان متبادلات کے درمیان انتخاب ڈیٹا کی نوعیت اور ان بصیرتوں پر منحصر ہے جو ایک شخص پیش کرنا چاہتا ہے۔
باکس پلاٹ کی تخلیق جان ٹوکی نے 1970 میں کی تھی اور یہ پہلی بار 1977 میں ان کی کتاب "ایکسپلوریٹری ڈیٹا اینالسس" میں ظاہر ہوا۔ ٹوکی کا اصل ڈیزائن، جسے "سکیماٹک پلاٹ" کہا جاتا ہے، نے صرف میڈین، کوارٹائلز، اور انتہائی قیمتوں کو ظاہر کیا۔
باکس پلاٹس کی تاریخ میں اہم ترقیات میں شامل ہیں:
1978: میک گل، ٹوکی، اور لارسن نے نوچڈ باکس پلاٹ متعارف کرایا، جو میڈین کے لیے اعتماد کے وقفے کو شامل کرتا ہے۔
1980 کی دہائی: باکس پلاٹس میں "آؤٹ لائرز" کا تصور زیادہ معیاری بن گیا، عام طور پر 1.5 بار IQR سے باہر کے پوائنٹس کے طور پر بیان کیا جاتا ہے۔
1990 کی دہائی-2000 کی دہائی: کمپیوٹر گرافکس کے آغاز کے ساتھ، متغیر چوڑائی کے باکس پلاٹس اور وایولن پلاٹس جیسے مختلف طریقے تیار کیے گئے۔
موجودہ دور: انٹرایکٹو اور متحرک باکس پلاٹس ڈیٹا بصریاتی سافٹ ویئر میں عام ہو گئے ہیں، جو صارفین کو بنیادی ڈیٹا پوائنٹس کی کھوج کرنے کی اجازت دیتے ہیں۔
باکس پلاٹس نے اپنی سادگی اور پیچیدہ ڈیٹا سیٹس کو خلاصہ کرنے کی مؤثریت کی بدولت وقت کی کسوٹی پر پورا اترنے کی کوشش کی ہے۔ یہ کئی شعبوں میں ڈیٹا تجزیے میں ایک اہم حیثیت رکھتے ہیں۔
یہاں مختلف پروگرامنگ زبانوں میں باکس پلاٹ بنانے کے طریقے کی مثالیں ہیں:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' میڈین
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' کم از کم
5=MAX(A1:A100) ' زیادہ سے زیادہ
6
1## فرض کریں 'data' آپ کی عددوں کی ویکٹر ہے
2boxplot(data)
3
1% فرض کریں 'data' آپ کی عددوں کی ویکٹر ہے
2boxplot(data)
3
1// D3.js کا استعمال کرتے ہوئے
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* آپ کا ڈیٹا ایری */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* آپ کا ڈیٹا ایری */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* آپ کا ڈیٹا */), "سیرئز 1", "زمرہ 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "باکس پلاٹ", "زمرہ", "قیمت", dataset, true);
11
آپ کے ورک فلو کے لیے مفید ہونے والے مزید ٹولز کا انعام کریں