Whiz Tools

باکس پلاٹ کیلکولیٹر

باکس پلاٹ کیلکولیٹر

باکس پلاٹ کیلکولیٹر

تعارف

باکس پلاٹ، جسے باکس اینڈ وسکر پلاٹ بھی کہا جاتا ہے، ایک معیاری طریقہ ہے جو پانچ عددی خلاصے کی بنیاد پر ڈیٹا کی تقسیم کو ظاہر کرنے کے لیے استعمال ہوتا ہے: کم از کم، پہلا کوارٹائل (Q1)، میڈین، تیسرا کوارٹائل (Q3)، اور زیادہ سے زیادہ۔ یہ کیلکولیٹر آپ کو دی گئی عددی ڈیٹا کے سیٹ سے باکس پلاٹ تیار کرنے کی اجازت دیتا ہے، جو ڈیٹا کی بصری نمائندگی اور تجزیے کے لیے ایک طاقتور ٹول فراہم کرتا ہے۔

اس کیلکولیٹر کا استعمال کیسے کریں

  1. اپنے ڈیٹا کو ان پٹ فیلڈ میں کاما یا اسپیس سے جدا کردہ عددوں کی فہرست کے طور پر درج کریں۔
  2. کیلکولیٹر خود بخود باکس پلاٹ کے اعدادوشمار کا حساب کرے گا اور نتائج دکھائے گا۔
  3. نتائج کے نیچے باکس پلاٹ کی بصری نمائندگی دکھائی جائے گی۔
  4. آپ "نتیجہ کاپی کریں" کے بٹن کا استعمال کرتے ہوئے حساب شدہ نتائج کو کاپی کر سکتے ہیں۔

فارمولہ

باکس پلاٹ کی کیلکولیشن میں استعمال ہونے والے اہم فارمولے یہ ہیں:

  1. میڈین (Q2): n عناصر کے ترتیب دیے گئے ڈیٹا سیٹ کے لیے،

    x_{\frac{n+1}{2}} & \text{اگر n طاق ہے} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{اگر n جفت ہے} \end{cases} $$
  2. پہلا کوارٹائل (Q1) اور تیسرا کوارٹائل (Q3): Q1=ڈیٹا کے نچلے نصف کا میڈینQ1 = \text{ڈیٹا کے نچلے نصف کا میڈین} Q3=ڈیٹا کے اوپر نصف کا میڈینQ3 = \text{ڈیٹا کے اوپر نصف کا میڈین}

  3. انٹرکوارٹائل رینج (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. وسکرز: Lower Whisker=max(min(x),Q11.5IQR)\text{Lower Whisker} = \max({\min(x), Q1 - 1.5 * IQR}) Upper Whisker=min(max(x),Q3+1.5IQR)\text{Upper Whisker} = \min({\max(x), Q3 + 1.5 * IQR})

  5. آؤٹ لائرز: وہ ڈیٹا پوائنٹس جو Lower Whisker سے نیچے یا Upper Whisker سے اوپر ہیں۔

حساب کتاب

کیلکولیٹر باکس پلاٹ تیار کرنے کے لیے درج ذیل مراحل انجام دیتا ہے:

  1. ان پٹ ڈیٹا کو ترتیب میں چنیں۔
  2. میڈین (Q2) کا حساب کریں:
    • اگر ڈیٹا پوائنٹس کی تعداد طاق ہے تو میڈین وسطی قیمت ہوتی ہے۔
    • اگر ڈیٹا پوائنٹس کی تعداد جفت ہے تو میڈین دو وسطی قیمتوں کا اوسط ہوتا ہے۔
  3. پہلے کوارٹائل (Q1) کا حساب کریں:
    • یہ ڈیٹا کے نچلے نصف کا میڈین ہے۔
    • اگر ڈیٹا پوائنٹس کی تعداد طاق ہے تو میڈین کو کسی بھی نصف میں شامل نہیں کیا جاتا۔
  4. تیسرے کوارٹائل (Q3) کا حساب کریں:
    • یہ ڈیٹا کے اوپر نصف کا میڈین ہے۔
    • اگر ڈیٹا پوائنٹس کی تعداد طاق ہے تو میڈین کو کسی بھی نصف میں شامل نہیں کیا جاتا۔
  5. انٹرکوارٹائل رینج (IQR) کا حساب کریں = Q3 - Q1۔
  6. وسکرز کا تعین کریں:
    • Lower whisker: سب سے چھوٹا ڈیٹا پوائنٹ جو Q1 - 1.5 * IQR سے بڑا یا اس کے برابر ہو
    • Upper whisker: سب سے بڑا ڈیٹا پوائنٹ جو Q3 + 1.5 * IQR سے چھوٹا یا اس کے برابر ہو
  7. آؤٹ لائرز کی شناخت کریں: وہ ڈیٹا پوائنٹس جو Lower Whisker سے نیچے یا Upper Whisker سے اوپر ہیں۔

یہ نوٹ کرنا اہم ہے کہ کوارٹائلز کے حساب کے لیے مختلف طریقے ہیں، خاص طور پر جب جفت تعداد میں عناصر والے ڈیٹا سیٹس کی بات ہو۔ اوپر بیان کردہ طریقہ "خارجی" طریقہ کہلاتا ہے، لیکن "شامل" طریقہ یا "میڈین آف میڈینز" طریقہ بھی استعمال کیا جا سکتا ہے۔ طریقے کا انتخاب Q1 اور Q3 کی جگہ کو تھوڑا متاثر کر سکتا ہے، خاص طور پر چھوٹے ڈیٹا سیٹس کے لیے۔

تشریح

Q3 میڈین Q1 کم از کم زیادہ سے زیادہ باکس پلاٹ کے اجزاء
  • پلاٹ میں باکس انٹرکوارٹائل رینج (IQR) کی نمائندگی کرتا ہے، باکس کے نیچے Q1 اور اوپر Q3 پر ہوتا ہے۔
  • باکس کے اندر کی لائن میڈین (Q2) کی نمائندگی کرتی ہے۔
  • وسکرز باکس سے کم از کم اور زیادہ سے زیادہ قیمتوں تک پھیلتے ہیں، آؤٹ لائرز کو چھوڑ کر۔
  • آؤٹ لائرز انفرادی پوائنٹس کے طور پر وسکرز کے پار دکھائے جاتے ہیں۔

باکس پلاٹ ڈیٹا کے بارے میں کئی بصیرتیں فراہم کرتا ہے:

  • مرکزی رجحان: میڈین ڈیٹا سیٹ کی مرکزی قیمت کو ظاہر کرتا ہے۔
  • تغیر: IQR اور کم از کم سے زیادہ سے زیادہ تک کی مجموعی پھیلاؤ ڈیٹا کی پھیلاؤ کو ظاہر کرتی ہے۔
  • جھکاؤ: اگر میڈین باکس کے اندر مرکز میں نہیں ہے تو یہ ڈیٹا میں جھکاؤ کی نشاندہی کرتا ہے۔
  • آؤٹ لائرز: وسکرز سے باہر کے پوائنٹس ممکنہ آؤٹ لائرز یا انتہائی قیمتوں کو اجاگر کرتے ہیں۔

استعمال کے کیس

باکس پلاٹس مختلف شعبوں میں مفید ہیں، بشمول:

  1. اعدادوشمار: ڈیٹا کی تقسیم اور جھکاؤ کو بصری طور پر ظاہر کرنے کے لیے۔ مثال کے طور پر، مختلف اسکولوں یا کلاسوں کے درمیان امتحانی نتائج کا موازنہ کرنا۔

  2. ڈیٹا تجزیہ: آؤٹ لائرز کی شناخت اور تقسیموں کا موازنہ کرنا۔ کاروبار میں، یہ مختلف علاقوں یا وقت کی مدت میں سیلز ڈیٹا کا تجزیہ کرنے کے لیے استعمال ہو سکتا ہے۔

  3. سائنسی تحقیق: نتائج پیش کرنے اور گروپوں کا موازنہ کرنے کے لیے۔ مثال کے طور پر، طبی مطالعات میں مختلف علاج کی مؤثریت کا موازنہ کرنا۔

  4. معیار کنٹرول: عمل کے متغیرات کی نگرانی اور بے قاعدگیوں کی شناخت کرنا۔ مینوفیکچرنگ میں، یہ مصنوعات کے ابعاد کو ٹریک کرنے کے لیے استعمال ہو سکتا ہے اور یہ یقینی بناتا ہے کہ وہ قابل قبول حدود میں ہیں۔

  5. مالیات: اسٹاک کی قیمتوں کی حرکات اور دیگر مالیاتی میٹرکس کا تجزیہ کرنا۔ مثال کے طور پر، مختلف میوچل فنڈز کی کارکردگی کا وقت کے ساتھ موازنہ کرنا۔

  6. ماحولیاتی سائنس: ماحولیاتی ڈیٹا کا تجزیہ اور موازنہ کرنا، جیسے مختلف مقامات یا وقت کی مدت کے دوران آلودگی کی سطح یا درجہ حرارت کی تبدیلیاں۔

  7. کھیلوں کی تجزیات: ٹیموں یا سیزن کے درمیان کھلاڑی کی کارکردگی کے اعدادوشمار کا موازنہ کرنا۔

متبادل

اگرچہ باکس پلاٹس ڈیٹا کی بصری نمائندگی کے لیے طاقتور ٹول ہیں، تجزیے کی مخصوص ضروریات کے لحاظ سے کئی متبادل ہیں:

  1. ہسٹگرام: ڈیٹا سیٹ کی تعدادی تقسیم کو ظاہر کرنے کے لیے مفید۔ یہ تقسیم کی شکل کے بارے میں مزید تفصیلات فراہم کرتے ہیں لیکن کئی ڈیٹا سیٹس کا موازنہ کرنے کے لیے کم موثر ہو سکتے ہیں۔

  2. وایولن پلاٹس: باکس پلاٹس کی خصوصیات کو کرنل کثافت پلاٹس کے ساتھ ملا دیتے ہیں، جو مختلف قیمتوں پر ڈیٹا کی احتمال کی کثافت کو ظاہر کرتے ہیں۔

  3. اسکیٹر پلاٹس: دو متغیرات کے درمیان تعلق کو ظاہر کرنے کے لیے مثالی، جو باکس پلاٹس نہیں کر سکتے۔

  4. بار چارٹس: مختلف زمرے میں ایک ہی قیمتوں کا موازنہ کرنے کے لیے موزوں۔

  5. لائن گراف: وقت کے ساتھ رجحانات کو ظاہر کرنے کے لیے مؤثر، جو باکس پلاٹس اچھی طرح سے نہیں پکڑتے۔

  6. ہیٹ میپس: پیچیدہ ڈیٹا سیٹس کی بصری نمائندگی کے لیے مفید جو متعدد متغیرات رکھتے ہیں۔

ان متبادلات کے درمیان انتخاب ڈیٹا کی نوعیت اور ان بصیرتوں پر منحصر ہے جو ایک شخص پیش کرنا چاہتا ہے۔

تاریخ

باکس پلاٹ کی تخلیق جان ٹوکی نے 1970 میں کی تھی اور یہ پہلی بار 1977 میں ان کی کتاب "ایکسپلوریٹری ڈیٹا اینالسس" میں ظاہر ہوا۔ ٹوکی کا اصل ڈیزائن، جسے "سکیماٹک پلاٹ" کہا جاتا ہے، نے صرف میڈین، کوارٹائلز، اور انتہائی قیمتوں کو ظاہر کیا۔

باکس پلاٹس کی تاریخ میں اہم ترقیات میں شامل ہیں:

  1. 1978: میک گل، ٹوکی، اور لارسن نے نوچڈ باکس پلاٹ متعارف کرایا، جو میڈین کے لیے اعتماد کے وقفے کو شامل کرتا ہے۔

  2. 1980 کی دہائی: باکس پلاٹس میں "آؤٹ لائرز" کا تصور زیادہ معیاری بن گیا، عام طور پر 1.5 بار IQR سے باہر کے پوائنٹس کے طور پر بیان کیا جاتا ہے۔

  3. 1990 کی دہائی-2000 کی دہائی: کمپیوٹر گرافکس کے آغاز کے ساتھ، متغیر چوڑائی کے باکس پلاٹس اور وایولن پلاٹس جیسے مختلف طریقے تیار کیے گئے۔

  4. موجودہ دور: انٹرایکٹو اور متحرک باکس پلاٹس ڈیٹا بصریاتی سافٹ ویئر میں عام ہو گئے ہیں، جو صارفین کو بنیادی ڈیٹا پوائنٹس کی کھوج کرنے کی اجازت دیتے ہیں۔

باکس پلاٹس نے اپنی سادگی اور پیچیدہ ڈیٹا سیٹس کو خلاصہ کرنے کی مؤثریت کی بدولت وقت کی کسوٹی پر پورا اترنے کی کوشش کی ہے۔ یہ کئی شعبوں میں ڈیٹا تجزیے میں ایک اہم حیثیت رکھتے ہیں۔

کوڈ کے ٹکڑے

یہاں مختلف پروگرامنگ زبانوں میں باکس پلاٹ بنانے کے طریقے کی مثالیں ہیں:

=QUARTILE(A1:A100,1)  ' Q1
=MEDIAN(A1:A100)      ' میڈین
=QUARTILE(A1:A100,3)  ' Q3
=MIN(A1:A100)         ' کم از کم
=MAX(A1:A100)         ' زیادہ سے زیادہ
## فرض کریں 'data' آپ کی عددوں کی ویکٹر ہے
boxplot(data)
% فرض کریں 'data' آپ کی عددوں کی ویکٹر ہے
boxplot(data)
// D3.js کا استعمال کرتے ہوئے
var svg = d3.select("body").append("svg")
    .attr("width", 400)
    .attr("height", 300);

var data = [/* آپ کا ڈیٹا ایری */];

var boxplot = svg.append("g")
    .datum(data)
    .call(d3.boxplot());
import matplotlib.pyplot as plt
import numpy as np

data = [/* آپ کا ڈیٹا ایری */]
plt.boxplot(data)
plt.show()
import org.jfree.chart.ChartFactory;
import org.jfree.chart.ChartPanel;
import org.jfree.chart.JFreeChart;
import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;

DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
dataset.add(Arrays.asList(/* آپ کا ڈیٹا */), "سیرئز 1", "زمرہ 1");

JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
    "باکس پلاٹ", "زمرہ", "قیمت", dataset, true);

حوالہ جات

  1. Tukey, J. W. (1977). ایکسپلوریٹری ڈیٹا اینالسس. ایڈیسن-ویلی۔
  2. McGill, R., Tukey, J. W., & Larsen, W. A. (1978). باکس پلاٹس کی مختلف اقسام. دی امریکن اسٹیٹسٹیشن، 32(1)، 12-16۔
  3. Williamson, D. F., Parker, R. A., & Kendrick, J. S. (1989). باکس پلاٹ: ڈیٹا کی تشریح کا ایک سادہ بصری طریقہ. اینلز آف انٹرنل میڈیسن، 110(11)، 916-921۔
  4. Wickham, H., & Stryjewski, L. (2011). باکس پلاٹس کے 40 سال. تکنیکی رپورٹ، had.co.nz۔
  5. Frigge, M., Hoaglin, D. C., & Iglewicz, B. (1989). باکس پلاٹ کے کچھ نفاذ. دی امریکن اسٹیٹسٹیشن، 43(1)، 50-54۔
رائے