Whiz Tools

বক্স প্লট ক্যালকুলেটর

বক্স প্লট ক্যালকুলেটর

বক্স প্লট ক্যালকুলেটর

পরিচিতি

বক্স প্লট, যা বক্স-এন্ড-উইস্কার প্লট নামেও পরিচিত, একটি পাঁচ-সংখ্যার সারসংক্ষেপের ভিত্তিতে তথ্যের বিতরণ প্রদর্শনের একটি মানক উপায়: ন্যূনতম, প্রথম কোয়ার্টাইল (Q1), মিডিয়ান, তৃতীয় কোয়ার্টাইল (Q3), এবং সর্বাধিক। এই ক্যালকুলেটর আপনাকে একটি নির্দিষ্ট সংখ্যার ডেটা থেকে একটি বক্স প্লট তৈরি করতে দেয়, যা তথ্য ভিজ্যুয়ালাইজেশন এবং বিশ্লেষণের জন্য একটি শক্তিশালী সরঞ্জাম।

এই ক্যালকুলেটরটি কীভাবে ব্যবহার করবেন

  1. ইনপুট ফিল্ডে সংখ্যার একটি কমা বা স্পেস দ্বারা পৃথক তালিকা হিসাবে আপনার ডেটা প্রবেশ করুন।
  2. ক্যালকুলেটর স্বয়ংক্রিয়ভাবে বক্স প্লট পরিসংখ্যান গণনা করবে এবং ফলাফলগুলি প্রদর্শন করবে।
  3. ফলাফলের নিচে বক্স প্লটের একটি ভিজ্যুয়াল উপস্থাপনা দেখানো হবে।
  4. আপনি "ফলাফল কপি করুন" বোতামটি ব্যবহার করে গণনা করা ফলাফলগুলি কপি করতে পারেন।

সূত্র

বক্স প্লট গণনার জন্য ব্যবহৃত মূল সূত্রগুলি হল:

  1. মিডিয়ান (Q2): n উপাদানের একটি অর্ডার করা ডেটাসেটের জন্য,

    x_{\frac{n+1}{2}} & \text{যদি n বিজোড়} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{যদি n জোড়} \end{cases} $$
  2. প্রথম কোয়ার্টাইল (Q1) এবং তৃতীয় কোয়ার্টাইল (Q3): Q1=ডেটার নিম্নার্ধের মিডিয়ানQ1 = \text{ডেটার নিম্নার্ধের মিডিয়ান} Q3=ডেটার উচ্চার্ধের মিডিয়ানQ3 = \text{ডেটার উচ্চার্ধের মিডিয়ান}

  3. ইন্টারকোয়ার্টাইল রেঞ্জ (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. উইস্কার: নিম্ন উইস্কার=max(min(x),Q11.5IQR)\text{নিম্ন উইস্কার} = \max({\min(x), Q1 - 1.5 * IQR}) উচ্চ উইস্কার=min(max(x),Q3+1.5IQR)\text{উচ্চ উইস্কার} = \min({\max(x), Q3 + 1.5 * IQR})

  5. আউটলায়ার: নিম্ন উইস্কারের নিচে বা উচ্চ উইস্কারের উপরে থাকা যেকোনো ডেটা পয়েন্ট।

গণনা

ক্যালকুলেটরটি বক্স প্লট তৈরি করতে নিম্নলিখিত পদক্ষেপগুলি সম্পাদন করে:

  1. ইনপুট ডেটা বাড়তি ক্রমে সাজান।
  2. মিডিয়ান (Q2) গণনা করুন:
    • যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান হল মধ্যম মান।
    • যদি ডেটা পয়েন্টের সংখ্যা জোড় হয়, তবে মিডিয়ান হল দুইটি মধ্যম মানের গড়।
  3. প্রথম কোয়ার্টাইল (Q1) গণনা করুন:
    • এটি ডেটার নিম্নার্ধের মিডিয়ান।
    • যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান কোনও অর্ধে অন্তর্ভুক্ত হয় না।
  4. তৃতীয় কোয়ার্টাইল (Q3) গণনা করুন:
    • এটি ডেটার উচ্চার্ধের মিডিয়ান।
    • যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান কোনও অর্ধে অন্তর্ভুক্ত হয় না।
  5. ইন্টারকোয়ার্টাইল রেঞ্জ (IQR) গণনা করুন = Q3 - Q1।
  6. উইস্কার নির্ধারণ করুন:
    • নিম্ন উইস্কার: Q1 - 1.5 * IQR এর চেয়ে বড় বা সমান সবচেয়ে ছোট ডেটা পয়েন্ট
    • উচ্চ উইস্কার: Q3 + 1.5 * IQR এর চেয়ে কম বা সমান সবচেয়ে বড় ডেটা পয়েন্ট
  7. আউটলায়ার চিহ্নিত করুন: নিম্ন উইস্কারের নিচে বা উচ্চ উইস্কারের উপরে থাকা যেকোনো ডেটা পয়েন্ট।

এটি লক্ষ্য করা গুরুত্বপূর্ণ যে কোয়ার্টাইল গণনার জন্য বিভিন্ন পদ্ধতি রয়েছে, বিশেষত এমন ডেটাসেটগুলি পরিচালনা করার সময় যেগুলির একটি জোড় সংখ্যা রয়েছে। উপরের বর্ণিত পদ্ধতিটি "এক্সক্লুসিভ" পদ্ধতি নামে পরিচিত, তবে "ইনক্লুসিভ" পদ্ধতি বা "মিডিয়ান অফ মিডিয়ানস" পদ্ধতি ব্যবহার করা যেতে পারে। পদ্ধতির নির্বাচন Q1 এবং Q3 এর অবস্থানে সামান্য প্রভাব ফেলতে পারে, বিশেষত ছোট ডেটাসেটগুলির জন্য।

ব্যাখ্যা

Q3 মিডিয়ান Q1 ন্যূনতম সর্বাধিক বক্স প্লট উপাদানসমূহ
  • প্লটে বক্সটি ইন্টারকোয়ার্টাইল রেঞ্জ (IQR) প্রতিনিধিত্ব করে, বক্সের নিচের অংশ Q1 এ এবং উপরের অংশ Q3 এ।
  • বক্সের ভিতরের লাইন মিডিয়ান (Q2) প্রতিনিধিত্ব করে।
  • উইস্কারগুলি বক্স থেকে ন্যূনতম এবং সর্বাধিক মানে প্রসারিত হয়, আউটলায়ারগুলি বাদ দিয়ে।
  • আউটলায়ারগুলি উইস্কারের বাইরে পৃথক পয়েন্ট হিসাবে চিত্রিত হয়।

বক্স প্লট তথ্য সম্পর্কে বেশ কয়েকটি অন্তর্দৃষ্টি প্রদান করে:

  • কেন্দ্রীয় প্রবণতা: মিডিয়ান ডেটাসেটের কেন্দ্রীয় মান দেখায়।
  • পরিবর্তনশীলতা: IQR এবং সর্বনিম্ন থেকে সর্বাধিক পর্যন্ত সামগ্রিক বিস্তার তথ্যের ছড়িয়ে পড়া দেখায়।
  • তির্যকতা: যদি মিডিয়ান বক্সের মধ্যে কেন্দ্রীভূত না হয়, তবে এটি তথ্যের তির্যকতা নির্দেশ করে।
  • আউটলায়ার: উইস্কারের বাইরে পয়েন্টগুলি সম্ভাব্য আউটলায়ার বা চরম মানগুলিকে হাইলাইট করে।

ব্যবহার ক্ষেত্র

বক্স প্লট বিভিন্ন ক্ষেত্রে উপকারী, যেমন:

  1. পরিসংখ্যান: তথ্যের বিতরণ এবং তির্যকতা ভিজ্যুয়ালাইজ করতে। উদাহরণস্বরূপ, বিভিন্ন স্কুল বা ক্লাসের মধ্যে পরীক্ষার স্কোর তুলনা করা।

  2. তথ্য বিশ্লেষণ: আউটলায়ার চিহ্নিত করতে এবং বিতরণ তুলনা করতে। ব্যবসায়, এটি বিভিন্ন অঞ্চলে বা সময়ের মধ্যে বিক্রয় ডেটা বিশ্লেষণ করতে ব্যবহৃত হতে পারে।

  3. বৈজ্ঞানিক গবেষণা: ফলাফল উপস্থাপন এবং গোষ্ঠীগুলির তুলনা করতে। উদাহরণস্বরূপ, চিকিৎসা গবেষণায় বিভিন্ন চিকিৎসার কার্যকারিতা তুলনা করা।

  4. গুণমান নিয়ন্ত্রণ: প্রক্রিয়া পরিবর্তনশীলগুলি পর্যবেক্ষণ করতে এবং অস্বাভাবিকতা চিহ্নিত করতে। উৎপাদনে, এটি পণ্যের মাত্রা ট্র্যাক করতে এবং নিশ্চিত করতে ব্যবহৃত হতে পারে যে তারা গ্রহণযোগ্য পরিসরের মধ্যে পড়ে।

  5. অর্থনীতি: শেয়ারের মূল্য আন্দোলন এবং অন্যান্য আর্থিক পরিমাপ বিশ্লেষণ করতে। উদাহরণস্বরূপ, সময়ের সাথে সাথে বিভিন্ন মিউচুয়াল ফান্ডের কার্যকারিতা তুলনা করা।

  6. পরিবেশ বিজ্ঞান: পরিবেশগত তথ্য বিশ্লেষণ এবং তুলনা করতে, যেমন বিভিন্ন অবস্থান বা সময়ের মধ্যে দূষণের স্তর বা তাপমাত্রার পরিবর্তন।

  7. ক্রীড়া বিশ্লেষণ: দল বা মৌসুমের মধ্যে খেলোয়াড়ের কার্যকারিতা পরিসংখ্যান তুলনা করতে।

বিকল্প

যদিও বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশনের জন্য শক্তিশালী সরঞ্জাম, তবে বিশ্লেষণের নির্দিষ্ট প্রয়োজনীয়তার উপর নির্ভর করে কয়েকটি বিকল্প রয়েছে:

  1. হিস্টোগ্রাম: একটি ডেটাসেটের ফ্রিকোয়েন্সি বিতরণ দেখানোর জন্য উপকারী। তারা বিতরণের আকার সম্পর্কে আরও বিস্তারিত তথ্য প্রদান করে তবে একাধিক ডেটাসেট তুলনা করার জন্য কম কার্যকর হতে পারে।

  2. ভায়োলিন প্লট: বক্স প্লটের বৈশিষ্ট্যগুলি কেরনেল ঘনত্ব প্লটের সাথে সংমিশ্রণ করে, বিভিন্ন মানে ডেটার সম্ভাব্য ঘনত্ব দেখায়।

  3. স্ক্যাটার প্লট: দুটি ভেরিয়েবলের মধ্যে সম্পর্ক দেখানোর জন্য আদর্শ, যা বক্স প্লটগুলি করতে পারে না।

  4. বার চার্ট: বিভিন্ন ক্যাটাগরির মধ্যে একক মান তুলনা করার জন্য উপযুক্ত।

  5. লাইন গ্রাফ: সময়ের সাথে সাথে প্রবণতা দেখানোর জন্য কার্যকর, যা বক্স প্লটগুলি ভালভাবে ক্যাপচার করে না।

  6. হিটম্যাপ: একাধিক ভেরিয়েবলের সাথে জটিল ডেটাসেটগুলি ভিজ্যুয়ালাইজ করার জন্য উপকারী।

এই বিকল্পগুলির মধ্যে নির্বাচন ডেটার প্রকৃতি এবং যে নির্দিষ্ট অন্তর্দৃষ্টি এক প্রকাশ করতে চায় তার উপর নির্ভর করে।

ইতিহাস

বক্স প্লট 1970 সালে জন টুকি দ্বারা আবিষ্কৃত হয় এবং 1977 সালে তার বই "এক্সপ্লোরেটরি ডেটা অ্যানালিসিস"-এ প্রথম প্রকাশিত হয়। টুকির মূল ডিজাইন, "স্কিম্যাটিক প্লট" নামে পরিচিত, কেবল মিডিয়ান, কোয়ার্টাইল এবং চরম মানগুলি প্রদর্শন করেছিল।

বক্স প্লটের ইতিহাসে মূল উন্নয়নগুলি অন্তর্ভুক্ত:

  1. 1978: ম্যাকগিল, টুকি, এবং লার্সেন নচড বক্স প্লট পরিচয় করিয়ে দেন, যা মিডিয়ানের জন্য আত্মবিশ্বাসের সীমা যোগ করে।

  2. 1980-এর দশক: বক্স প্লটগুলিতে "আউটলায়ার" ধারণাটি আরও মানক হয়ে ওঠে, সাধারণত কোয়ার্টাইলগুলির 1.5 গুণ IQR এর বাইরে থাকা পয়েন্টগুলি হিসাবে সংজ্ঞায়িত করা হয়।

  3. 1990-এর দশক-2000-এর দশক: কম্পিউটার গ্রাফিক্সের আবির্ভাবের সাথে, পরিবর্তনশীল প্রস্থের বক্স প্লট এবং ভায়োলিন প্লটের মতো পরিবর্তনগুলি বিকশিত হয়।

  4. বর্তমান দিন: ইন্টারেক্টিভ এবং ডাইনামিক বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশন সফ্টওয়্যারে সাধারণ হয়ে উঠেছে, ব্যবহারকারীদের অন্তর্নিহিত ডেটা পয়েন্টগুলি অনুসন্ধান করতে দেয়।

বক্স প্লটগুলি তাদের সরলতা এবং জটিল ডেটাসেটগুলিকে সারসংক্ষেপ করার দক্ষতার জন্য সময়ের পরীক্ষায় দাঁড়িয়েছে। তারা অনেক ক্ষেত্রে তথ্য বিশ্লেষণের একটি মূল অংশ হিসেবে অব্যাহত রয়েছে।

কোড স্নিপেট

নিম্নলিখিত বিভিন্ন প্রোগ্রামিং ভাষায় বক্স প্লট তৈরি করার উদাহরণ রয়েছে:

=QUARTILE(A1:A100,1)  ' Q1
=MEDIAN(A1:A100)      ' মিডিয়ান
=QUARTILE(A1:A100,3)  ' Q3
=MIN(A1:A100)         ' ন্যূনতম
=MAX(A1:A100)         ' সর্বাধিক
## 'data' আপনার সংখ্যার ভেক্টর হিসাবে ধরে নিচ্ছে
boxplot(data)
% 'data' আপনার সংখ্যার ভেক্টর হিসাবে ধরে নিচ্ছে
boxplot(data)
// D3.js ব্যবহার করে
var svg = d3.select("body").append("svg")
    .attr("width", 400)
    .attr("height", 300);

var data = [/* আপনার ডেটা অ্যারে */];

var boxplot = svg.append("g")
    .datum(data)
    .call(d3.boxplot());
import matplotlib.pyplot as plt
import numpy as np

data = [/* আপনার ডেটা অ্যারে */]
plt.boxplot(data)
plt.show()
import org.jfree.chart.ChartFactory;
import org.jfree.chart.ChartPanel;
import org.jfree.chart.JFreeChart;
import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;

DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
dataset.add(Arrays.asList(/* আপনার ডেটা */), "সিরিজ 1", "ক্যাটেগরি 1");

JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
    "বক্স প্লট", "ক্যাটেগরি", "মান", dataset, true);

রেফারেন্স

  1. টুকি, জে. ডব্লিউ. (1977). এক্সপ্লোরেটরি ডেটা অ্যানালিসিস। অ্যাডিসন-ওয়েসলি।
  2. ম্যাকগিল, আর., টুকি, জে. ডব্লিউ., & লার্সেন, ডব্লিউ. এ. (1978). বক্স প্লটের ভিন্নতা। দ্য আমেরিকান স্ট্যাটিস্টিশিয়ান, 32(1), 12-16।
  3. উইলিয়ামসন, ডি. এফ., পার্কার, আর. এ., & কেনড্রিক, জে. এস. (1989). বক্স প্লট: তথ্য ব্যাখ্যা করার একটি সহজ ভিজ্যুয়াল পদ্ধতি। অ্যানালস অফ ইন্টার্নাল মেডিসিন, 110(11), 916-921।
  4. উইকহ্যাম, এইচ., & স্ট্রিজিউস্কি, এল. (2011). বক্সপ্লটের 40 বছর। প্রযুক্তিগত প্রতিবেদন, had.co.nz।
  5. ফ্রিগে, এম., হোগলিন, ডি. সি., & ইগলুইজ, বি. (1989). বক্সপ্লটের কিছু বাস্তবায়ন। দ্য আমেরিকান স্ট্যাটিস্টিশিয়ান, 43(1), 50-54।
মতামত