বক্স প্লট ক্যালকুলেটর: আপনার ডেটার ভিজ্যুয়াল বিশ্লেষণ

আপনার ডেটাসেটের একটি ভিজ্যুয়াল বিশ্লেষণ তৈরি করতে একটি বক্স-এন্ড-উইস্কার প্লট ব্যবহার করুন। এই টুলটি কোয়ার্টাইল, মিডিয়ান এবং আউটলায়ার সহ মূল পরিসংখ্যানগত পরিমাপগুলি গণনা এবং প্রদর্শন করে।

বক্স প্লট ক্যালকুলেটর

বক্স প্লট ক্যালকুলেটর

📚

ডকুমেন্টেশন

বক্স প্লট ক্যালকুলেটর

পরিচিতি

বক্স প্লট, যা বক্স-এন্ড-উইস্কার প্লট নামেও পরিচিত, একটি পাঁচ-সংখ্যার সারসংক্ষেপের ভিত্তিতে তথ্যের বিতরণ প্রদর্শনের একটি মানক উপায়: ন্যূনতম, প্রথম কোয়ার্টাইল (Q1), মিডিয়ান, তৃতীয় কোয়ার্টাইল (Q3), এবং সর্বাধিক। এই ক্যালকুলেটর আপনাকে একটি নির্দিষ্ট সংখ্যার ডেটা থেকে একটি বক্স প্লট তৈরি করতে দেয়, যা তথ্য ভিজ্যুয়ালাইজেশন এবং বিশ্লেষণের জন্য একটি শক্তিশালী সরঞ্জাম।

এই ক্যালকুলেটরটি কীভাবে ব্যবহার করবেন

  1. ইনপুট ফিল্ডে সংখ্যার একটি কমা বা স্পেস দ্বারা পৃথক তালিকা হিসাবে আপনার ডেটা প্রবেশ করুন।
  2. ক্যালকুলেটর স্বয়ংক্রিয়ভাবে বক্স প্লট পরিসংখ্যান গণনা করবে এবং ফলাফলগুলি প্রদর্শন করবে।
  3. ফলাফলের নিচে বক্স প্লটের একটি ভিজ্যুয়াল উপস্থাপনা দেখানো হবে।
  4. আপনি "ফলাফল কপি করুন" বোতামটি ব্যবহার করে গণনা করা ফলাফলগুলি কপি করতে পারেন।

সূত্র

বক্স প্লট গণনার জন্য ব্যবহৃত মূল সূত্রগুলি হল:

  1. মিডিয়ান (Q2): n উপাদানের একটি অর্ডার করা ডেটাসেটের জন্য,

    x_{\frac{n+1}{2}} & \text{যদি n বিজোড়} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{যদি n জোড়} \end{cases} $$
  2. প্রথম কোয়ার্টাইল (Q1) এবং তৃতীয় কোয়ার্টাইল (Q3): Q1=ডেটার নিম্নার্ধের মিডিয়ানQ1 = \text{ডেটার নিম্নার্ধের মিডিয়ান} Q3=ডেটার উচ্চার্ধের মিডিয়ানQ3 = \text{ডেটার উচ্চার্ধের মিডিয়ান}

  3. ইন্টারকোয়ার্টাইল রেঞ্জ (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. উইস্কার: নিম্ন উইস্কার=max(min(x),Q11.5IQR)\text{নিম্ন উইস্কার} = \max({\min(x), Q1 - 1.5 * IQR}) উচ্চ উইস্কার=min(max(x),Q3+1.5IQR)\text{উচ্চ উইস্কার} = \min({\max(x), Q3 + 1.5 * IQR})

  5. আউটলায়ার: নিম্ন উইস্কারের নিচে বা উচ্চ উইস্কারের উপরে থাকা যেকোনো ডেটা পয়েন্ট।

গণনা

ক্যালকুলেটরটি বক্স প্লট তৈরি করতে নিম্নলিখিত পদক্ষেপগুলি সম্পাদন করে:

  1. ইনপুট ডেটা বাড়তি ক্রমে সাজান।
  2. মিডিয়ান (Q2) গণনা করুন:
    • যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান হল মধ্যম মান।
    • যদি ডেটা পয়েন্টের সংখ্যা জোড় হয়, তবে মিডিয়ান হল দুইটি মধ্যম মানের গড়।
  3. প্রথম কোয়ার্টাইল (Q1) গণনা করুন:
    • এটি ডেটার নিম্নার্ধের মিডিয়ান।
    • যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান কোনও অর্ধে অন্তর্ভুক্ত হয় না।
  4. তৃতীয় কোয়ার্টাইল (Q3) গণনা করুন:
    • এটি ডেটার উচ্চার্ধের মিডিয়ান।
    • যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান কোনও অর্ধে অন্তর্ভুক্ত হয় না।
  5. ইন্টারকোয়ার্টাইল রেঞ্জ (IQR) গণনা করুন = Q3 - Q1।
  6. উইস্কার নির্ধারণ করুন:
    • নিম্ন উইস্কার: Q1 - 1.5 * IQR এর চেয়ে বড় বা সমান সবচেয়ে ছোট ডেটা পয়েন্ট
    • উচ্চ উইস্কার: Q3 + 1.5 * IQR এর চেয়ে কম বা সমান সবচেয়ে বড় ডেটা পয়েন্ট
  7. আউটলায়ার চিহ্নিত করুন: নিম্ন উইস্কারের নিচে বা উচ্চ উইস্কারের উপরে থাকা যেকোনো ডেটা পয়েন্ট।

এটি লক্ষ্য করা গুরুত্বপূর্ণ যে কোয়ার্টাইল গণনার জন্য বিভিন্ন পদ্ধতি রয়েছে, বিশেষত এমন ডেটাসেটগুলি পরিচালনা করার সময় যেগুলির একটি জোড় সংখ্যা রয়েছে। উপরের বর্ণিত পদ্ধতিটি "এক্সক্লুসিভ" পদ্ধতি নামে পরিচিত, তবে "ইনক্লুসিভ" পদ্ধতি বা "মিডিয়ান অফ মিডিয়ানস" পদ্ধতি ব্যবহার করা যেতে পারে। পদ্ধতির নির্বাচন Q1 এবং Q3 এর অবস্থানে সামান্য প্রভাব ফেলতে পারে, বিশেষত ছোট ডেটাসেটগুলির জন্য।

ব্যাখ্যা

Q3 মিডিয়ান Q1 ন্যূনতম সর্বাধিক বক্স প্লট উপাদানসমূহ
  • প্লটে বক্সটি ইন্টারকোয়ার্টাইল রেঞ্জ (IQR) প্রতিনিধিত্ব করে, বক্সের নিচের অংশ Q1 এ এবং উপরের অংশ Q3 এ।
  • বক্সের ভিতরের লাইন মিডিয়ান (Q2) প্রতিনিধিত্ব করে।
  • উইস্কারগুলি বক্স থেকে ন্যূনতম এবং সর্বাধিক মানে প্রসারিত হয়, আউটলায়ারগুলি বাদ দিয়ে।
  • আউটলায়ারগুলি উইস্কারের বাইরে পৃথক পয়েন্ট হিসাবে চিত্রিত হয়।

বক্স প্লট তথ্য সম্পর্কে বেশ কয়েকটি অন্তর্দৃষ্টি প্রদান করে:

  • কেন্দ্রীয় প্রবণতা: মিডিয়ান ডেটাসেটের কেন্দ্রীয় মান দেখায়।
  • পরিবর্তনশীলতা: IQR এবং সর্বনিম্ন থেকে সর্বাধিক পর্যন্ত সামগ্রিক বিস্তার তথ্যের ছড়িয়ে পড়া দেখায়।
  • তির্যকতা: যদি মিডিয়ান বক্সের মধ্যে কেন্দ্রীভূত না হয়, তবে এটি তথ্যের তির্যকতা নির্দেশ করে।
  • আউটলায়ার: উইস্কারের বাইরে পয়েন্টগুলি সম্ভাব্য আউটলায়ার বা চরম মানগুলিকে হাইলাইট করে।

ব্যবহার ক্ষেত্র

বক্স প্লট বিভিন্ন ক্ষেত্রে উপকারী, যেমন:

  1. পরিসংখ্যান: তথ্যের বিতরণ এবং তির্যকতা ভিজ্যুয়ালাইজ করতে। উদাহরণস্বরূপ, বিভিন্ন স্কুল বা ক্লাসের মধ্যে পরীক্ষার স্কোর তুলনা করা।

  2. তথ্য বিশ্লেষণ: আউটলায়ার চিহ্নিত করতে এবং বিতরণ তুলনা করতে। ব্যবসায়, এটি বিভিন্ন অঞ্চলে বা সময়ের মধ্যে বিক্রয় ডেটা বিশ্লেষণ করতে ব্যবহৃত হতে পারে।

  3. বৈজ্ঞানিক গবেষণা: ফলাফল উপস্থাপন এবং গোষ্ঠীগুলির তুলনা করতে। উদাহরণস্বরূপ, চিকিৎসা গবেষণায় বিভিন্ন চিকিৎসার কার্যকারিতা তুলনা করা।

  4. গুণমান নিয়ন্ত্রণ: প্রক্রিয়া পরিবর্তনশীলগুলি পর্যবেক্ষণ করতে এবং অস্বাভাবিকতা চিহ্নিত করতে। উৎপাদনে, এটি পণ্যের মাত্রা ট্র্যাক করতে এবং নিশ্চিত করতে ব্যবহৃত হতে পারে যে তারা গ্রহণযোগ্য পরিসরের মধ্যে পড়ে।

  5. অর্থনীতি: শেয়ারের মূল্য আন্দোলন এবং অন্যান্য আর্থিক পরিমাপ বিশ্লেষণ করতে। উদাহরণস্বরূপ, সময়ের সাথে সাথে বিভিন্ন মিউচুয়াল ফান্ডের কার্যকারিতা তুলনা করা।

  6. পরিবেশ বিজ্ঞান: পরিবেশগত তথ্য বিশ্লেষণ এবং তুলনা করতে, যেমন বিভিন্ন অবস্থান বা সময়ের মধ্যে দূষণের স্তর বা তাপমাত্রার পরিবর্তন।

  7. ক্রীড়া বিশ্লেষণ: দল বা মৌসুমের মধ্যে খেলোয়াড়ের কার্যকারিতা পরিসংখ্যান তুলনা করতে।

বিকল্প

যদিও বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশনের জন্য শক্তিশালী সরঞ্জাম, তবে বিশ্লেষণের নির্দিষ্ট প্রয়োজনীয়তার উপর নির্ভর করে কয়েকটি বিকল্প রয়েছে:

  1. হিস্টোগ্রাম: একটি ডেটাসেটের ফ্রিকোয়েন্সি বিতরণ দেখানোর জন্য উপকারী। তারা বিতরণের আকার সম্পর্কে আরও বিস্তারিত তথ্য প্রদান করে তবে একাধিক ডেটাসেট তুলনা করার জন্য কম কার্যকর হতে পারে।

  2. ভায়োলিন প্লট: বক্স প্লটের বৈশিষ্ট্যগুলি কেরনেল ঘনত্ব প্লটের সাথে সংমিশ্রণ করে, বিভিন্ন মানে ডেটার সম্ভাব্য ঘনত্ব দেখায়।

  3. স্ক্যাটার প্লট: দুটি ভেরিয়েবলের মধ্যে সম্পর্ক দেখানোর জন্য আদর্শ, যা বক্স প্লটগুলি করতে পারে না।

  4. বার চার্ট: বিভিন্ন ক্যাটাগরির মধ্যে একক মান তুলনা করার জন্য উপযুক্ত।

  5. লাইন গ্রাফ: সময়ের সাথে সাথে প্রবণতা দেখানোর জন্য কার্যকর, যা বক্স প্লটগুলি ভালভাবে ক্যাপচার করে না।

  6. হিটম্যাপ: একাধিক ভেরিয়েবলের সাথে জটিল ডেটাসেটগুলি ভিজ্যুয়ালাইজ করার জন্য উপকারী।

এই বিকল্পগুলির মধ্যে নির্বাচন ডেটার প্রকৃতি এবং যে নির্দিষ্ট অন্তর্দৃষ্টি এক প্রকাশ করতে চায় তার উপর নির্ভর করে।

ইতিহাস

বক্স প্লট 1970 সালে জন টুকি দ্বারা আবিষ্কৃত হয় এবং 1977 সালে তার বই "এক্সপ্লোরেটরি ডেটা অ্যানালিসিস"-এ প্রথম প্রকাশিত হয়। টুকির মূল ডিজাইন, "স্কিম্যাটিক প্লট" নামে পরিচিত, কেবল মিডিয়ান, কোয়ার্টাইল এবং চরম মানগুলি প্রদর্শন করেছিল।

বক্স প্লটের ইতিহাসে মূল উন্নয়নগুলি অন্তর্ভুক্ত:

  1. 1978: ম্যাকগিল, টুকি, এবং লার্সেন নচড বক্স প্লট পরিচয় করিয়ে দেন, যা মিডিয়ানের জন্য আত্মবিশ্বাসের সীমা যোগ করে।

  2. 1980-এর দশক: বক্স প্লটগুলিতে "আউটলায়ার" ধারণাটি আরও মানক হয়ে ওঠে, সাধারণত কোয়ার্টাইলগুলির 1.5 গুণ IQR এর বাইরে থাকা পয়েন্টগুলি হিসাবে সংজ্ঞায়িত করা হয়।

  3. 1990-এর দশক-2000-এর দশক: কম্পিউটার গ্রাফিক্সের আবির্ভাবের সাথে, পরিবর্তনশীল প্রস্থের বক্স প্লট এবং ভায়োলিন প্লটের মতো পরিবর্তনগুলি বিকশিত হয়।

  4. বর্তমান দিন: ইন্টারেক্টিভ এবং ডাইনামিক বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশন সফ্টওয়্যারে সাধারণ হয়ে উঠেছে, ব্যবহারকারীদের অন্তর্নিহিত ডেটা পয়েন্টগুলি অনুসন্ধান করতে দেয়।

বক্স প্লটগুলি তাদের সরলতা এবং জটিল ডেটাসেটগুলিকে সারসংক্ষেপ করার দক্ষতার জন্য সময়ের পরীক্ষায় দাঁড়িয়েছে। তারা অনেক ক্ষেত্রে তথ্য বিশ্লেষণের একটি মূল অংশ হিসেবে অব্যাহত রয়েছে।

কোড স্নিপেট

নিম্নলিখিত বিভিন্ন প্রোগ্রামিং ভাষায় বক্স প্লট তৈরি করার উদাহরণ রয়েছে:

1=QUARTILE(A1:A100,1)  ' Q1
2=MEDIAN(A1:A100)      ' মিডিয়ান
3=QUARTILE(A1:A100,3)  ' Q3
4=MIN(A1:A100)         ' ন্যূনতম
5=MAX(A1:A100)         ' সর্বাধিক
6

রেফারেন্স

  1. টুকি, জে. ডব্লিউ. (1977). এক্সপ্লোরেটরি ডেটা অ্যানালিসিস। অ্যাডিসন-ওয়েসলি।
  2. ম্যাকগিল, আর., টুকি, জে. ডব্লিউ., & লার্সেন, ডব্লিউ. এ. (1978). বক্স প্লটের ভিন্নতা। দ্য আমেরিকান স্ট্যাটিস্টিশিয়ান, 32(1), 12-16।
  3. উইলিয়ামসন, ডি. এফ., পার্কার, আর. এ., & কেনড্রিক, জে. এস. (1989). বক্স প্লট: তথ্য ব্যাখ্যা করার একটি সহজ ভিজ্যুয়াল পদ্ধতি। অ্যানালস অফ ইন্টার্নাল মেডিসিন, 110(11), 916-921।
  4. উইকহ্যাম, এইচ., & স্ট্রিজিউস্কি, এল. (2011). বক্সপ্লটের 40 বছর। প্রযুক্তিগত প্রতিবেদন, had.co.nz।
  5. ফ্রিগে, এম., হোগলিন, ডি. সি., & ইগলুইজ, বি. (1989). বক্সপ্লটের কিছু বাস্তবায়ন। দ্য আমেরিকান স্ট্যাটিস্টিশিয়ান, 43(1), 50-54।