বক্স প্লট ক্যালকুলেটর
বক্স প্লট ক্যালকুলেটর
বক্স প্লট ক্যালকুলেটর
পরিচিতি
বক্স প্লট, যা বক্স-এন্ড-উইস্কার প্লট নামেও পরিচিত, একটি পাঁচ-সংখ্যার সারসংক্ষেপের ভিত্তিতে তথ্যের বিতরণ প্রদর্শনের একটি মানক উপায়: ন্যূনতম, প্রথম কোয়ার্টাইল (Q1), মিডিয়ান, তৃতীয় কোয়ার্টাইল (Q3), এবং সর্বাধিক। এই ক্যালকুলেটর আপনাকে একটি নির্দিষ্ট সংখ্যার ডেটা থেকে একটি বক্স প্লট তৈরি করতে দেয়, যা তথ্য ভিজ্যুয়ালাইজেশন এবং বিশ্লেষণের জন্য একটি শক্তিশালী সরঞ্জাম।
এই ক্যালকুলেটরটি কীভাবে ব্যবহার করবেন
- ইনপুট ফিল্ডে সংখ্যার একটি কমা বা স্পেস দ্বারা পৃথক তালিকা হিসাবে আপনার ডেটা প্রবেশ করুন।
- ক্যালকুলেটর স্বয়ংক্রিয়ভাবে বক্স প্লট পরিসংখ্যান গণনা করবে এবং ফলাফলগুলি প্রদর্শন করবে।
- ফলাফলের নিচে বক্স প্লটের একটি ভিজ্যুয়াল উপস্থাপনা দেখানো হবে।
- আপনি "ফলাফল কপি করুন" বোতামটি ব্যবহার করে গণনা করা ফলাফলগুলি কপি করতে পারেন।
সূত্র
বক্স প্লট গণনার জন্য ব্যবহৃত মূল সূত্রগুলি হল:
-
মিডিয়ান (Q2): n উপাদানের একটি অর্ডার করা ডেটাসেটের জন্য,
x_{\frac{n+1}{2}} & \text{যদি n বিজোড়} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{যদি n জোড়} \end{cases} $$ -
প্রথম কোয়ার্টাইল (Q1) এবং তৃতীয় কোয়ার্টাইল (Q3):
-
ইন্টারকোয়ার্টাইল রেঞ্জ (IQR):
-
উইস্কার:
-
আউটলায়ার: নিম্ন উইস্কারের নিচে বা উচ্চ উইস্কারের উপরে থাকা যেকোনো ডেটা পয়েন্ট।
গণনা
ক্যালকুলেটরটি বক্স প্লট তৈরি করতে নিম্নলিখিত পদক্ষেপগুলি সম্পাদন করে:
- ইনপুট ডেটা বাড়তি ক্রমে সাজান।
- মিডিয়ান (Q2) গণনা করুন:
- যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান হল মধ্যম মান।
- যদি ডেটা পয়েন্টের সংখ্যা জোড় হয়, তবে মিডিয়ান হল দুইটি মধ্যম মানের গড়।
- প্রথম কোয়ার্টাইল (Q1) গণনা করুন:
- এটি ডেটার নিম্নার্ধের মিডিয়ান।
- যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান কোনও অর্ধে অন্তর্ভুক্ত হয় না।
- তৃতীয় কোয়ার্টাইল (Q3) গণনা করুন:
- এটি ডেটার উচ্চার্ধের মিডিয়ান।
- যদি ডেটা পয়েন্টের সংখ্যা বিজোড় হয়, তবে মিডিয়ান কোনও অর্ধে অন্তর্ভুক্ত হয় না।
- ইন্টারকোয়ার্টাইল রেঞ্জ (IQR) গণনা করুন = Q3 - Q1।
- উইস্কার নির্ধারণ করুন:
- নিম্ন উইস্কার: Q1 - 1.5 * IQR এর চেয়ে বড় বা সমান সবচেয়ে ছোট ডেটা পয়েন্ট
- উচ্চ উইস্কার: Q3 + 1.5 * IQR এর চেয়ে কম বা সমান সবচেয়ে বড় ডেটা পয়েন্ট
- আউটলায়ার চিহ্নিত করুন: নিম্ন উইস্কারের নিচে বা উচ্চ উইস্কারের উপরে থাকা যেকোনো ডেটা পয়েন্ট।
এটি লক্ষ্য করা গুরুত্বপূর্ণ যে কোয়ার্টাইল গণনার জন্য বিভিন্ন পদ্ধতি রয়েছে, বিশেষত এমন ডেটাসেটগুলি পরিচালনা করার সময় যেগুলির একটি জোড় সংখ্যা রয়েছে। উপরের বর্ণিত পদ্ধতিটি "এক্সক্লুসিভ" পদ্ধতি নামে পরিচিত, তবে "ইনক্লুসিভ" পদ্ধতি বা "মিডিয়ান অফ মিডিয়ানস" পদ্ধতি ব্যবহার করা যেতে পারে। পদ্ধতির নির্বাচন Q1 এবং Q3 এর অবস্থানে সামান্য প্রভাব ফেলতে পারে, বিশেষত ছোট ডেটাসেটগুলির জন্য।
ব্যাখ্যা
- প্লটে বক্সটি ইন্টারকোয়ার্টাইল রেঞ্জ (IQR) প্রতিনিধিত্ব করে, বক্সের নিচের অংশ Q1 এ এবং উপরের অংশ Q3 এ।
- বক্সের ভিতরের লাইন মিডিয়ান (Q2) প্রতিনিধিত্ব করে।
- উইস্কারগুলি বক্স থেকে ন্যূনতম এবং সর্বাধিক মানে প্রসারিত হয়, আউটলায়ারগুলি বাদ দিয়ে।
- আউটলায়ারগুলি উইস্কারের বাইরে পৃথক পয়েন্ট হিসাবে চিত্রিত হয়।
বক্স প্লট তথ্য সম্পর্কে বেশ কয়েকটি অন্তর্দৃষ্টি প্রদান করে:
- কেন্দ্রীয় প্রবণতা: মিডিয়ান ডেটাসেটের কেন্দ্রীয় মান দেখায়।
- পরিবর্তনশীলতা: IQR এবং সর্বনিম্ন থেকে সর্বাধিক পর্যন্ত সামগ্রিক বিস্তার তথ্যের ছড়িয়ে পড়া দেখায়।
- তির্যকতা: যদি মিডিয়ান বক্সের মধ্যে কেন্দ্রীভূত না হয়, তবে এটি তথ্যের তির্যকতা নির্দেশ করে।
- আউটলায়ার: উইস্কারের বাইরে পয়েন্টগুলি সম্ভাব্য আউটলায়ার বা চরম মানগুলিকে হাইলাইট করে।
ব্যবহার ক্ষেত্র
বক্স প্লট বিভিন্ন ক্ষেত্রে উপকারী, যেমন:
-
পরিসংখ্যান: তথ্যের বিতরণ এবং তির্যকতা ভিজ্যুয়ালাইজ করতে। উদাহরণস্বরূপ, বিভিন্ন স্কুল বা ক্লাসের মধ্যে পরীক্ষার স্কোর তুলনা করা।
-
তথ্য বিশ্লেষণ: আউটলায়ার চিহ্নিত করতে এবং বিতরণ তুলনা করতে। ব্যবসায়, এটি বিভিন্ন অঞ্চলে বা সময়ের মধ্যে বিক্রয় ডেটা বিশ্লেষণ করতে ব্যবহৃত হতে পারে।
-
বৈজ্ঞানিক গবেষণা: ফলাফল উপস্থাপন এবং গোষ্ঠীগুলির তুলনা করতে। উদাহরণস্বরূপ, চিকিৎসা গবেষণায় বিভিন্ন চিকিৎসার কার্যকারিতা তুলনা করা।
-
গুণমান নিয়ন্ত্রণ: প্রক্রিয়া পরিবর্তনশীলগুলি পর্যবেক্ষণ করতে এবং অস্বাভাবিকতা চিহ্নিত করতে। উৎপাদনে, এটি পণ্যের মাত্রা ট্র্যাক করতে এবং নিশ্চিত করতে ব্যবহৃত হতে পারে যে তারা গ্রহণযোগ্য পরিসরের মধ্যে পড়ে।
-
অর্থনীতি: শেয়ারের মূল্য আন্দোলন এবং অন্যান্য আর্থিক পরিমাপ বিশ্লেষণ করতে। উদাহরণস্বরূপ, সময়ের সাথে সাথে বিভিন্ন মিউচুয়াল ফান্ডের কার্যকারিতা তুলনা করা।
-
পরিবেশ বিজ্ঞান: পরিবেশগত তথ্য বিশ্লেষণ এবং তুলনা করতে, যেমন বিভিন্ন অবস্থান বা সময়ের মধ্যে দূষণের স্তর বা তাপমাত্রার পরিবর্তন।
-
ক্রীড়া বিশ্লেষণ: দল বা মৌসুমের মধ্যে খেলোয়াড়ের কার্যকারিতা পরিসংখ্যান তুলনা করতে।
বিকল্প
যদিও বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশনের জন্য শক্তিশালী সরঞ্জাম, তবে বিশ্লেষণের নির্দিষ্ট প্রয়োজনীয়তার উপর নির্ভর করে কয়েকটি বিকল্প রয়েছে:
-
হিস্টোগ্রাম: একটি ডেটাসেটের ফ্রিকোয়েন্সি বিতরণ দেখানোর জন্য উপকারী। তারা বিতরণের আকার সম্পর্কে আরও বিস্তারিত তথ্য প্রদান করে তবে একাধিক ডেটাসেট তুলনা করার জন্য কম কার্যকর হতে পারে।
-
ভায়োলিন প্লট: বক্স প্লটের বৈশিষ্ট্যগুলি কেরনেল ঘনত্ব প্লটের সাথে সংমিশ্রণ করে, বিভিন্ন মানে ডেটার সম্ভাব্য ঘনত্ব দেখায়।
-
স্ক্যাটার প্লট: দুটি ভেরিয়েবলের মধ্যে সম্পর্ক দেখানোর জন্য আদর্শ, যা বক্স প্লটগুলি করতে পারে না।
-
বার চার্ট: বিভিন্ন ক্যাটাগরির মধ্যে একক মান তুলনা করার জন্য উপযুক্ত।
-
লাইন গ্রাফ: সময়ের সাথে সাথে প্রবণতা দেখানোর জন্য কার্যকর, যা বক্স প্লটগুলি ভালভাবে ক্যাপচার করে না।
-
হিটম্যাপ: একাধিক ভেরিয়েবলের সাথে জটিল ডেটাসেটগুলি ভিজ্যুয়ালাইজ করার জন্য উপকারী।
এই বিকল্পগুলির মধ্যে নির্বাচন ডেটার প্রকৃতি এবং যে নির্দিষ্ট অন্তর্দৃষ্টি এক প্রকাশ করতে চায় তার উপর নির্ভর করে।
ইতিহাস
বক্স প্লট 1970 সালে জন টুকি দ্বারা আবিষ্কৃত হয় এবং 1977 সালে তার বই "এক্সপ্লোরেটরি ডেটা অ্যানালিসিস"-এ প্রথম প্রকাশিত হয়। টুকির মূল ডিজাইন, "স্কিম্যাটিক প্লট" নামে পরিচিত, কেবল মিডিয়ান, কোয়ার্টাইল এবং চরম মানগুলি প্রদর্শন করেছিল।
বক্স প্লটের ইতিহাসে মূল উন্নয়নগুলি অন্তর্ভুক্ত:
-
1978: ম্যাকগিল, টুকি, এবং লার্সেন নচড বক্স প্লট পরিচয় করিয়ে দেন, যা মিডিয়ানের জন্য আত্মবিশ্বাসের সীমা যোগ করে।
-
1980-এর দশক: বক্স প্লটগুলিতে "আউটলায়ার" ধারণাটি আরও মানক হয়ে ওঠে, সাধারণত কোয়ার্টাইলগুলির 1.5 গুণ IQR এর বাইরে থাকা পয়েন্টগুলি হিসাবে সংজ্ঞায়িত করা হয়।
-
1990-এর দশক-2000-এর দশক: কম্পিউটার গ্রাফিক্সের আবির্ভাবের সাথে, পরিবর্তনশীল প্রস্থের বক্স প্লট এবং ভায়োলিন প্লটের মতো পরিবর্তনগুলি বিকশিত হয়।
-
বর্তমান দিন: ইন্টারেক্টিভ এবং ডাইনামিক বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশন সফ্টওয়্যারে সাধারণ হয়ে উঠেছে, ব্যবহারকারীদের অন্তর্নিহিত ডেটা পয়েন্টগুলি অনুসন্ধান করতে দেয়।
বক্স প্লটগুলি তাদের সরলতা এবং জটিল ডেটাসেটগুলিকে সারসংক্ষেপ করার দক্ষতার জন্য সময়ের পরীক্ষায় দাঁড়িয়েছে। তারা অনেক ক্ষেত্রে তথ্য বিশ্লেষণের একটি মূল অংশ হিসেবে অব্যাহত রয়েছে।
কোড স্নিপেট
নিম্নলিখিত বিভিন্ন প্রোগ্রামিং ভাষায় বক্স প্লট তৈরি করার উদাহরণ রয়েছে:
=QUARTILE(A1:A100,1) ' Q1
=MEDIAN(A1:A100) ' মিডিয়ান
=QUARTILE(A1:A100,3) ' Q3
=MIN(A1:A100) ' ন্যূনতম
=MAX(A1:A100) ' সর্বাধিক
রেফারেন্স
- টুকি, জে. ডব্লিউ. (1977). এক্সপ্লোরেটরি ডেটা অ্যানালিসিস। অ্যাডিসন-ওয়েসলি।
- ম্যাকগিল, আর., টুকি, জে. ডব্লিউ., & লার্সেন, ডব্লিউ. এ. (1978). বক্স প্লটের ভিন্নতা। দ্য আমেরিকান স্ট্যাটিস্টিশিয়ান, 32(1), 12-16।
- উইলিয়ামসন, ডি. এফ., পার্কার, আর. এ., & কেনড্রিক, জে. এস. (1989). বক্স প্লট: তথ্য ব্যাখ্যা করার একটি সহজ ভিজ্যুয়াল পদ্ধতি। অ্যানালস অফ ইন্টার্নাল মেডিসিন, 110(11), 916-921।
- উইকহ্যাম, এইচ., & স্ট্রিজিউস্কি, এল. (2011). বক্সপ্লটের 40 বছর। প্রযুক্তিগত প্রতিবেদন, had.co.nz।
- ফ্রিগে, এম., হোগলিন, ডি. সি., & ইগলুইজ, বি. (1989). বক্সপ্লটের কিছু বাস্তবায়ন। দ্য আমেরিকান স্ট্যাটিস্টিশিয়ান, 43(1), 50-54।