আপনার ডেটাসেটের একটি ভিজ্যুয়াল বিশ্লেষণ তৈরি করতে একটি বক্স-এন্ড-উইস্কার প্লট ব্যবহার করুন। এই টুলটি কোয়ার্টাইল, মিডিয়ান এবং আউটলায়ার সহ মূল পরিসংখ্যানগত পরিমাপগুলি গণনা এবং প্রদর্শন করে।
বক্স প্লট, যা বক্স-এন্ড-উইস্কার প্লট নামেও পরিচিত, একটি পাঁচ-সংখ্যার সারসংক্ষেপের ভিত্তিতে তথ্যের বিতরণ প্রদর্শনের একটি মানক উপায়: ন্যূনতম, প্রথম কোয়ার্টাইল (Q1), মিডিয়ান, তৃতীয় কোয়ার্টাইল (Q3), এবং সর্বাধিক। এই ক্যালকুলেটর আপনাকে একটি নির্দিষ্ট সংখ্যার ডেটা থেকে একটি বক্স প্লট তৈরি করতে দেয়, যা তথ্য ভিজ্যুয়ালাইজেশন এবং বিশ্লেষণের জন্য একটি শক্তিশালী সরঞ্জাম।
বক্স প্লট গণনার জন্য ব্যবহৃত মূল সূত্রগুলি হল:
মিডিয়ান (Q2): n উপাদানের একটি অর্ডার করা ডেটাসেটের জন্য,
x_{\frac{n+1}{2}} & \text{যদি n বিজোড়} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{যদি n জোড়} \end{cases} $$প্রথম কোয়ার্টাইল (Q1) এবং তৃতীয় কোয়ার্টাইল (Q3):
ইন্টারকোয়ার্টাইল রেঞ্জ (IQR):
উইস্কার:
আউটলায়ার: নিম্ন উইস্কারের নিচে বা উচ্চ উইস্কারের উপরে থাকা যেকোনো ডেটা পয়েন্ট।
ক্যালকুলেটরটি বক্স প্লট তৈরি করতে নিম্নলিখিত পদক্ষেপগুলি সম্পাদন করে:
এটি লক্ষ্য করা গুরুত্বপূর্ণ যে কোয়ার্টাইল গণনার জন্য বিভিন্ন পদ্ধতি রয়েছে, বিশেষত এমন ডেটাসেটগুলি পরিচালনা করার সময় যেগুলির একটি জোড় সংখ্যা রয়েছে। উপরের বর্ণিত পদ্ধতিটি "এক্সক্লুসিভ" পদ্ধতি নামে পরিচিত, তবে "ইনক্লুসিভ" পদ্ধতি বা "মিডিয়ান অফ মিডিয়ানস" পদ্ধতি ব্যবহার করা যেতে পারে। পদ্ধতির নির্বাচন Q1 এবং Q3 এর অবস্থানে সামান্য প্রভাব ফেলতে পারে, বিশেষত ছোট ডেটাসেটগুলির জন্য।
বক্স প্লট তথ্য সম্পর্কে বেশ কয়েকটি অন্তর্দৃষ্টি প্রদান করে:
বক্স প্লট বিভিন্ন ক্ষেত্রে উপকারী, যেমন:
পরিসংখ্যান: তথ্যের বিতরণ এবং তির্যকতা ভিজ্যুয়ালাইজ করতে। উদাহরণস্বরূপ, বিভিন্ন স্কুল বা ক্লাসের মধ্যে পরীক্ষার স্কোর তুলনা করা।
তথ্য বিশ্লেষণ: আউটলায়ার চিহ্নিত করতে এবং বিতরণ তুলনা করতে। ব্যবসায়, এটি বিভিন্ন অঞ্চলে বা সময়ের মধ্যে বিক্রয় ডেটা বিশ্লেষণ করতে ব্যবহৃত হতে পারে।
বৈজ্ঞানিক গবেষণা: ফলাফল উপস্থাপন এবং গোষ্ঠীগুলির তুলনা করতে। উদাহরণস্বরূপ, চিকিৎসা গবেষণায় বিভিন্ন চিকিৎসার কার্যকারিতা তুলনা করা।
গুণমান নিয়ন্ত্রণ: প্রক্রিয়া পরিবর্তনশীলগুলি পর্যবেক্ষণ করতে এবং অস্বাভাবিকতা চিহ্নিত করতে। উৎপাদনে, এটি পণ্যের মাত্রা ট্র্যাক করতে এবং নিশ্চিত করতে ব্যবহৃত হতে পারে যে তারা গ্রহণযোগ্য পরিসরের মধ্যে পড়ে।
অর্থনীতি: শেয়ারের মূল্য আন্দোলন এবং অন্যান্য আর্থিক পরিমাপ বিশ্লেষণ করতে। উদাহরণস্বরূপ, সময়ের সাথে সাথে বিভিন্ন মিউচুয়াল ফান্ডের কার্যকারিতা তুলনা করা।
পরিবেশ বিজ্ঞান: পরিবেশগত তথ্য বিশ্লেষণ এবং তুলনা করতে, যেমন বিভিন্ন অবস্থান বা সময়ের মধ্যে দূষণের স্তর বা তাপমাত্রার পরিবর্তন।
ক্রীড়া বিশ্লেষণ: দল বা মৌসুমের মধ্যে খেলোয়াড়ের কার্যকারিতা পরিসংখ্যান তুলনা করতে।
যদিও বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশনের জন্য শক্তিশালী সরঞ্জাম, তবে বিশ্লেষণের নির্দিষ্ট প্রয়োজনীয়তার উপর নির্ভর করে কয়েকটি বিকল্প রয়েছে:
হিস্টোগ্রাম: একটি ডেটাসেটের ফ্রিকোয়েন্সি বিতরণ দেখানোর জন্য উপকারী। তারা বিতরণের আকার সম্পর্কে আরও বিস্তারিত তথ্য প্রদান করে তবে একাধিক ডেটাসেট তুলনা করার জন্য কম কার্যকর হতে পারে।
ভায়োলিন প্লট: বক্স প্লটের বৈশিষ্ট্যগুলি কেরনেল ঘনত্ব প্লটের সাথে সংমিশ্রণ করে, বিভিন্ন মানে ডেটার সম্ভাব্য ঘনত্ব দেখায়।
স্ক্যাটার প্লট: দুটি ভেরিয়েবলের মধ্যে সম্পর্ক দেখানোর জন্য আদর্শ, যা বক্স প্লটগুলি করতে পারে না।
বার চার্ট: বিভিন্ন ক্যাটাগরির মধ্যে একক মান তুলনা করার জন্য উপযুক্ত।
লাইন গ্রাফ: সময়ের সাথে সাথে প্রবণতা দেখানোর জন্য কার্যকর, যা বক্স প্লটগুলি ভালভাবে ক্যাপচার করে না।
হিটম্যাপ: একাধিক ভেরিয়েবলের সাথে জটিল ডেটাসেটগুলি ভিজ্যুয়ালাইজ করার জন্য উপকারী।
এই বিকল্পগুলির মধ্যে নির্বাচন ডেটার প্রকৃতি এবং যে নির্দিষ্ট অন্তর্দৃষ্টি এক প্রকাশ করতে চায় তার উপর নির্ভর করে।
বক্স প্লট 1970 সালে জন টুকি দ্বারা আবিষ্কৃত হয় এবং 1977 সালে তার বই "এক্সপ্লোরেটরি ডেটা অ্যানালিসিস"-এ প্রথম প্রকাশিত হয়। টুকির মূল ডিজাইন, "স্কিম্যাটিক প্লট" নামে পরিচিত, কেবল মিডিয়ান, কোয়ার্টাইল এবং চরম মানগুলি প্রদর্শন করেছিল।
বক্স প্লটের ইতিহাসে মূল উন্নয়নগুলি অন্তর্ভুক্ত:
1978: ম্যাকগিল, টুকি, এবং লার্সেন নচড বক্স প্লট পরিচয় করিয়ে দেন, যা মিডিয়ানের জন্য আত্মবিশ্বাসের সীমা যোগ করে।
1980-এর দশক: বক্স প্লটগুলিতে "আউটলায়ার" ধারণাটি আরও মানক হয়ে ওঠে, সাধারণত কোয়ার্টাইলগুলির 1.5 গুণ IQR এর বাইরে থাকা পয়েন্টগুলি হিসাবে সংজ্ঞায়িত করা হয়।
1990-এর দশক-2000-এর দশক: কম্পিউটার গ্রাফিক্সের আবির্ভাবের সাথে, পরিবর্তনশীল প্রস্থের বক্স প্লট এবং ভায়োলিন প্লটের মতো পরিবর্তনগুলি বিকশিত হয়।
বর্তমান দিন: ইন্টারেক্টিভ এবং ডাইনামিক বক্স প্লটগুলি তথ্য ভিজ্যুয়ালাইজেশন সফ্টওয়্যারে সাধারণ হয়ে উঠেছে, ব্যবহারকারীদের অন্তর্নিহিত ডেটা পয়েন্টগুলি অনুসন্ধান করতে দেয়।
বক্স প্লটগুলি তাদের সরলতা এবং জটিল ডেটাসেটগুলিকে সারসংক্ষেপ করার দক্ষতার জন্য সময়ের পরীক্ষায় দাঁড়িয়েছে। তারা অনেক ক্ষেত্রে তথ্য বিশ্লেষণের একটি মূল অংশ হিসেবে অব্যাহত রয়েছে।
নিম্নলিখিত বিভিন্ন প্রোগ্রামিং ভাষায় বক্স প্লট তৈরি করার উদাহরণ রয়েছে:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' মিডিয়ান
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' ন্যূনতম
5=MAX(A1:A100) ' সর্বাধিক
6
1## 'data' আপনার সংখ্যার ভেক্টর হিসাবে ধরে নিচ্ছে
2boxplot(data)
3
1% 'data' আপনার সংখ্যার ভেক্টর হিসাবে ধরে নিচ্ছে
2boxplot(data)
3
1// D3.js ব্যবহার করে
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* আপনার ডেটা অ্যারে */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* আপনার ডেটা অ্যারে */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* আপনার ডেটা */), "সিরিজ 1", "ক্যাটেগরি 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "বক্স প্লট", "ক্যাটেগরি", "মান", dataset, true);
11
আপনার কাজে দরকারী হতে পারে আরো টুল খুঁজে বের করুন