Tạo ra một phân tích trực quan của tập dữ liệu của bạn bằng cách sử dụng biểu đồ hộp và râu. Công cụ này tính toán và hiển thị các số liệu thống kê chính bao gồm các tứ phân, trung vị và các giá trị ngoại lai.
একটি বক্স প্লট, যা বক্স-এন্ড-উইস্কার প্লট হিসাবেও পরিচিত, একটি পাঁচ-সংখ্যার সারসংক্ষেপের ভিত্তিতে ডেটার বিতরণ প্রদর্শনের একটি মানক উপায়: সর্বনিম্ন, প্রথম কোয়ার্টাইল (Q1), মধ্যম, তৃতীয় কোয়ার্টাইল (Q3), এবং সর্বাধিক। এই ক্যালকুলেটরটি একটি নির্দিষ্ট সংখ্যার ডেটা থেকে একটি বক্স প্লট তৈরি করতে আপনাকে সক্ষম করে, যা ডেটা ভিজ্যুয়ালাইজেশন এবং বিশ্লেষণের জন্য একটি শক্তিশালী টুল।
বক্স প্লট গণনার জন্য ব্যবহৃত মূল সূত্রগুলি হল:
মধ্যম (Q2): n উপাদানের একটি সাজানো ডেটাসেটের জন্য,
x_{\frac{n+1}{2}} & \text{যদি n অদ্বিতীয়} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{যদি n জোড়} \end{cases} $$প্রথম কোয়ার্টাইল (Q1) এবং তৃতীয় কোয়ার্টাইল (Q3):
ইন্টারকোয়ার্টাইল রেঞ্জ (IQR):
উইস্কার:
আউটলায়ার: নিচের উইস্কারের নিচে বা উপরের উইস্কারের উপরে যেকোনো ডেটা পয়েন্ট।
ক্যালকুলেটরটি বক্স প্লট তৈরি করতে নিম্নলিখিত পদক্ষেপগুলি সম্পন্ন করে:
এটি লক্ষ্য করা গুরুত্বপূর্ণ যে কোয়ার্টাইল গণনার জন্য বিভিন্ন পদ্ধতি রয়েছে, বিশেষ করে এমন ডেটাসেটগুলির ক্ষেত্রে যেগুলির একটি জোড় সংখ্যা উপাদান রয়েছে। উপরের বর্ণিত পদ্ধতিটি "এক্সক্লুসিভ" পদ্ধতি নামে পরিচিত, তবে "ইনক্লুসিভ" পদ্ধতি বা "মধ্যমের মধ্যম" পদ্ধতি ব্যবহার করা যেতে পারে। পদ্ধতির পছন্দ Q1 এবং Q3 এর অবস্থানকে কিছুটা প্রভাবিত করতে পারে, বিশেষ করে ছোট ডেটাসেটের জন্য।
বক্স প্লট ডেটার সম্পর্কে কয়েকটি অন্তর্দৃষ্টি প্রদান করে:
বক্স প্লট বিভিন্ন ক্ষেত্রে উপকারী, যেমন:
পরিসংখ্যান: ডেটার বিতরণ এবং বাঁক ভিজ্যুয়ালাইজ করতে। উদাহরণস্বরূপ, বিভিন্ন স্কুল বা ক্লাসের মধ্যে পরীক্ষার স্কোর তুলনা করা।
ডেটা বিশ্লেষণ: আউটলায়ার চিহ্নিত করা এবং বিতরণ তুলনা করা। ব্যবসায়, এটি বিভিন্ন অঞ্চলে বা সময়ের মধ্যে বিক্রয় ডেটা বিশ্লেষণ করতে ব্যবহৃত হতে পারে।
বৈজ্ঞানিক গবেষণা: ফলাফল উপস্থাপন এবং গোষ্ঠীগুলির তুলনা করতে। উদাহরণস্বরূপ, চিকিৎসা গবেষণায় বিভিন্ন চিকিৎসার কার্যকারিতা তুলনা করা।
গুণমান নিয়ন্ত্রণ: প্রক্রিয়া পরিবর্তনশীলগুলি পর্যবেক্ষণ করা এবং অস্বাভাবিকতা চিহ্নিত করা। উৎপাদনে, এটি পণ্যের মাত্রা ট্র্যাক করতে এবং নিশ্চিত করতে ব্যবহৃত হতে পারে যে সেগুলি গ্রহণযোগ্য পরিসরের মধ্যে রয়েছে।
অর্থনীতি: শেয়ার মূল্য আন্দোলন এবং অন্যান্য আর্থিক পরিমাপ বিশ্লেষণ করতে। উদাহরণস্বরূপ, সময়ের সাথে বিভিন্ন মিউচুয়াল ফান্ডের কার্যকারিতা তুলনা করা।
পরিবেশ বিজ্ঞান: পরিবেশগত ডেটা বিশ্লেষণ এবং তুলনা করতে, যেমন বিভিন্ন স্থানে বা সময়ের মধ্যে দূষণ স্তর বা তাপমাত্রার পরিবর্তন।
ক্রীড়া বিশ্লেষণ: দল বা মৌসুমের মধ্যে খেলোয়াড়ের কার্যকারিতা পরিসংখ্যান তুলনা করতে।
যদিও বক্স প্লটগুলি ডেটা ভিজ্যুয়ালাইজেশনের জন্য শক্তিশালী টুল, তবে বিশ্লেষণের নির্দিষ্ট প্রয়োজনীয়তার উপর নির্ভর করে বেশ কয়েকটি বিকল্প রয়েছে:
হিস্টোগ্রাম: একটি ডেটাসেটের ফ্রিকোয়েন্সি বিতরণ দেখানোর জন্য উপকারী। তারা বিতরণের আকার সম্পর্কে আরও বিশদ প্রদান করে তবে একাধিক ডেটাসেট তুলনা করার জন্য কম কার্যকর হতে পারে।
ভায়োলিন প্লট: বক্স প্লটের বৈশিষ্ট্যগুলি কের্নেল ঘনত্ব প্লটের সাথে একত্রিত করে, বিভিন্ন মানে ডেটার সম্ভাব্য ঘনত্ব দেখায়।
স্ক্যাটার প্লট: দুটি ভেরিয়েবলের মধ্যে সম্পর্ক দেখানোর জন্য আদর্শ, যা বক্স প্লট করতে পারে না।
বার চার্ট: বিভিন্ন ক্যাটাগরির মধ্যে একক মান তুলনা করার জন্য উপযুক্ত।
লাইন গ্রাফ: সময়ের সাথে প্রবণতা দেখানোর জন্য কার্যকর, যা বক্স প্লট ভালভাবে ধারণ করে না।
হিটম্যাপ: একাধিক ভেরিয়েবল সহ জটিল ডেটাসেট ভিজ্যুয়ালাইজ করার জন্য উপকারী।
এই বিকল্পগুলির মধ্যে পছন্দ ডেটার প্রকৃতি এবং যে নির্দিষ্ট অন্তর্দৃষ্টি একজন প্রকাশ করতে চান তার উপর নির্ভর করে।
বক্স প্লট 1970 সালে জন টুকি দ্বারা আবিষ্কৃত হয় এবং 1977 সালে তার বই "এক্সপ্লোরেটরি ডেটা অ্যানালিসিস" এ প্রথম প্রকাশিত হয়। টুকির মূল ডিজাইন, "স্কিম্যাটিক প্লট" নামে পরিচিত, কেবল মধ্যম, কোয়ার্টাইল এবং চরম মানগুলি প্রদর্শন করত।
বক্স প্লটের ইতিহাসে মূল উন্নয়নগুলি অন্তর্ভুক্ত:
1978: ম্যাকগিল, টুকি, এবং লারসেন নটেড বক্স প্লট পরিচয় করিয়ে দেন, যা মধ্যমের জন্য আত্মবিশ্বাসের সীমা যোগ করে।
1980-এর দশক: বক্স প্লটে "আউটলায়ার" ধারণা আরও মানক হয়ে ওঠে, সাধারণত কোয়ার্টাইল থেকে 1.5 গুণ IQR এর বাইরে পয়েন্ট হিসাবে সংজ্ঞায়িত হয়।
1990-এর দশক-2000-এর দশক: কম্পিউটার গ্রাফিক্সের আবির্ভাবে, পরিবর্তনশীল প্রস্থের বক্স প্লট এবং ভায়োলিন প্লটের মতো পরিবর্তনগুলি বিকশিত হয়।
বর্তমান সময়: ইন্টারেক্টিভ এবং গতিশীল বক্স প্লটগুলি ডেটা ভিজ্যুয়ালাইজেশন সফ্টওয়্যারে সাধারণ হয়ে উঠেছে, ব্যবহারকারীদের অন্তর্ভুক্ত ডেটা পয়েন্টগুলি অনুসন্ধান করতে সক্ষম করে।
বক্স প্লটগুলি তাদের সরলতা এবং জটিল ডেটাসেটগুলি সারসংক্ষেপ করার কার্যকারিতার জন্য সময়ের পরীক্ষায় দাঁড়িয়েছে। তারা বিভিন্ন ক্ষেত্রে ডেটা বিশ্লেষণের একটি প্রধান উপাদান হিসাবে অব্যাহত রয়েছে।
এখানে বিভিন্ন প্রোগ্রামিং ভাষায় একটি বক্স প্লট তৈরি করার উদাহরণ রয়েছে:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' মধ্যম
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' সর্বনিম্ন
5=MAX(A1:A100) ' সর্বাধিক
6
1## 'data' আপনার সংখ্যার ভেক্টর হিসাবে ধরে নিন
2boxplot(data)
3
1% 'data' আপনার সংখ্যার ভেক্টর হিসাবে ধরে নিন
2boxplot(data)
3
1// D3.js ব্যবহার করে
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* আপনার ডেটা অ্যারে */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* আপনার ডেটা অ্যারে */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* আপনার ডেটা */), "সিরিজ 1", "ক্যাটাগরি 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "বক্স প্লট", "ক্যাটাগরি", "মান", dataset, true);
11
Khám phá thêm các công cụ có thể hữu ích cho quy trình làm việc của bạn