Whiz Tools

બોક્સ પ્લોટ કેલ્ક્યુલેટર

બોક્સ પ્લોટ કેલ્ક્યુલેટર

પરિચય

બોક્સ પ્લોટ, જેને બોક્સ-એન્ડ-વિસ્કર પ્લોટ તરીકે પણ ઓળખવામાં આવે છે, તે ડેટાના વિતરણને દર્શાવવાનો એક માનક માર્ગ છે જે પાંચ-નંબરના સારાંશ પર આધારિત છે: લઘુત્તમ, પ્રથમ ક્વાર્ટાઈલ (Q1), મધ્યમ, ત્રીજું ક્વાર્ટાઈલ (Q3), અને મહત્તમ. આ કેલ્ક્યુલેટર તમને આપેલ સંખ્યાત્મક ડેટાના સેટમાંથી બોક્સ પ્લોટ જનરેટ કરવાની મંજૂરી આપે છે, જે ડેટા વિઝ્યુલાઇઝેશન અને વિશ્લેષણ માટે એક શક્તિશાળી સાધન છે.

આ કેલ્ક્યુલેટરને કેવી રીતે ઉપયોગ કરવો

  1. ઇનપુટ ફીલ્ડમાં સંખ્યાઓની કોમા અથવા જગ્યા દ્વારા અલગ કરેલી યાદી તરીકે તમારું ડેટા દાખલ કરો.
  2. કેલ્ક્યુલેટર આપોઆપ બોક્સ પ્લોટના આંકડાકીય માહિતીની ગણતરી કરશે અને પરિણામો દર્શાવશે.
  3. પરિણામો નીચે બોક્સ પ્લોટનું દૃશ્ય પ્રતિનિધિત્વ બતાવવામાં આવશે.
  4. તમે "કોપી પરિણામ" બટનનો ઉપયોગ કરીને ગણતરી કરેલ પરિણામો કોપી કરી શકો છો.

સૂત્ર

બોક્સ પ્લોટની ગણતરીમાં ઉપયોગમાં લેવાતા મુખ્ય સૂત્રો છે:

  1. મધ્યમ (Q2): n તત્વોની ઓર્ડર કરેલી ડેટાસેટ માટે,

    x_{\frac{n+1}{2}} & \text{જો n વિઘાત છે} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{જો n સમ છે} \end{cases} $$
  2. પ્રથમ ક્વાર્ટાઈલ (Q1) અને ત્રીજું ક્વાર્ટાઈલ (Q3): Q1=ડેટાના નીચલા અર્ધમાં મધ્યમQ1 = \text{ડેટાના નીચલા અર્ધમાં મધ્યમ} Q3=ડેટાના ઉપરના અર્ધમાં મધ્યમQ3 = \text{ડેટાના ઉપરના અર્ધમાં મધ્યમ}

  3. આંતરક્વાર્ટાઇલ શ્રેણી (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. વિસ્કર્સ: Lower Whisker=max(min(x),Q11.5IQR)\text{Lower Whisker} = \max({\min(x), Q1 - 1.5 * IQR}) Upper Whisker=min(max(x),Q3+1.5IQR)\text{Upper Whisker} = \min({\max(x), Q3 + 1.5 * IQR})

  5. આઉટલાયર્સ: કોઈપણ ડેટા પોઈન્ટ્સ જે ન્યૂનતમ વિસ્કરથી નીચે અથવા મહત્તમ વિસ્કરથી ઉપર છે.

ગણતરી

કેલ્ક્યુલેટર બોક્સ પ્લોટ જનરેટ કરવા માટે નીચેના પગલાંઓને અમલમાં લાવે છે:

  1. ઇનપુટ ડેટાને વધતી ક્રમમાં સોર્ટ કરો.
  2. મધ્યમ (Q2) ની ગણતરી કરો:
    • જો ડેટા પોઈન્ટ્સની સંખ્યા વિઘાત છે, તો મધ્યમ મધ્યમ મૂલ્ય છે.
    • જો ડેટા પોઈન્ટ્સની સંખ્યા સમ છે, તો મધ્યમ બે મધ્યમ મૂલ્યનું સરેરાશ છે.
  3. પ્રથમ ક્વાર્ટાઈલ (Q1) ની ગણતરી કરો:
    • આ ડેટાના નીચલા અર્ધમાં મધ્યમ છે.
    • જો ડેટા પોઈન્ટ્સની સંખ્યા વિઘાત છે, તો મધ્યમને કોઈપણ અર્ધમાં સામેલ કરવામાં આવતું નથી.
  4. ત્રીજું ક્વાર્ટાઈલ (Q3) ની ગણતરી કરો:
    • આ ડેટાના ઉપરના અર્ધમાં મધ્યમ છે.
    • જો ડેટા પોઈન્ટ્સની સંખ્યા વિઘાત છે, તો મધ્યમને કોઈપણ અર્ધમાં સામેલ કરવામાં આવતું નથી.
  5. આંતરક્વાર્ટાઇલ શ્રેણી (IQR) ની ગણતરી કરો = Q3 - Q1.
  6. વિસ્કર્સ નિર્ધારિત કરો:
    • નીચો વિસ્કર: Q1 - 1.5 * IQR કરતાં મોટા નાના ડેટા પોઈન્ટ.
    • ઊંચો વિસ્કર: Q3 + 1.5 * IQR કરતાં નાના મોટા ડેટા પોઈન્ટ.
  7. આઉટલાયર્સની ઓળખ કરો: કોઈપણ ડેટા પોઈન્ટ્સ જે નીચા વિસ્કરથી નીચે અથવા ઊંચા વિસ્કરથી ઉપર છે.

તે નોંધવું મહત્વપૂર્ણ છે કે ક્વાર્ટાઈલની ગણતરી માટે વિવિધ પદ્ધતિઓ છે, ખાસ કરીને જ્યારે સમ સંખ્યાના તત્વો ધરાવતી ડેટાસેટ સાથે વ્યવહાર કરવામાં આવે છે. ઉપર દર્શાવેલ પદ્ધતિ "વિશિષ્ટ" પદ્ધતિ તરીકે ઓળખાય છે, પરંતુ "સમાવિષ્ટ" પદ્ધતિ અથવા "મધ્યમના મધ્યમ" પદ્ધતિ જેવી અન્ય પદ્ધતિઓ પણ ઉપયોગમાં લઈ શકાય છે. પદ્ધતિનો પસંદગી Q1 અને Q3 ની સ્થિતિને થોડું અસર કરી શકે છે, ખાસ કરીને નાના ડેટાસેટ માટે.

વ્યાખ્યા

Q3 મધ્યમ Q1 લઘુત્તમ મહત્તમ બોક્સ પ્લોટ ઘટકો
  • પ્લોટમાં બોક્સ આંતરક્વાર્ટાઇલ શ્રેણી (IQR) ને દર્શાવે છે, બોક્સની નીચે Q1 પર અને ઉપર Q3 પર છે.
  • બોક્સની અંદર લાઇન મધ્યમ (Q2) ને દર્શાવે છે.
  • વિસ્કર્સ બોક્સથી ન્યૂનતમ અને મહત્તમ મૂલ્યો સુધી વિસ્તરે છે, આઉટલાયર્સને છોડી દેવામાં આવે છે.
  • આઉટલાયર્સ વિસ્કર્સની બહાર અલગ પોઈન્ટ્સ તરીકે દર્શાવવામાં આવે છે.

બોક્સ પ્લોટ ડેટા વિશે અનેક માહિતી આપે છે:

  • કેન્દ્રિય ઝૂકાવ: મધ્યમ ડેટાસેટનું કેન્દ્રિય મૂલ્ય દર્શાવે છે.
  • ફેરફાર: IQR અને ન્યૂનતમથી મહત્તમ સુધીનો કુલ ફેલાવ ડેટાના વિતરણને દર્શાવે છે.
  • ઝુકાવ: જો મધ્યમ બોક્સમાં કેન્દ્રિત નથી, તો તે ડેટામાં ઝુકાવ દર્શાવે છે.
  • આઉટલાયર્સ: વિસ્કર્સની બહારના પોઈન્ટ્સ સંભવિત આઉટલાયર્સ અથવા અતિશય મૂલ્યોને હાઇલાઇટ કરે છે.

ઉપયોગના કેસ

બોક્સ પ્લોટ વિવિધ ક્ષેત્રોમાં ઉપયોગી છે, જેમાં સામેલ છે:

  1. આંકડાશાસ્ત્ર: ડેટાના વિતરણ અને ઝુકાવને દર્શાવવા માટે. ઉદાહરણ તરીકે, વિવિધ શાળાઓ અથવા વર્ગોમાં પરીક્ષા ગુણોની તુલના કરવી.

  2. ડેટા વિશ્લેષણ: આઉટલાયર્સની ઓળખ કરવા અને વિતરણોની તુલના કરવા માટે. બિઝનેસમાં, તે વિવિધ પ્રદેશો અથવા સમયગાળાઓમાં વેચાણના ડેટાને વિશ્લેષણ કરવા માટે ઉપયોગમાં લેવામાં આવી શકે છે.

  3. વૈજ્ઞાનિક સંશોધન: પરિણામો રજૂ કરવા અને જૂથોની તુલના કરવા માટે. ઉદાહરણ તરીકે, તબીબી અભ્યાસોમાં વિવિધ ઉપચારની અસરકારકતાની તુલના કરવી.

  4. ગુણવત્તા નિયંત્રણ: પ્રક્રિયા ચરિત્રોને મોનિટર કરવા અને અનિયમિતતાઓને ઓળખવા માટે. ઉત્પાદનમાં, તે ઉત્પાદનના પરિમાણોને ટ્રેક કરવા માટે ઉપયોગમાં લેવામાં આવી શકે છે અને ખાતરી કરે છે કે તે સ્વીકાર્ય શ્રેણીમાં છે.

  5. નાણાં: સ્ટોક ભાવના ચળવળ અને અન્ય નાણાકીય મેટ્રિક્સને વિશ્લેષણ કરવા માટે. ઉદાહરણ તરીકે, સમયગાળામાં વિવિધ મ્યુચ્યુઅલ ફંડના પ્રદર્શનની તુલના કરવી.

  6. પર્યાવરણ વિજ્ઞાન: પર્યાવરણના ડેટાને વિશ્લેષણ અને તુલના કરવા માટે, જેમ કે વિવિધ સ્થળો અથવા સમયગાળાઓમાં પ્રદૂષણના સ્તરો અથવા તાપમાનના ફેરફારો.

  7. રમતગમત વિશ્લેષણ: ટીમો અથવા સીઝનોમાં ખેલાડીના પ્રદર્શનના આંકડાઓની તુલના કરવા માટે.

વિકલ્પો

જ્યારે બોક્સ પ્લોટ ડેટા વિઝ્યુલાઇઝેશન માટે શક્તિશાળી સાધન છે, ત્યારે વિશિષ્ટ વિશ્લેષણની જરૂરિયાતો અનુસાર કેટલાક વિકલ્પો છે:

  1. હિસ્ટોગ્રામ: ડેટાસેટના ફ્રીક્વન્સી વિતરણને દર્શાવવા માટે ઉપયોગી. તેઓ વિતરણના આકાર વિશે વધુ વિગતો પ્રદાન કરે છે પરંતુ ઘણા ડેટાસેટની તુલના કરવા માટે ઓછા અસરકારક હોઈ શકે છે.

  2. વાયોલિન પ્લોટ: બોક્સ પ્લોટના લક્ષણોને કર્નલ ઘનતા પ્લોટ સાથે જોડે છે, જે વિવિધ મૂલ્યો પર ડેટાની સંભાવિતતા ઘનતા દર્શાવે છે.

  3. સ્કેટર પ્લોટ: બે ચરિત્રો વચ્ચેના સંબંધને દર્શાવવા માટે આદર્શ, જે બોક્સ પ્લોટ કરી શકતું નથી.

  4. બાર ચાર્ટ: વિવિધ કેટેગરીઝમાં એકલ મૂલ્યોની તુલના કરવા માટે યોગ્ય.

  5. લાઇન ગ્રાફ: સમય દરમિયાન ઝુકાવને દર્શાવવા માટે અસરકારક, જે બોક્સ પ્લોટ સારી રીતે કૅપ્ચર કરી શકતું નથી.

  6. હીટમેપ: એકથી વધુ ચરિત્રો સાથેના જટિલ ડેટાસેટને દર્શાવવા માટે ઉપયોગી.

આ વિકલ્પો વચ્ચેની પસંદગી ડેટાના સ્વભાવ અને એક વ્યક્તિને સંકેત આપવા માંગતા વિશિષ્ટ માહિતી પર આધાર રાખે છે.

ઇતિહાસ

બોક્સ પ્લોટનું શોધક જ્હોન ટુકી છે, જે 1970 માં શોધવામાં આવ્યું અને 1977 માં તેની પુસ્તક "એક્સ્પ્લોરેટરી ડેટા એનાલિસિસ" માં પ્રથમ વખત દેખાયું. ટુકીના મૂળ ડિઝાઇન, જેને "સ્કીમેટિક પ્લોટ" કહેવામાં આવે છે, એ માત્ર મધ્યમ, ક્વાર્ટાઈલ અને અતિશય મૂલ્યોને દર્શાવતું હતું.

બોક્સ પ્લોટના ઇતિહાસમાં મુખ્ય વિકાસમાં સામેલ છે:

  1. 1978: મેકગિલ, ટુકી, અને લાર્સન દ્વારા નોટેડ બોક્સ પ્લોટ રજૂ કરવામાં આવ્યું, જે મધ્યમ માટે વિશ્વસનીયતા અંતર ઉમેરે છે.

  2. 1980ના દાયકાઓ: બોક્સ પ્લોટમાં "આઉટલાયર્સ" નો વિચાર વધુ પ્રમાણભૂત બની ગયો, સામાન્ય રીતે ક્વાર્ટાઈલ્સથી 1.5 ગણું IQRથી બહારના પોઈન્ટ્સ તરીકે વ્યાખ્યાયિત કરવામાં આવે છે.

  3. 1990ના દાયકાઓ-2000ના દાયકાઓ: કમ્પ્યુટર ગ્રાફિક્સના આગમન સાથે, ચલણ પહોળાઈના બોક્સ પ્લોટ અને વાયોલિન પ્લોટ જેવી વિવિધતાઓ વિકસિત કરવામાં આવી.

  4. વર્તમાન દિવસ: ઇન્ટરેક્ટિવ અને ડાયનામિક બોક્સ પ્લોટ ડેટા વિઝ્યુલાઇઝેશન સોફ્ટવેરમાં સામાન્ય બની ગઈ છે, જે વપરાશકર્તાઓને આધારભૂત ડેટા પોઈન્ટ્સને શોધવા માટે મંજૂરી આપે છે.

બોક્સ પ્લોટ સમયની પરીક્ષા સહન કરી છે કારણ કે તે જટિલ ડેટાસેટ્સને સંક્ષિપ્ત કરવા માટેની સરળતા અને અસરકારકતા ધરાવે છે. તેઓ ઘણા ક્ષેત્રોમાં ડેટા વિશ્લેષણમાં એક સ્થાયી સાધન તરીકે રહે છે.

કોડ નમૂનાઓ

અહીં વિવિધ પ્રોગ્રામિંગ ભાષાઓમાં બોક્સ પ્લોટ બનાવવા માટેના ઉદાહરણો છે:

=QUARTILE(A1:A100,1)  ' Q1
=MEDIAN(A1:A100)      ' મધ્યમ
=QUARTILE(A1:A100,3)  ' Q3
=MIN(A1:A100)         ' લઘુત્તમ
=MAX(A1:A100)         ' મહત્તમ
## માન્યતા રાખો કે 'ડેટા' તમારી સંખ્યાઓની વેક્ટર છે
boxplot(data)
% માન્યતા રાખો કે 'ડેટા' તમારી સંખ્યાઓની વેક્ટર છે
boxplot(data)
// D3.js નો ઉપયોગ કરીને
var svg = d3.select("body").append("svg")
    .attr("width", 400)
    .attr("height", 300);

var data = [/* તમારું ડેટા એરે */];

var boxplot = svg.append("g")
    .datum(data)
    .call(d3.boxplot());
import matplotlib.pyplot as plt
import numpy as np

data = [/* તમારું ડેટા એરે */]
plt.boxplot(data)
plt.show()
import org.jfree.chart.ChartFactory;
import org.jfree.chart.ChartPanel;
import org.jfree.chart.JFreeChart;
import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;

DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
dataset.add(Arrays.asList(/* તમારું ડેટા */), "Series 1", "Category 1");

JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
    "બોક્સ પ્લોટ", "કેટેગરી", "મૂલ્ય", dataset, true);

સંદર્ભો

  1. ટુકી, જેઓ ડબલ્યુ. (1977). એક્સ્પ્લોરેટરી ડેટા એનાલિસિસ. એડિસન-વેસ્લી.
  2. મેકગિલ, આર., ટુકી, જેઓ ડબલ્યુ., & લાર્સન, ડબલ્યુ. એ. (1978). બોક્સ પ્લોટના વિવિધતા. અમેરિકન આંકડાશાસ્ત્રી, 32(1), 12-16.
  3. વિલિયમસન, ડી. એફ., પાર્કર, આર. એ., & કેન્ડ્રિક, જેએસ. (1989). બોક્સ પ્લોટ: ડેટાને વ્યાખ્યાયિત કરવા માટેનો એક સરળ દૃશ્ય પદ્ધતિ. આંતરિક મેડિસિનના એનાલ્સ, 110(11), 916-921.
  4. વિકહમ, એચ., & સ્ટ્રીજેવસ્કી, એલ. (2011). 40 વર્ષના બોક્સ પ્લોટ. ટેકનિકલ રિપોર્ટ, had.co.nz.
  5. ફ્રિગ્ગે, એમ., હોાગલિન, ડી. સી., & ઇગ્લેવિચ, બીએ. (1989). બોક્સપ્લોટના કેટલાક અમલ. અમેરિકન આંકડાશાસ્ત્રી, 43(1), 50-54.
Feedback