🛠️

Whiz Tools

Build • Create • Innovate

బాక్స్-అండ్-విస్కర్ ప్లాట్ డేటా విశ్లేషణ సాధనం

మీ డేటాసెట్ యొక్క దృశ్య విశ్లేషణను బాక్స్-అండ్-విస్కర్ ప్లాట్ ఉపయోగించి రూపొందించండి. ఈ సాధనం క్వార్టైల్స్, మధ్యమ మరియు అవుట్లయర్స్ వంటి కీలక గణాంక కొలతలను లెక్కిస్తుంది మరియు ప్రదర్శిస్తుంది.

బాక్స్ ప్లాట్ కేల్క్యులేటర్

బాక్స్ ప్లాట్ కేల్క్యులేటర్

📚

డాక్యుమెంటేషన్

બોક્સ પ્લોટ કેલ્ક્યુલેટર

પરિચય

બોક્સ પ્લોટ, જેને બોક્સ-એન્ડ-વિસ્કર પ્લોટ તરીકે પણ ઓળખવામાં આવે છે, તે પાંચ-નમ્બર સારાંશ પર આધારિત ડેટાના વિતરણને દર્શાવવાનો એક માનક માર્ગ છે: ન્યૂનતમ, પ્રથમ ક્વાર્ટાઇલ (Q1), મધ્યમ, ત્રીજા ક્વાર્ટાઇલ (Q3), અને મહત્તમ. આ કેલ્ક્યુલેટર તમને આપેલા સંખ્યાત્મક ડેટાના સેટમાંથી બોક્સ પ્લોટ જનરેટ કરવાની મંજૂરી આપે છે, જે ડેટા દૃશ્યીકરણ અને વિશ્લેષણ માટે એક શક્તિશાળી સાધન છે.

આ કેલ્ક્યુલેટરનો ઉપયોગ કેવી રીતે કરવો

  1. ઇનપુટ ક્ષેત્રમાં સંખ્યાઓની કમા અથવા જગ્યા-વિખંડિત યાદી તરીકે તમારા ડેટા દાખલ કરો.
  2. કેલ્ક્યુલેટર આપોઆપ બોક્સ પ્લોટ આંકડા ગણતરી કરશે અને પરિણામો દર્શાવશે.
  3. પરિણામો નીચે બોક્સ પ્લોટનું દૃશ્યમાન પ્રતિનિધિત્વ દર્શાવવામાં આવશે.
  4. તમે "પરિણામ નકલ કરો" બટનનો ઉપયોગ કરીને ગણતરી કરેલ પરિણામો નકલ કરી શકો છો.

સૂત્ર

બોક્સ પ્લોટની ગણતરીમાં ઉપયોગમાં લેવાતા મુખ્ય સૂત્રો છે:

  1. મધ્યમ (Q2): n તત્વોની ઓર્ડર કરેલી ડેટાસેટ માટે,

    x_{\frac{n+1}{2}} & \text{જો n અંકલ છે} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{જો n સમ છે} \end{cases} $$
  2. પ્રથમ ક્વાર્ટાઇલ (Q1) અને ત્રીજા ક્વાર્ટાઇલ (Q3): Q1=ડેટાના નીચલા અર્ધાના મધ્યમQ1 = \text{ડેટાના નીચલા અર્ધાના મધ્યમ} Q3=ડેટાના ઉપરના અર્ધાના મધ્યમQ3 = \text{ડેટાના ઉપરના અર્ધાના મધ્યમ}

  3. ઇન્ટરક્વાર્ટાઇલ રેન્જ (IQR): IQR=Q3Q1IQR = Q3 - Q1

  4. વિસ્કર્સ: Lower Whisker=max(min(x),Q11.5IQR)\text{Lower Whisker} = \max({\min(x), Q1 - 1.5 * IQR}) Upper Whisker=min(max(x),Q3+1.5IQR)\text{Upper Whisker} = \min({\max(x), Q3 + 1.5 * IQR})

  5. આઉટલાયર્સ: કોઈપણ ડેટા પોઈન્ટ્સ જે નીચેના વિસ્કર અથવા ઉપરના વિસ્કરથી વધુ હોય.

ગણતરી

કેલ્ક્યુલેટર બોક્સ પ્લોટ જનરેટ કરવા માટે નીચેના પગલાં કરે છે:

  1. ઇનપુટ ડેટાને ચડતા ક્રમમાં સૉર્ટ કરો.
  2. મધ્યમ (Q2) ગણો:
    • જો ડેટા પોઈન્ટ્સની સંખ્યા અંકલ છે, તો મધ્યમ મધ્યમ મૂલ્ય છે.
    • જો ડેટા પોઈન્ટ્સની સંખ્યા સમ છે, તો મધ્યમ બે મધ્યમ મૂલ્યોનું સરેરાશ છે.
  3. પ્રથમ ક્વાર્ટાઇલ (Q1) ગણો:
    • આ ડેટાના નીચલા અર્ધાના મધ્યમ છે.
    • જો ડેટા પોઈન્ટ્સની સંખ્યા અંકલ છે, તો મધ્યમને કોઈપણ અર્ધામાં સમાવેશ કરવામાં આવતો નથી.
  4. ત્રીજા ક્વાર્ટાઇલ (Q3) ગણો:
    • આ ડેટાના ઉપરના અર્ધાના મધ્યમ છે.
    • જો ડેટા પોઈન્ટ્સની સંખ્યા અંકલ છે, તો મધ્યમને કોઈપણ અર્ધામાં સમાવેશ કરવામાં આવતો નથી.
  5. ઇન્ટરક્વાર્ટાઇલ રેન્જ (IQR) = Q3 - Q1 ગણો.
  6. વિસ્કર્સ નક્કી કરો:
    • નીચલા વિસ્કર: Q1 - 1.5 * IQR કરતાં વધુ ન્યૂનતમ ડેટા પોઈન્ટ
    • ઉપરના વિસ્કર: Q3 + 1.5 * IQR કરતાં ઓછા મહત્તમ ડેટા પોઈન્ટ
  7. આઉટલાયર્સ ઓળખો: કોઈપણ ડેટા પોઈન્ટ્સ જે નીચલા વિસ્કરથી નીચે અથવા ઉપરના વિસ્કરથી ઉપર હોય.

એવું નોંધવું મહત્વપૂર્ણ છે કે ક્વાર્ટાઇલ્સની ગણતરી માટે વિવિધ પદ્ધતિઓ છે, ખાસ કરીને જ્યારે સમ સંખ્યાના તત્વો ધરાવતી ડેટાસેટ સાથે કામ કરવામાં આવે છે. ઉપર દર્શાવેલી પદ્ધતિ "વિશિષ્ટ" પદ્ધતિ તરીકે ઓળખાય છે, પરંતુ "સમાવિષ્ટ" પદ્ધતિ અથવા "મધ્યમના મધ્યમ" પદ્ધતિ જેવી અન્ય પદ્ધતિઓ પણ ઉપયોગમાં લેવાઈ શકે છે. પદ્ધતિની પસંદગી Q1 અને Q3 ના સ્થાનને થોડી અસર કરી શકે છે, ખાસ કરીને નાના ડેટાસેટ માટે.

વ્યાખ્યા

Q3 મધ્યમ Q1 ન્યૂનતમ મહત્તમ બોક્સ પ્લોટ ઘટકો
  • પ્લોટમાં બોક્સ ઇન્ટરક્વાર્ટાઇલ રેન્જ (IQR)ને પ્રતિનિધિત્વ આપે છે, બોક્સના તળિયે Q1 અને ઉપર Q3 પર.
  • બોક્સની અંદરની રેખા મધ્યમ (Q2)ને પ્રતિનિધિત્વ આપે છે.
  • વિસ્કર્સ બોક્સથી ન્યૂનતમ અને મહત્તમ મૂલ્યો સુધી વિસ્તરે છે, આઉટલાયર્સને છોડી દે છે.
  • આઉટલાયર્સ વિસ્કરથી બહારના અલગ પોઈન્ટ્સ તરીકે ચિહ્નિત કરવામાં આવે છે.

બોક્સ પ્લોટ ડેટા વિશે અનેક માહિતી પ્રદાન કરે છે:

  • કેન્દ્રિય ઝુકાવ: મધ્યમ ડેટાસેટનું કેન્દ્રિય મૂલ્ય દર્શાવે છે.
  • ફેરફાર: IQR અને ન્યૂનતમથી મહત્તમ સુધીનો કુલ વિસંગતિ ડેટાના વિતરણને દર્શાવે છે.
  • ઝુકાવ: જો મધ્યમ બોક્સમાં કેન્દ્રિત ન હોય, તો તે ડેટામાં ઝુકાવ દર્શાવે છે.
  • આઉટલાયર્સ: વિસ્કર્સથી બહારના પોઈન્ટ્સ સંભવિત આઉટલાયર્સ અથવા અતિશય મૂલ્યોને હાઇલાઇટ કરે છે.

ઉપયોગ કેસ

બોક્સ પ્લોટ વિવિધ ક્ષેત્રોમાં ઉપયોગી છે, જેમાં સમાવેશ થાય છે:

  1. આંકડાશાસ્ત્ર: ડેટાના વિતરણ અને ઝુકાવને દૃશ્યમાન કરવા માટે. ઉદાહરણ તરીકે, વિવિધ શાળાઓ અથવા વર્ગો વચ્ચે પરીક્ષા સ્કોરની સરખામણી કરવી.

  2. ડેટા વિશ્લેષણ: આઉટલાયર્સ ઓળખવા અને વિતરણની સરખામણી કરવા માટે. બિઝનેસમાં, આનો ઉપયોગ વિવિધ પ્રદેશો અથવા સમયગાળાઓમાં વેચાણ ડેટાને વિશ્લેષણ કરવા માટે થઈ શકે છે.

  3. વૈજ્ઞાનિક સંશોધન: પરિણામો રજૂ કરવા અને જૂથોની સરખામણી કરવા માટે. ઉદાહરણ તરીકે, મેડિકલ અભ્યાસોમાં વિવિધ ઉપચારની અસરકારકતાની સરખામણી કરવી.

  4. ગુણવત્તા નિયંત્રણ: પ્રક્રિયા ચરિત્રો પર દેખરેખ રાખવા અને અનિયમિતતાઓ ઓળખવા માટે. ઉત્પાદનમાં, આનો ઉપયોગ ઉત્પાદનના પરિમાણોને ટ્રેક કરવા માટે થઈ શકે છે અને સુસંગત શ્રેણીમાં રહેવા માટે.

  5. નાણાં: શેરના ભાવની ગતિઓ અને અન્ય નાણાંકીય મેટ્રિક્સને વિશ્લેષણ કરવા માટે. ઉદાહરણ તરીકે, સમય સાથે વિવિધ મ્યુચ્યુઅલ ફંડના પ્રદર્શનની સરખામણી કરવી.

  6. પર્યાવરણ વિજ્ઞાન: પર્યાવરણ ડેટાને વિશ્લેષણ અને સરખામણી કરવા માટે, જેમ કે પ્રદૂષણના સ્તરો અથવા વિવિધ સ્થળો અથવા સમયગાળાઓમાં તાપમાનના ફેરફારો.

  7. રમતગમત વિશ્લેષણ: ટીમો અથવા સીઝનો વચ્ચે ખેલાડીના પ્રદર્શનના આંકડાઓની સરખામણી કરવા માટે.

વિકલ્પો

જ્યારે બોક્સ પ્લોટ ડેટા દૃશ્યીકરણ માટે શક્તિશાળી સાધન છે, ત્યારે વિશિષ્ટ વિશ્લેષણની જરૂરિયાતો પર આધાર રાખીને કેટલાક વિકલ્પો છે:

  1. હિસ્ટોગ્રામ: ડેટાસેટના ફ્રીક્વન્સી વિતરણને દર્શાવવા માટે ઉપયોગી. તે વિતરણના આકાર વિશે વધુ વિગતો પ્રદાન કરે છે પરંતુ એકથી વધુ ડેટાસેટની સરખામણી માટે ઓછા અસરકારક હોઈ શકે છે.

  2. વાયોલિન પ્લોટ: બોક્સ પ્લોટના લક્ષણોને કર્નલ ઘનતા પ્લોટ સાથે જોડે છે, જે વિવિધ મૂલ્યો પર ડેટાની સંભાવના ઘનતા દર્શાવે છે.

  3. સ્કેટર પ્લોટ: બે ચલ વચ્ચેના સંબંધને દર્શાવવા માટે આદર્શ, જે બોક્સ પ્લોટ કરી શકતા નથી.

  4. બાર ચાર્ટ: વિવિધ કેટેગરીઝમાં એકલ મૂલ્યોની સરખામણી કરવા માટે યોગ્ય.

  5. લાઇન ગ્રાફ: સમય દરમિયાન પ્રવૃત્તિઓ દર્શાવવા માટે અસરકારક, જે બોક્સ પ્લોટ સારી રીતે કવર કરી શકતા નથી.

  6. હીટમેપ: જટિલ ડેટાસેટને અનેક ચલોથી દૃશ્યમાન કરવા માટે ઉપયોગી.

આ વિકલ્પો વચ્ચેનો પસંદગી ડેટાના સ્વભાવ અને એક વ્યક્તિને સંકેત આપવાની ચોક્કસ માહિતી પર આધાર રાખે છે.

ઇતિહાસ

બોક્સ પ્લોટનો શોધક જ્હોન ટુકી છે, જે 1970માં શોધવામાં આવ્યો હતો અને 1977માં તેમના પુસ્તક "એક્સપ્લોરેટરી ડેટા એનાલિસિસ"માં પ્રથમ વખત પ્રગટ થયો હતો. ટુકીનો મૂળ ડિઝાઇન, જેને "સ્કીમેટિક પ્લોટ" કહેવામાં આવે છે, તે માત્ર મધ્યમ, ક્વાર્ટાઇલ અને અતિશય મૂલ્યોને દર્શાવતું હતું.

બોક્સ પ્લોટના ઇતિહાસમાં મુખ્ય વિકાસમાં સમાવેશ થાય છે:

  1. 1978: મેકગિલ, ટુકી, અને લાર્સન દ્વારા નોટેડ બોક્સ પ્લોટ રજૂ કરવામાં આવ્યો, જે મધ્યમ માટે વિશ્વાસની અંતરાલો ઉમેરે છે.

  2. 1980ના દાયકાઓ: બોક્સ પ્લોટમાં "આઉટલાયર્સ" ની સંકલ્પના વધુ માનક બની ગઈ, સામાન્ય રીતે ક્વાર્ટાઇલ્સમાંથી 1.5 ગણા IQRથી વધુ પોઈન્ટ્સ તરીકે વ્યાખ્યાયિત કરવામાં આવી.

  3. 1990ના દાયકાઓ-2000ના દાયકાઓ: કમ્પ્યુટર ગ્રાફિક્સના ઉદ્ભવ સાથે, વેરિએબલ પહોળાઈના બોક્સ પ્લોટ અને વાયોલિન પ્લોટ જેવી ભિન્નતાઓ વિકસિત થઈ.

  4. વર્તમાન દિવસ: ઇન્ટરેક્ટિવ અને ગતિશીલ બોક્સ પ્લોટ ડેટા દૃશ્યીકરણ સોફ્ટવેરમાં સામાન્ય બની ગયા છે, જે વપરાશકર્તાઓને આધારભૂત ડેટા પોઈન્ટ્સને અન્વેષણ કરવાની મંજૂરી આપે છે.

બોક્સ પ્લોટ સમયની પરીક્ષા પસાર કરી છે કારણ કે તેઓ જટિલ ડેટાસેટને સંક્ષિપ્ત અને અસરકારક રીતે સારાંશિત કરે છે. તેઓ ઘણા ક્ષેત્રોમાં ડેટા વિશ્લેષણમાં એક સ્થાયી સાધન તરીકે રહે છે.

કોડ નમૂનાઓ

અહીં વિવિધ પ્રોગ્રામિંગ ભાષાઓમાં બોક્સ પ્લોટ બનાવવા માટેના ઉદાહરણો છે:

1=QUARTILE(A1:A100,1)  ' Q1
2=MEDIAN(A1:A100)      ' મધ્યમ
3=QUARTILE(A1:A100,3)  ' Q3
4=MIN(A1:A100)         ' ન્યૂનતમ
5=MAX(A1:A100)         ' મહત્તમ
6

સંદર્ભો

  1. ટુકી, જેઓ ડબલ્યુ. (1977). એક્સપ્લોરેટરી ડેટા એનાલિસિસ. એડિસન-વેસ્લી.
  2. મેકગિલ, આર., ટુકી, જેઓ ડબલ્યુ., & લાર્સન, ડબલ્યુ. એ. (1978). બોક્સ પ્લોટના વૈવિધ્ય. ધ અમેરિકન સ્ટેટિસ્ટિશિયન, 32(1), 12-16.
  3. વિલિયમસન, ડી. એફ., પાર્કર, આર. એ., & કેન્ડ્રિક, જેએસ. (1989). બોક્સ પ્લોટ: ડેટાને વ્યાખ્યાયિત કરવા માટે એક સરળ દૃશ્ય પદ્ધતિ. એનાલ્સ ઓફ ઇન્ટર્નલ મેડિસિન, 110(11), 916-921.
  4. વિકહમ, એચ., & સ્ટ્રિજેવસ્કી, એલ. (2011). 40 વર્ષના બોક્સ પ્લોટ. ટેકનિકલ રિપોર્ટ, had.co.nz.
  5. ફ્રિગ્ગે, એમ., હોગલિન, ડી. સી., & ઇગ્લેવિક્ઝ, બી. (1989). બોક્સપ્લોટના કેટલાક અમલ. ધ અમેરિકન સ્ટેટિસ્ટિશિયન, 43(1), 50-54.
🔗

సంబంధిత సాధనాలు

మీ పని ప్రవాహానికి ఉపయోగకరమైన మరిన్ని సాధనాలను కనుగొనండి