બોક્સ પ્લોટ કેલ્ક્યુલેટર
બોક્સ પ્લોટ કેલ્ક્યુલેટર
પરિચય
બોક્સ પ્લોટ, જેને બોક્સ-એન્ડ-વિસ્કર પ્લોટ તરીકે પણ ઓળખવામાં આવે છે, તે ડેટાના વિતરણને દર્શાવવાનો એક માનક માર્ગ છે જે પાંચ-નંબરના સારાંશ પર આધારિત છે: લઘુત્તમ, પ્રથમ ક્વાર્ટાઈલ (Q1), મધ્યમ, ત્રીજું ક્વાર્ટાઈલ (Q3), અને મહત્તમ. આ કેલ્ક્યુલેટર તમને આપેલ સંખ્યાત્મક ડેટાના સેટમાંથી બોક્સ પ્લોટ જનરેટ કરવાની મંજૂરી આપે છે, જે ડેટા વિઝ્યુલાઇઝેશન અને વિશ્લેષણ માટે એક શક્તિશાળી સાધન છે.
આ કેલ્ક્યુલેટરને કેવી રીતે ઉપયોગ કરવો
- ઇનપુટ ફીલ્ડમાં સંખ્યાઓની કોમા અથવા જગ્યા દ્વારા અલગ કરેલી યાદી તરીકે તમારું ડેટા દાખલ કરો.
- કેલ્ક્યુલેટર આપોઆપ બોક્સ પ્લોટના આંકડાકીય માહિતીની ગણતરી કરશે અને પરિણામો દર્શાવશે.
- પરિણામો નીચે બોક્સ પ્લોટનું દૃશ્ય પ્રતિનિધિત્વ બતાવવામાં આવશે.
- તમે "કોપી પરિણામ" બટનનો ઉપયોગ કરીને ગણતરી કરેલ પરિણામો કોપી કરી શકો છો.
સૂત્ર
બોક્સ પ્લોટની ગણતરીમાં ઉપયોગમાં લેવાતા મુખ્ય સૂત્રો છે:
-
મધ્યમ (Q2): n તત્વોની ઓર્ડર કરેલી ડેટાસેટ માટે,
x_{\frac{n+1}{2}} & \text{જો n વિઘાત છે} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{જો n સમ છે} \end{cases} $$ -
પ્રથમ ક્વાર્ટાઈલ (Q1) અને ત્રીજું ક્વાર્ટાઈલ (Q3):
-
આંતરક્વાર્ટાઇલ શ્રેણી (IQR):
-
વિસ્કર્સ:
-
આઉટલાયર્સ: કોઈપણ ડેટા પોઈન્ટ્સ જે ન્યૂનતમ વિસ્કરથી નીચે અથવા મહત્તમ વિસ્કરથી ઉપર છે.
ગણતરી
કેલ્ક્યુલેટર બોક્સ પ્લોટ જનરેટ કરવા માટે નીચેના પગલાંઓને અમલમાં લાવે છે:
- ઇનપુટ ડેટાને વધતી ક્રમમાં સોર્ટ કરો.
- મધ્યમ (Q2) ની ગણતરી કરો:
- જો ડેટા પોઈન્ટ્સની સંખ્યા વિઘાત છે, તો મધ્યમ મધ્યમ મૂલ્ય છે.
- જો ડેટા પોઈન્ટ્સની સંખ્યા સમ છે, તો મધ્યમ બે મધ્યમ મૂલ્યનું સરેરાશ છે.
- પ્રથમ ક્વાર્ટાઈલ (Q1) ની ગણતરી કરો:
- આ ડેટાના નીચલા અર્ધમાં મધ્યમ છે.
- જો ડેટા પોઈન્ટ્સની સંખ્યા વિઘાત છે, તો મધ્યમને કોઈપણ અર્ધમાં સામેલ કરવામાં આવતું નથી.
- ત્રીજું ક્વાર્ટાઈલ (Q3) ની ગણતરી કરો:
- આ ડેટાના ઉપરના અર્ધમાં મધ્યમ છે.
- જો ડેટા પોઈન્ટ્સની સંખ્યા વિઘાત છે, તો મધ્યમને કોઈપણ અર્ધમાં સામેલ કરવામાં આવતું નથી.
- આંતરક્વાર્ટાઇલ શ્રેણી (IQR) ની ગણતરી કરો = Q3 - Q1.
- વિસ્કર્સ નિર્ધારિત કરો:
- નીચો વિસ્કર: Q1 - 1.5 * IQR કરતાં મોટા નાના ડેટા પોઈન્ટ.
- ઊંચો વિસ્કર: Q3 + 1.5 * IQR કરતાં નાના મોટા ડેટા પોઈન્ટ.
- આઉટલાયર્સની ઓળખ કરો: કોઈપણ ડેટા પોઈન્ટ્સ જે નીચા વિસ્કરથી નીચે અથવા ઊંચા વિસ્કરથી ઉપર છે.
તે નોંધવું મહત્વપૂર્ણ છે કે ક્વાર્ટાઈલની ગણતરી માટે વિવિધ પદ્ધતિઓ છે, ખાસ કરીને જ્યારે સમ સંખ્યાના તત્વો ધરાવતી ડેટાસેટ સાથે વ્યવહાર કરવામાં આવે છે. ઉપર દર્શાવેલ પદ્ધતિ "વિશિષ્ટ" પદ્ધતિ તરીકે ઓળખાય છે, પરંતુ "સમાવિષ્ટ" પદ્ધતિ અથવા "મધ્યમના મધ્યમ" પદ્ધતિ જેવી અન્ય પદ્ધતિઓ પણ ઉપયોગમાં લઈ શકાય છે. પદ્ધતિનો પસંદગી Q1 અને Q3 ની સ્થિતિને થોડું અસર કરી શકે છે, ખાસ કરીને નાના ડેટાસેટ માટે.
વ્યાખ્યા
- પ્લોટમાં બોક્સ આંતરક્વાર્ટાઇલ શ્રેણી (IQR) ને દર્શાવે છે, બોક્સની નીચે Q1 પર અને ઉપર Q3 પર છે.
- બોક્સની અંદર લાઇન મધ્યમ (Q2) ને દર્શાવે છે.
- વિસ્કર્સ બોક્સથી ન્યૂનતમ અને મહત્તમ મૂલ્યો સુધી વિસ્તરે છે, આઉટલાયર્સને છોડી દેવામાં આવે છે.
- આઉટલાયર્સ વિસ્કર્સની બહાર અલગ પોઈન્ટ્સ તરીકે દર્શાવવામાં આવે છે.
બોક્સ પ્લોટ ડેટા વિશે અનેક માહિતી આપે છે:
- કેન્દ્રિય ઝૂકાવ: મધ્યમ ડેટાસેટનું કેન્દ્રિય મૂલ્ય દર્શાવે છે.
- ફેરફાર: IQR અને ન્યૂનતમથી મહત્તમ સુધીનો કુલ ફેલાવ ડેટાના વિતરણને દર્શાવે છે.
- ઝુકાવ: જો મધ્યમ બોક્સમાં કેન્દ્રિત નથી, તો તે ડેટામાં ઝુકાવ દર્શાવે છે.
- આઉટલાયર્સ: વિસ્કર્સની બહારના પોઈન્ટ્સ સંભવિત આઉટલાયર્સ અથવા અતિશય મૂલ્યોને હાઇલાઇટ કરે છે.
ઉપયોગના કેસ
બોક્સ પ્લોટ વિવિધ ક્ષેત્રોમાં ઉપયોગી છે, જેમાં સામેલ છે:
-
આંકડાશાસ્ત્ર: ડેટાના વિતરણ અને ઝુકાવને દર્શાવવા માટે. ઉદાહરણ તરીકે, વિવિધ શાળાઓ અથવા વર્ગોમાં પરીક્ષા ગુણોની તુલના કરવી.
-
ડેટા વિશ્લેષણ: આઉટલાયર્સની ઓળખ કરવા અને વિતરણોની તુલના કરવા માટે. બિઝનેસમાં, તે વિવિધ પ્રદેશો અથવા સમયગાળાઓમાં વેચાણના ડેટાને વિશ્લેષણ કરવા માટે ઉપયોગમાં લેવામાં આવી શકે છે.
-
વૈજ્ઞાનિક સંશોધન: પરિણામો રજૂ કરવા અને જૂથોની તુલના કરવા માટે. ઉદાહરણ તરીકે, તબીબી અભ્યાસોમાં વિવિધ ઉપચારની અસરકારકતાની તુલના કરવી.
-
ગુણવત્તા નિયંત્રણ: પ્રક્રિયા ચરિત્રોને મોનિટર કરવા અને અનિયમિતતાઓને ઓળખવા માટે. ઉત્પાદનમાં, તે ઉત્પાદનના પરિમાણોને ટ્રેક કરવા માટે ઉપયોગમાં લેવામાં આવી શકે છે અને ખાતરી કરે છે કે તે સ્વીકાર્ય શ્રેણીમાં છે.
-
નાણાં: સ્ટોક ભાવના ચળવળ અને અન્ય નાણાકીય મેટ્રિક્સને વિશ્લેષણ કરવા માટે. ઉદાહરણ તરીકે, સમયગાળામાં વિવિધ મ્યુચ્યુઅલ ફંડના પ્રદર્શનની તુલના કરવી.
-
પર્યાવરણ વિજ્ઞાન: પર્યાવરણના ડેટાને વિશ્લેષણ અને તુલના કરવા માટે, જેમ કે વિવિધ સ્થળો અથવા સમયગાળાઓમાં પ્રદૂષણના સ્તરો અથવા તાપમાનના ફેરફારો.
-
રમતગમત વિશ્લેષણ: ટીમો અથવા સીઝનોમાં ખેલાડીના પ્રદર્શનના આંકડાઓની તુલના કરવા માટે.
વિકલ્પો
જ્યારે બોક્સ પ્લોટ ડેટા વિઝ્યુલાઇઝેશન માટે શક્તિશાળી સાધન છે, ત્યારે વિશિષ્ટ વિશ્લેષણની જરૂરિયાતો અનુસાર કેટલાક વિકલ્પો છે:
-
હિસ્ટોગ્રામ: ડેટાસેટના ફ્રીક્વન્સી વિતરણને દર્શાવવા માટે ઉપયોગી. તેઓ વિતરણના આકાર વિશે વધુ વિગતો પ્રદાન કરે છે પરંતુ ઘણા ડેટાસેટની તુલના કરવા માટે ઓછા અસરકારક હોઈ શકે છે.
-
વાયોલિન પ્લોટ: બોક્સ પ્લોટના લક્ષણોને કર્નલ ઘનતા પ્લોટ સાથે જોડે છે, જે વિવિધ મૂલ્યો પર ડેટાની સંભાવિતતા ઘનતા દર્શાવે છે.
-
સ્કેટર પ્લોટ: બે ચરિત્રો વચ્ચેના સંબંધને દર્શાવવા માટે આદર્શ, જે બોક્સ પ્લોટ કરી શકતું નથી.
-
બાર ચાર્ટ: વિવિધ કેટેગરીઝમાં એકલ મૂલ્યોની તુલના કરવા માટે યોગ્ય.
-
લાઇન ગ્રાફ: સમય દરમિયાન ઝુકાવને દર્શાવવા માટે અસરકારક, જે બોક્સ પ્લોટ સારી રીતે કૅપ્ચર કરી શકતું નથી.
-
હીટમેપ: એકથી વધુ ચરિત્રો સાથેના જટિલ ડેટાસેટને દર્શાવવા માટે ઉપયોગી.
આ વિકલ્પો વચ્ચેની પસંદગી ડેટાના સ્વભાવ અને એક વ્યક્તિને સંકેત આપવા માંગતા વિશિષ્ટ માહિતી પર આધાર રાખે છે.
ઇતિહાસ
બોક્સ પ્લોટનું શોધક જ્હોન ટુકી છે, જે 1970 માં શોધવામાં આવ્યું અને 1977 માં તેની પુસ્તક "એક્સ્પ્લોરેટરી ડેટા એનાલિસિસ" માં પ્રથમ વખત દેખાયું. ટુકીના મૂળ ડિઝાઇન, જેને "સ્કીમેટિક પ્લોટ" કહેવામાં આવે છે, એ માત્ર મધ્યમ, ક્વાર્ટાઈલ અને અતિશય મૂલ્યોને દર્શાવતું હતું.
બોક્સ પ્લોટના ઇતિહાસમાં મુખ્ય વિકાસમાં સામેલ છે:
-
1978: મેકગિલ, ટુકી, અને લાર્સન દ્વારા નોટેડ બોક્સ પ્લોટ રજૂ કરવામાં આવ્યું, જે મધ્યમ માટે વિશ્વસનીયતા અંતર ઉમેરે છે.
-
1980ના દાયકાઓ: બોક્સ પ્લોટમાં "આઉટલાયર્સ" નો વિચાર વધુ પ્રમાણભૂત બની ગયો, સામાન્ય રીતે ક્વાર્ટાઈલ્સથી 1.5 ગણું IQRથી બહારના પોઈન્ટ્સ તરીકે વ્યાખ્યાયિત કરવામાં આવે છે.
-
1990ના દાયકાઓ-2000ના દાયકાઓ: કમ્પ્યુટર ગ્રાફિક્સના આગમન સાથે, ચલણ પહોળાઈના બોક્સ પ્લોટ અને વાયોલિન પ્લોટ જેવી વિવિધતાઓ વિકસિત કરવામાં આવી.
-
વર્તમાન દિવસ: ઇન્ટરેક્ટિવ અને ડાયનામિક બોક્સ પ્લોટ ડેટા વિઝ્યુલાઇઝેશન સોફ્ટવેરમાં સામાન્ય બની ગઈ છે, જે વપરાશકર્તાઓને આધારભૂત ડેટા પોઈન્ટ્સને શોધવા માટે મંજૂરી આપે છે.
બોક્સ પ્લોટ સમયની પરીક્ષા સહન કરી છે કારણ કે તે જટિલ ડેટાસેટ્સને સંક્ષિપ્ત કરવા માટેની સરળતા અને અસરકારકતા ધરાવે છે. તેઓ ઘણા ક્ષેત્રોમાં ડેટા વિશ્લેષણમાં એક સ્થાયી સાધન તરીકે રહે છે.
કોડ નમૂનાઓ
અહીં વિવિધ પ્રોગ્રામિંગ ભાષાઓમાં બોક્સ પ્લોટ બનાવવા માટેના ઉદાહરણો છે:
=QUARTILE(A1:A100,1) ' Q1
=MEDIAN(A1:A100) ' મધ્યમ
=QUARTILE(A1:A100,3) ' Q3
=MIN(A1:A100) ' લઘુત્તમ
=MAX(A1:A100) ' મહત્તમ
સંદર્ભો
- ટુકી, જેઓ ડબલ્યુ. (1977). એક્સ્પ્લોરેટરી ડેટા એનાલિસિસ. એડિસન-વેસ્લી.
- મેકગિલ, આર., ટુકી, જેઓ ડબલ્યુ., & લાર્સન, ડબલ્યુ. એ. (1978). બોક્સ પ્લોટના વિવિધતા. અમેરિકન આંકડાશાસ્ત્રી, 32(1), 12-16.
- વિલિયમસન, ડી. એફ., પાર્કર, આર. એ., & કેન્ડ્રિક, જેએસ. (1989). બોક્સ પ્લોટ: ડેટાને વ્યાખ્યાયિત કરવા માટેનો એક સરળ દૃશ્ય પદ્ધતિ. આંતરિક મેડિસિનના એનાલ્સ, 110(11), 916-921.
- વિકહમ, એચ., & સ્ટ્રીજેવસ્કી, એલ. (2011). 40 વર્ષના બોક્સ પ્લોટ. ટેકનિકલ રિપોર્ટ, had.co.nz.
- ફ્રિગ્ગે, એમ., હોાગલિન, ડી. સી., & ઇગ્લેવિચ, બીએ. (1989). બોક્સપ્લોટના કેટલાક અમલ. અમેરિકન આંકડાશાસ્ત્રી, 43(1), 50-54.