તમારા ડેટાસેટનો દૃશ્યમાન વિશ્લેષણ બનાવો બોક્સ-એન્ડ-વિસ્કર પ્લોટનો ઉપયોગ કરીને. આ ટૂલ ક્વાર્ટાઇલ, મધ્યમ અને આઉટલાયર્સ સહિતના મુખ્ય આંકડાકીય માપોની ગણતરી કરે છે અને દર્શાવે છે.
બોક્સ પ્લોટ, જેને બોક્સ-એન્ડ-વિસ્કર પ્લોટ તરીકે પણ ઓળખવામાં આવે છે, તે ડેટાના વિતરણને દર્શાવવાનો એક માનક માર્ગ છે જે પાંચ-નંબરના સારાંશ પર આધારિત છે: લઘુત્તમ, પ્રથમ ક્વાર્ટાઈલ (Q1), મધ્યમ, ત્રીજું ક્વાર્ટાઈલ (Q3), અને મહત્તમ. આ કેલ્ક્યુલેટર તમને આપેલ સંખ્યાત્મક ડેટાના સેટમાંથી બોક્સ પ્લોટ જનરેટ કરવાની મંજૂરી આપે છે, જે ડેટા વિઝ્યુલાઇઝેશન અને વિશ્લેષણ માટે એક શક્તિશાળી સાધન છે.
બોક્સ પ્લોટની ગણતરીમાં ઉપયોગમાં લેવાતા મુખ્ય સૂત્રો છે:
મધ્યમ (Q2): n તત્વોની ઓર્ડર કરેલી ડેટાસેટ માટે,
x_{\frac{n+1}{2}} & \text{જો n વિઘાત છે} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{જો n સમ છે} \end{cases} $$પ્રથમ ક્વાર્ટાઈલ (Q1) અને ત્રીજું ક્વાર્ટાઈલ (Q3):
આંતરક્વાર્ટાઇલ શ્રેણી (IQR):
વિસ્કર્સ:
આઉટલાયર્સ: કોઈપણ ડેટા પોઈન્ટ્સ જે ન્યૂનતમ વિસ્કરથી નીચે અથવા મહત્તમ વિસ્કરથી ઉપર છે.
કેલ્ક્યુલેટર બોક્સ પ્લોટ જનરેટ કરવા માટે નીચેના પગલાંઓને અમલમાં લાવે છે:
તે નોંધવું મહત્વપૂર્ણ છે કે ક્વાર્ટાઈલની ગણતરી માટે વિવિધ પદ્ધતિઓ છે, ખાસ કરીને જ્યારે સમ સંખ્યાના તત્વો ધરાવતી ડેટાસેટ સાથે વ્યવહાર કરવામાં આવે છે. ઉપર દર્શાવેલ પદ્ધતિ "વિશિષ્ટ" પદ્ધતિ તરીકે ઓળખાય છે, પરંતુ "સમાવિષ્ટ" પદ્ધતિ અથવા "મધ્યમના મધ્યમ" પદ્ધતિ જેવી અન્ય પદ્ધતિઓ પણ ઉપયોગમાં લઈ શકાય છે. પદ્ધતિનો પસંદગી Q1 અને Q3 ની સ્થિતિને થોડું અસર કરી શકે છે, ખાસ કરીને નાના ડેટાસેટ માટે.
બોક્સ પ્લોટ ડેટા વિશે અનેક માહિતી આપે છે:
બોક્સ પ્લોટ વિવિધ ક્ષેત્રોમાં ઉપયોગી છે, જેમાં સામેલ છે:
આંકડાશાસ્ત્ર: ડેટાના વિતરણ અને ઝુકાવને દર્શાવવા માટે. ઉદાહરણ તરીકે, વિવિધ શાળાઓ અથવા વર્ગોમાં પરીક્ષા ગુણોની તુલના કરવી.
ડેટા વિશ્લેષણ: આઉટલાયર્સની ઓળખ કરવા અને વિતરણોની તુલના કરવા માટે. બિઝનેસમાં, તે વિવિધ પ્રદેશો અથવા સમયગાળાઓમાં વેચાણના ડેટાને વિશ્લેષણ કરવા માટે ઉપયોગમાં લેવામાં આવી શકે છે.
વૈજ્ઞાનિક સંશોધન: પરિણામો રજૂ કરવા અને જૂથોની તુલના કરવા માટે. ઉદાહરણ તરીકે, તબીબી અભ્યાસોમાં વિવિધ ઉપચારની અસરકારકતાની તુલના કરવી.
ગુણવત્તા નિયંત્રણ: પ્રક્રિયા ચરિત્રોને મોનિટર કરવા અને અનિયમિતતાઓને ઓળખવા માટે. ઉત્પાદનમાં, તે ઉત્પાદનના પરિમાણોને ટ્રેક કરવા માટે ઉપયોગમાં લેવામાં આવી શકે છે અને ખાતરી કરે છે કે તે સ્વીકાર્ય શ્રેણીમાં છે.
નાણાં: સ્ટોક ભાવના ચળવળ અને અન્ય નાણાકીય મેટ્રિક્સને વિશ્લેષણ કરવા માટે. ઉદાહરણ તરીકે, સમયગાળામાં વિવિધ મ્યુચ્યુઅલ ફંડના પ્રદર્શનની તુલના કરવી.
પર્યાવરણ વિજ્ઞાન: પર્યાવરણના ડેટાને વિશ્લેષણ અને તુલના કરવા માટે, જેમ કે વિવિધ સ્થળો અથવા સમયગાળાઓમાં પ્રદૂષણના સ્તરો અથવા તાપમાનના ફેરફારો.
રમતગમત વિશ્લેષણ: ટીમો અથવા સીઝનોમાં ખેલાડીના પ્રદર્શનના આંકડાઓની તુલના કરવા માટે.
જ્યારે બોક્સ પ્લોટ ડેટા વિઝ્યુલાઇઝેશન માટે શક્તિશાળી સાધન છે, ત્યારે વિશિષ્ટ વિશ્લેષણની જરૂરિયાતો અનુસાર કેટલાક વિકલ્પો છે:
હિસ્ટોગ્રામ: ડેટાસેટના ફ્રીક્વન્સી વિતરણને દર્શાવવા માટે ઉપયોગી. તેઓ વિતરણના આકાર વિશે વધુ વિગતો પ્રદાન કરે છે પરંતુ ઘણા ડેટાસેટની તુલના કરવા માટે ઓછા અસરકારક હોઈ શકે છે.
વાયોલિન પ્લોટ: બોક્સ પ્લોટના લક્ષણોને કર્નલ ઘનતા પ્લોટ સાથે જોડે છે, જે વિવિધ મૂલ્યો પર ડેટાની સંભાવિતતા ઘનતા દર્શાવે છે.
સ્કેટર પ્લોટ: બે ચરિત્રો વચ્ચેના સંબંધને દર્શાવવા માટે આદર્શ, જે બોક્સ પ્લોટ કરી શકતું નથી.
બાર ચાર્ટ: વિવિધ કેટેગરીઝમાં એકલ મૂલ્યોની તુલના કરવા માટે યોગ્ય.
લાઇન ગ્રાફ: સમય દરમિયાન ઝુકાવને દર્શાવવા માટે અસરકારક, જે બોક્સ પ્લોટ સારી રીતે કૅપ્ચર કરી શકતું નથી.
હીટમેપ: એકથી વધુ ચરિત્રો સાથેના જટિલ ડેટાસેટને દર્શાવવા માટે ઉપયોગી.
આ વિકલ્પો વચ્ચેની પસંદગી ડેટાના સ્વભાવ અને એક વ્યક્તિને સંકેત આપવા માંગતા વિશિષ્ટ માહિતી પર આધાર રાખે છે.
બોક્સ પ્લોટનું શોધક જ્હોન ટુકી છે, જે 1970 માં શોધવામાં આવ્યું અને 1977 માં તેની પુસ્તક "એક્સ્પ્લોરેટરી ડેટા એનાલિસિસ" માં પ્રથમ વખત દેખાયું. ટુકીના મૂળ ડિઝાઇન, જેને "સ્કીમેટિક પ્લોટ" કહેવામાં આવે છે, એ માત્ર મધ્યમ, ક્વાર્ટાઈલ અને અતિશય મૂલ્યોને દર્શાવતું હતું.
બોક્સ પ્લોટના ઇતિહાસમાં મુખ્ય વિકાસમાં સામેલ છે:
1978: મેકગિલ, ટુકી, અને લાર્સન દ્વારા નોટેડ બોક્સ પ્લોટ રજૂ કરવામાં આવ્યું, જે મધ્યમ માટે વિશ્વસનીયતા અંતર ઉમેરે છે.
1980ના દાયકાઓ: બોક્સ પ્લોટમાં "આઉટલાયર્સ" નો વિચાર વધુ પ્રમાણભૂત બની ગયો, સામાન્ય રીતે ક્વાર્ટાઈલ્સથી 1.5 ગણું IQRથી બહારના પોઈન્ટ્સ તરીકે વ્યાખ્યાયિત કરવામાં આવે છે.
1990ના દાયકાઓ-2000ના દાયકાઓ: કમ્પ્યુટર ગ્રાફિક્સના આગમન સાથે, ચલણ પહોળાઈના બોક્સ પ્લોટ અને વાયોલિન પ્લોટ જેવી વિવિધતાઓ વિકસિત કરવામાં આવી.
વર્તમાન દિવસ: ઇન્ટરેક્ટિવ અને ડાયનામિક બોક્સ પ્લોટ ડેટા વિઝ્યુલાઇઝેશન સોફ્ટવેરમાં સામાન્ય બની ગઈ છે, જે વપરાશકર્તાઓને આધારભૂત ડેટા પોઈન્ટ્સને શોધવા માટે મંજૂરી આપે છે.
બોક્સ પ્લોટ સમયની પરીક્ષા સહન કરી છે કારણ કે તે જટિલ ડેટાસેટ્સને સંક્ષિપ્ત કરવા માટેની સરળતા અને અસરકારકતા ધરાવે છે. તેઓ ઘણા ક્ષેત્રોમાં ડેટા વિશ્લેષણમાં એક સ્થાયી સાધન તરીકે રહે છે.
અહીં વિવિધ પ્રોગ્રામિંગ ભાષાઓમાં બોક્સ પ્લોટ બનાવવા માટેના ઉદાહરણો છે:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' મધ્યમ
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' લઘુત્તમ
5=MAX(A1:A100) ' મહત્તમ
6
1## માન્યતા રાખો કે 'ડેટા' તમારી સંખ્યાઓની વેક્ટર છે
2boxplot(data)
3
1% માન્યતા રાખો કે 'ડેટા' તમારી સંખ્યાઓની વેક્ટર છે
2boxplot(data)
3
1// D3.js નો ઉપયોગ કરીને
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* તમારું ડેટા એરે */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* તમારું ડેટા એરે */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* તમારું ડેટા */), "Series 1", "Category 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "બોક્સ પ્લોટ", "કેટેગરી", "મૂલ્ય", dataset, true);
11
તમારા વર્કફ્લો માટે ઉપયોગી થવાના વધુ સાધનો શોધો