మీ డేటాసెట్ యొక్క దృశ్య విశ్లేషణను బాక్స్-అండ్-విస్కర్ ప్లాట్ ఉపయోగించి రూపొందించండి. ఈ సాధనం క్వార్టైల్స్, మధ్యమ మరియు అవుట్లయర్స్ వంటి కీలక గణాంక కొలతలను లెక్కిస్తుంది మరియు ప్రదర్శిస్తుంది.
બોક્સ પ્લોટ, જેને બોક્સ-એન્ડ-વિસ્કર પ્લોટ તરીકે પણ ઓળખવામાં આવે છે, તે પાંચ-નમ્બર સારાંશ પર આધારિત ડેટાના વિતરણને દર્શાવવાનો એક માનક માર્ગ છે: ન્યૂનતમ, પ્રથમ ક્વાર્ટાઇલ (Q1), મધ્યમ, ત્રીજા ક્વાર્ટાઇલ (Q3), અને મહત્તમ. આ કેલ્ક્યુલેટર તમને આપેલા સંખ્યાત્મક ડેટાના સેટમાંથી બોક્સ પ્લોટ જનરેટ કરવાની મંજૂરી આપે છે, જે ડેટા દૃશ્યીકરણ અને વિશ્લેષણ માટે એક શક્તિશાળી સાધન છે.
બોક્સ પ્લોટની ગણતરીમાં ઉપયોગમાં લેવાતા મુખ્ય સૂત્રો છે:
મધ્યમ (Q2): n તત્વોની ઓર્ડર કરેલી ડેટાસેટ માટે,
x_{\frac{n+1}{2}} & \text{જો n અંકલ છે} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{જો n સમ છે} \end{cases} $$પ્રથમ ક્વાર્ટાઇલ (Q1) અને ત્રીજા ક્વાર્ટાઇલ (Q3):
ઇન્ટરક્વાર્ટાઇલ રેન્જ (IQR):
વિસ્કર્સ:
આઉટલાયર્સ: કોઈપણ ડેટા પોઈન્ટ્સ જે નીચેના વિસ્કર અથવા ઉપરના વિસ્કરથી વધુ હોય.
કેલ્ક્યુલેટર બોક્સ પ્લોટ જનરેટ કરવા માટે નીચેના પગલાં કરે છે:
એવું નોંધવું મહત્વપૂર્ણ છે કે ક્વાર્ટાઇલ્સની ગણતરી માટે વિવિધ પદ્ધતિઓ છે, ખાસ કરીને જ્યારે સમ સંખ્યાના તત્વો ધરાવતી ડેટાસેટ સાથે કામ કરવામાં આવે છે. ઉપર દર્શાવેલી પદ્ધતિ "વિશિષ્ટ" પદ્ધતિ તરીકે ઓળખાય છે, પરંતુ "સમાવિષ્ટ" પદ્ધતિ અથવા "મધ્યમના મધ્યમ" પદ્ધતિ જેવી અન્ય પદ્ધતિઓ પણ ઉપયોગમાં લેવાઈ શકે છે. પદ્ધતિની પસંદગી Q1 અને Q3 ના સ્થાનને થોડી અસર કરી શકે છે, ખાસ કરીને નાના ડેટાસેટ માટે.
બોક્સ પ્લોટ ડેટા વિશે અનેક માહિતી પ્રદાન કરે છે:
બોક્સ પ્લોટ વિવિધ ક્ષેત્રોમાં ઉપયોગી છે, જેમાં સમાવેશ થાય છે:
આંકડાશાસ્ત્ર: ડેટાના વિતરણ અને ઝુકાવને દૃશ્યમાન કરવા માટે. ઉદાહરણ તરીકે, વિવિધ શાળાઓ અથવા વર્ગો વચ્ચે પરીક્ષા સ્કોરની સરખામણી કરવી.
ડેટા વિશ્લેષણ: આઉટલાયર્સ ઓળખવા અને વિતરણની સરખામણી કરવા માટે. બિઝનેસમાં, આનો ઉપયોગ વિવિધ પ્રદેશો અથવા સમયગાળાઓમાં વેચાણ ડેટાને વિશ્લેષણ કરવા માટે થઈ શકે છે.
વૈજ્ઞાનિક સંશોધન: પરિણામો રજૂ કરવા અને જૂથોની સરખામણી કરવા માટે. ઉદાહરણ તરીકે, મેડિકલ અભ્યાસોમાં વિવિધ ઉપચારની અસરકારકતાની સરખામણી કરવી.
ગુણવત્તા નિયંત્રણ: પ્રક્રિયા ચરિત્રો પર દેખરેખ રાખવા અને અનિયમિતતાઓ ઓળખવા માટે. ઉત્પાદનમાં, આનો ઉપયોગ ઉત્પાદનના પરિમાણોને ટ્રેક કરવા માટે થઈ શકે છે અને સુસંગત શ્રેણીમાં રહેવા માટે.
નાણાં: શેરના ભાવની ગતિઓ અને અન્ય નાણાંકીય મેટ્રિક્સને વિશ્લેષણ કરવા માટે. ઉદાહરણ તરીકે, સમય સાથે વિવિધ મ્યુચ્યુઅલ ફંડના પ્રદર્શનની સરખામણી કરવી.
પર્યાવરણ વિજ્ઞાન: પર્યાવરણ ડેટાને વિશ્લેષણ અને સરખામણી કરવા માટે, જેમ કે પ્રદૂષણના સ્તરો અથવા વિવિધ સ્થળો અથવા સમયગાળાઓમાં તાપમાનના ફેરફારો.
રમતગમત વિશ્લેષણ: ટીમો અથવા સીઝનો વચ્ચે ખેલાડીના પ્રદર્શનના આંકડાઓની સરખામણી કરવા માટે.
જ્યારે બોક્સ પ્લોટ ડેટા દૃશ્યીકરણ માટે શક્તિશાળી સાધન છે, ત્યારે વિશિષ્ટ વિશ્લેષણની જરૂરિયાતો પર આધાર રાખીને કેટલાક વિકલ્પો છે:
હિસ્ટોગ્રામ: ડેટાસેટના ફ્રીક્વન્સી વિતરણને દર્શાવવા માટે ઉપયોગી. તે વિતરણના આકાર વિશે વધુ વિગતો પ્રદાન કરે છે પરંતુ એકથી વધુ ડેટાસેટની સરખામણી માટે ઓછા અસરકારક હોઈ શકે છે.
વાયોલિન પ્લોટ: બોક્સ પ્લોટના લક્ષણોને કર્નલ ઘનતા પ્લોટ સાથે જોડે છે, જે વિવિધ મૂલ્યો પર ડેટાની સંભાવના ઘનતા દર્શાવે છે.
સ્કેટર પ્લોટ: બે ચલ વચ્ચેના સંબંધને દર્શાવવા માટે આદર્શ, જે બોક્સ પ્લોટ કરી શકતા નથી.
બાર ચાર્ટ: વિવિધ કેટેગરીઝમાં એકલ મૂલ્યોની સરખામણી કરવા માટે યોગ્ય.
લાઇન ગ્રાફ: સમય દરમિયાન પ્રવૃત્તિઓ દર્શાવવા માટે અસરકારક, જે બોક્સ પ્લોટ સારી રીતે કવર કરી શકતા નથી.
હીટમેપ: જટિલ ડેટાસેટને અનેક ચલોથી દૃશ્યમાન કરવા માટે ઉપયોગી.
આ વિકલ્પો વચ્ચેનો પસંદગી ડેટાના સ્વભાવ અને એક વ્યક્તિને સંકેત આપવાની ચોક્કસ માહિતી પર આધાર રાખે છે.
બોક્સ પ્લોટનો શોધક જ્હોન ટુકી છે, જે 1970માં શોધવામાં આવ્યો હતો અને 1977માં તેમના પુસ્તક "એક્સપ્લોરેટરી ડેટા એનાલિસિસ"માં પ્રથમ વખત પ્રગટ થયો હતો. ટુકીનો મૂળ ડિઝાઇન, જેને "સ્કીમેટિક પ્લોટ" કહેવામાં આવે છે, તે માત્ર મધ્યમ, ક્વાર્ટાઇલ અને અતિશય મૂલ્યોને દર્શાવતું હતું.
બોક્સ પ્લોટના ઇતિહાસમાં મુખ્ય વિકાસમાં સમાવેશ થાય છે:
1978: મેકગિલ, ટુકી, અને લાર્સન દ્વારા નોટેડ બોક્સ પ્લોટ રજૂ કરવામાં આવ્યો, જે મધ્યમ માટે વિશ્વાસની અંતરાલો ઉમેરે છે.
1980ના દાયકાઓ: બોક્સ પ્લોટમાં "આઉટલાયર્સ" ની સંકલ્પના વધુ માનક બની ગઈ, સામાન્ય રીતે ક્વાર્ટાઇલ્સમાંથી 1.5 ગણા IQRથી વધુ પોઈન્ટ્સ તરીકે વ્યાખ્યાયિત કરવામાં આવી.
1990ના દાયકાઓ-2000ના દાયકાઓ: કમ્પ્યુટર ગ્રાફિક્સના ઉદ્ભવ સાથે, વેરિએબલ પહોળાઈના બોક્સ પ્લોટ અને વાયોલિન પ્લોટ જેવી ભિન્નતાઓ વિકસિત થઈ.
વર્તમાન દિવસ: ઇન્ટરેક્ટિવ અને ગતિશીલ બોક્સ પ્લોટ ડેટા દૃશ્યીકરણ સોફ્ટવેરમાં સામાન્ય બની ગયા છે, જે વપરાશકર્તાઓને આધારભૂત ડેટા પોઈન્ટ્સને અન્વેષણ કરવાની મંજૂરી આપે છે.
બોક્સ પ્લોટ સમયની પરીક્ષા પસાર કરી છે કારણ કે તેઓ જટિલ ડેટાસેટને સંક્ષિપ્ત અને અસરકારક રીતે સારાંશિત કરે છે. તેઓ ઘણા ક્ષેત્રોમાં ડેટા વિશ્લેષણમાં એક સ્થાયી સાધન તરીકે રહે છે.
અહીં વિવિધ પ્રોગ્રામિંગ ભાષાઓમાં બોક્સ પ્લોટ બનાવવા માટેના ઉદાહરણો છે:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' મધ્યમ
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' ન્યૂનતમ
5=MAX(A1:A100) ' મહત્તમ
6
1## માનીએ કે 'ડેટા' તમારા સંખ્યાનો વેક્ટર છે
2boxplot(data)
3
1% માનીએ કે 'ડેટા' તમારા સંખ્યાનો વેક્ટર છે
2boxplot(data)
3
1// D3.js નો ઉપયોગ કરીને
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* તમારા ડેટા એરે */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* તમારા ડેટા એરે */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* તમારા ડેટા */), "સિરીઝ 1", "શ્રેણી 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "બોક્સ પ્લોટ", "શ્રેણી", "મૂલ્ય", dataset, true);
11
మీ వర్క్ఫ్లో కోసం ఉపయోగపడవచ్చే ఇతర సాధనాలను కనుగొనండి