ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ನ ದೃಶ್ಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಬಾಕ್ಸ್ ಮತ್ತು ವಿಸ್ಕರ್ ಪ್ಲಾಟ್ ಬಳಸಿಕೊಂಡು ಉತ್ಪಾದಿಸಿ. ಈ ಸಾಧನವು ಕ್ವಾರ್ಟೈಲ್ಗಳು, ಮಧ್ಯಮ ಮತ್ತು ಔಟ್ಲಿಯರ್ಗಳನ್ನು ಒಳಗೊಂಡ ಪ್ರಮುಖ ಸಂಖ್ಯಾತ್ಮಕ ಕ್ರಮಗಳನ್ನು ಲೆಕ್ಕಹಾಕುತ್ತದೆ ಮತ್ತು ಪ್ರದರ್ಶಿಸುತ್ತದೆ.
Box plot, ಅಥವಾ ಬಾಕ್ಸ್ ಮತ್ತು ವಿಸ್ಕರ್ ಪ್ಲಾಟ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ, ಇದು ಐದು ಸಂಖ್ಯೆಗಳ ಸಾರಾಂಶದ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾದ ವಿತರಣೆಯನ್ನು ಪ್ರದರ್ಶಿಸಲು ಪ್ರಮಾಣಿತ ಮಾರ್ಗವಾಗಿದೆ: ಕನಿಷ್ಠ, ಮೊದಲ ಕ್ವಾರ್ಟೈಲ್ (Q1), ಮಧ್ಯಮ, ಮೂರನೇ ಕ್ವಾರ್ಟೈಲ್ (Q3), ಮತ್ತು ಗರಿಷ್ಠ. ಈ ಕ್ಯಾಲ್ಕುಲೇಟರ್ ನಿಮಗೆ ನೀಡಲಾದ ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾ ಸೆಟ್ನಿಂದ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಅನ್ನು ಉತ್ಪಾದಿಸಲು ಅನುಮತಿಸುತ್ತದೆ, ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಮತ್ತು ವಿಶ್ಲೇಷಣೆಗೆ ಶಕ್ತಿಯುತ ಸಾಧನವನ್ನು ಒದಗಿಸುತ್ತದೆ.
ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಲೆಕ್ಕಹಾಕಲು ಬಳಸುವ ಪ್ರಮುಖ ಸೂತ್ರಗಳು:
ಮಧ್ಯಮ (Q2): n ಅಂಶಗಳ ಆದೇಶಿತ ಡೇಟಾಸೆಟ್ಗಾಗಿ,
x_{\frac{n+1}{2}} & \text{if n is odd} \\ \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) & \text{if n is even} \end{cases} $$ಮೊದಲ ಕ್ವಾರ್ಟೈಲ್ (Q1) ಮತ್ತು ಮೂರನೇ ಕ್ವಾರ್ಟೈಲ್ (Q3):
ಇಂಟರ್ಕ್ವಾರ್ಟೈಲ್ ಶ್ರೇಣಿಯ (IQR):
ವಿಸ್ಕರ್ಗಳು:
ಔಟ್ಲಿಯರ್ಗಳು: ಕೆಳಗಿನ ವಿಸ್ಕರ್ ಅಥವಾ ಮೇಲಿನ ವಿಸ್ಕರ್ಗಿಂತ ಕಡಿಮೆ ಇರುವ ಯಾವುದೇ ಡೇಟಾ ಅಂಶಗಳು.
ಕ್ಯಾಲ್ಕುಲೇಟರ್ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಅನ್ನು ಉತ್ಪಾದಿಸಲು ಈ ಹಂತಗಳನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ:
ಕೋಷ್ಟಕಗಳ ಲೆಕ್ಕಹಾಕಲು ವಿವಿಧ ವಿಧಾನಗಳಿವೆ, ವಿಶೇಷವಾಗಿ ಸಮ ಸಂಖ್ಯೆಯ ಅಂಶಗಳೊಂದಿಗೆ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ನಿರ್ವಹಿಸುವಾಗ. ಮೇಲಿನ ವಿವರಣೆ "ವ್ಯತ್ಯಾಸ" ವಿಧಾನ ಎಂದು ಕರೆಯಲ್ಪಡುತ್ತದೆ, ಆದರೆ "ಒಪ್ಪಿಗೆಯ" ವಿಧಾನ ಅಥವಾ "ಮಧ್ಯಮಗಳ ಮಧ್ಯಮ" ವಿಧಾನವನ್ನು ಬಳಸಬಹುದು. ವಿಧಾನವನ್ನು ಆಯ್ಕೆ ಮಾಡುವುದು Q1 ಮತ್ತು Q3 ನ ಸ್ಥಳವನ್ನು ಸ್ವಲ್ಪ ಪರಿಣಾಮ ಬೀರುವುದನ್ನು ಗಮನಿಸುವುದು ಮುಖ್ಯವಾಗಿದೆ, ವಿಶೇಷವಾಗಿ ಸಣ್ಣ ಡೇಟಾಸೆಟ್ಗಳಿಗೆ.
ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಡೇಟಾದ ಬಗ್ಗೆ ಹಲವಾರು ಅರ್ಥಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ:
ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು ವಿವಿಧ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಉಪಯುಕ್ತವಾಗಿವೆ, ಒಳಗೊಂಡಂತೆ:
ಅಂಕಿ ಶಾಸ್ತ್ರ: ಡೇಟಾದ ವಿತರಣೆಯನ್ನು ಮತ್ತು ತಿರುವನ್ನು ದೃಶ್ಯೀಕರಿಸಲು. ಉದಾಹರಣೆಗೆ, ವಿವಿಧ ಶಾಲೆಗಳ ಅಥವಾ ತರಗತಿಗಳ ನಡುವಿನ ಪರೀಕ್ಷಾ ಅಂಕಗಳನ್ನು ಹೋಲಿಸುವುದು.
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ: ಔಟ್ಲಿಯರ್ಗಳನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ವಿತರಣೆಯನ್ನು ಹೋಲಿಸಲು. ವ್ಯವಹಾರದಲ್ಲಿ, ಇದು ವಿಭಿನ್ನ ಪ್ರದೇಶಗಳ ಅಥವಾ ಕಾಲಾವಧಿಗಳ ವ್ಯಾಪಾರ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಬಳಸಬಹುದು.
ವೈಜ್ಞಾನಿಕ ಸಂಶೋಧನೆ: ಫಲಿತಾಂಶಗಳನ್ನು ಪ್ರದರ್ಶಿಸಲು ಮತ್ತು ಗುಂಪುಗಳನ್ನು ಹೋಲಿಸಲು. ಉದಾಹರಣೆಗೆ, ವೈದ್ಯಕೀಯ ಅಧ್ಯಯನಗಳಲ್ಲಿ ವಿಭಿನ್ನ ಚಿಕಿತ್ಸೆಗಳ ಪರಿಣಾಮಕಾರಿತ್ವವನ್ನು ಹೋಲಿಸುವುದು.
ಗುಣಮಟ್ಟದ ನಿಯಂತ್ರಣ: ಪ್ರಕ್ರಿಯೆಯ ಚರಗಳನ್ನು ಪರಿಶೀಲಿಸಲು ಮತ್ತು ಅನಾಮಲಿಗಳನ್ನು ಗುರುತಿಸಲು. ಉತ್ಪಾದನೆಯಲ್ಲಿ, ಇದು ಉತ್ಪನ್ನದ ಆಯಾಮಗಳನ್ನು ಟ್ರಾಕ್ ಮಾಡಲು ಮತ್ತು ಅವುಗಳು ಸ್ವೀಕೃತ ಶ್ರೇಣಿಯೊಳಗೆ ಬರುವುದನ್ನು ಖಚಿತಪಡಿಸಲು ಬಳಸಬಹುದು.
ಹಣಕಾಸು: ಷೇರು ಬೆಲೆಯ ಚಲನೆಗಳು ಮತ್ತು ಇತರ ಹಣಕಾಸು ಮೆಟ್ರಿಕ್ಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು. ಉದಾಹರಣೆಗೆ, ವಿಭಿನ್ನ ಮ್ಯೂಚುಯಲ್ ಫಂಡ್ಗಳ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೋಲಿಸುವುದು.
ಪರಿಸರ ವಿಜ್ಞಾನ: ವಿಭಿನ್ನ ಸ್ಥಳಗಳಲ್ಲಿ ಅಥವಾ ಕಾಲಾವಧಿಗಳಲ್ಲಿನ ಮಾಲಿನ್ಯ ಮಟ್ಟಗಳು ಅಥವಾ ತಾಪಮಾನ ವ್ಯತ್ಯಾಸಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಮತ್ತು ಹೋಲಿಸಲು.
ಕ್ರೀಡಾ ವಿಶ್ಲೇಷಣೆ: ತಂಡಗಳು ಅಥವಾ ಋತುವಿನ ನಡುವಿನ ಆಟಗಾರರ ಕಾರ್ಯಕ್ಷಮತೆಯ ಅಂಕಿಗಳನ್ನು ಹೋಲಿಸಲು.
ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು ಡೇಟಾ ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ ಶಕ್ತಿಯುತ ಸಾಧನಗಳಾಗಿದ್ದರೂ, ವಿಶ್ಲೇಷಣೆಯ ನಿರ್ದಿಷ್ಟ ಅಗತ್ಯಗಳ ಆಧಾರದ ಮೇಲೆ ಹಲವಾರು ಪರ್ಯಾಯಗಳಿವೆ:
ಹಿಸ್ಟೋಗ್ರಾಮ್ಗಳು: ಡೇಟಾಸೆಟ್ನ ಅಂಕಿಯ ವಿತರಣೆಯನ್ನು ತೋರಿಸಲು ಉಪಯುಕ್ತ. ಇವು ವಿತರಣೆಯ ರೂಪವನ್ನು ಕುರಿತು ಹೆಚ್ಚಿನ ವಿವರಗಳನ್ನು ಒದಗಿಸುತ್ತವೆ ಆದರೆ ಹಲವಾರು ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಹೋಲಿಸಲು ಕಡಿಮೆ ಪರಿಣಾಮಕಾರಿ ಆಗಬಹುದು.
ವೈಯೋಲಿನ್ ಪ್ಲಾಟ್ಗಳು: ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಕಿರ್ನೆಲ್ ಡೆನ್ಸಿಟಿ ಪ್ಲಾಟ್ಗಳೊಂದಿಗೆ ಒಡನೆ ಸೇರಿಸುತ್ತವೆ, ವಿಭಿನ್ನ ಮೌಲ್ಯಗಳಲ್ಲಿ ಡೇಟಾದ ಸಂಭವನೀಯತೆಯ ಘನತೆಯನ್ನು ತೋರಿಸುತ್ತವೆ.
ಸ್ಕ್ಯಾಟರ್ ಪ್ಲಾಟ್ಗಳು: ಎರಡು ಚರಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ತೋರಿಸಲು ಉತ್ತಮ, ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು ಇದನ್ನು ಮಾಡುತ್ತಿಲ್ಲ.
ಬಾರ್ ಚಾರ್ಟ್ಗಳು: ವಿಭಿನ್ನ ವರ್ಗಗಳ ನಡುವಿನ ಏಕಕಾಲದ ಮೌಲ್ಯಗಳನ್ನು ಹೋಲಿಸಲು ಸೂಕ್ತ.
ಲೈನ್ ಗ್ರಾಫ್ಗಳು: ಕಾಲಾವಧಿಯಲ್ಲಿನ ಪ್ರವೃತ್ತಿಗಳನ್ನು ತೋರಿಸಲು ಪರಿಣಾಮಕಾರಿ, ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು ಇದನ್ನು ಉತ್ತಮವಾಗಿ ಹಿಡಿದಿಲ್ಲ.
ಹೀಟ್ಮಾಪ್ಗಳು: ಬಹು ಚರಗಳೊಂದಿಗೆ ಸಂಕೀರ್ಣ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ದೃಶ್ಯೀಕರಿಸಲು ಉಪಯುಕ್ತ.
ಈ ಪರ್ಯಾಯಗಳ ನಡುವಿನ ಆಯ್ಕೆ ಡೇಟಾದ ಸ್ವಭಾವ ಮತ್ತು ಒಬ್ಬ ವ್ಯಕ್ತಿ ಒದಗಿಸಲು ಬಯಸುವ ನಿರ್ದಿಷ್ಟ ಅರ್ಥಗಳ ಆಧಾರದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ.
ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಅನ್ನು 1970 ರಲ್ಲಿ ಜಾನ್ ಟುಕಿಯು ಆವಿಷ್ಕಾರ ಮಾಡಿದರು ಮತ್ತು 1977 ರಲ್ಲಿ ಅವರ ಪುಸ್ತಕ "ಎಕ್ಸ್ಪ್ಲೋರೇಟರಿ ಡೇಟಾ ಅನಾಲಿಸಿಸ್" ನಲ್ಲಿ ಮೊದಲ ಬಾರಿಗೆ ಕಾಣಿಸಿಕೊಂಡಿತು. ಟುಕಿಯು ಮೂಲ ವಿನ್ಯಾಸ, "ಸ್ಕೀಮಾಟಿಕ್ ಪ್ಲಾಟ್" ಅನ್ನು, ಮಧ್ಯಮ, ಕ್ವಾರ್ಟೈಲ್ಗಳು ಮತ್ತು ತೀವ್ರ ಮೌಲ್ಯಗಳನ್ನು ಮಾತ್ರ ಪ್ರದರ್ಶಿಸುತ್ತಿತ್ತು.
ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳ ಐತಿಹಾಸದಲ್ಲಿ ಪ್ರಮುಖ ಅಭಿವೃದ್ಧಿಗಳು ಒಳಗೊಂಡಿವೆ:
1978: ಮೆಕಗಿಲ್, ಟುಕಿಯು ಮತ್ತು ಲಾರ್ಸನ್ ಮಧ್ಯಮಕ್ಕೆ ವಿಶ್ವಾಸಾರ್ಹತೆ ಅಂತರಗಳನ್ನು ಸೇರಿಸುವ ನೋಟೆಡ್ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಅನ್ನು ಪರಿಚಯಿಸಿದರು.
1980 ರ ದಶಕ: ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳಲ್ಲಿ "ಔಟ್ಲಿಯರ್ಗಳು" ಎಂಬ ಪರಿಕಲ್ಪನೆ ಹೆಚ್ಚು ಪ್ರಮಾಣೀಕೃತವಾಗಿದೆ, ಸಾಮಾನ್ಯವಾಗಿ ಕ್ವಾರ್ಟೈಲ್ಗಳಿಂದ 1.5 ಪಟ್ಟು IQR ಮೀರಿದ ಅಂಕಿಗಳನ್ನು ಗುರುತಿಸಲಾಗುತ್ತದೆ.
1990 ರ ದಶಕದಿಂದ 2000 ರ ದಶಕ: ಕಂಪ್ಯೂಟರ್ ಗ್ರಾಫಿಕ್ಸ್ನ ಉಲ್ಲೇಖದಿಂದ, ಬದಲಾವಣೆಯ ಅಗಲ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು ಮತ್ತು ವೈಯೋಲಿನ್ ಪ್ಲಾಟ್ಗಳು ಅಭಿವೃದ್ಧಿ ಪಡಿಸಲಾಯಿತು.
ಪ್ರಸ್ತುತ ದಿನ: ಪರಸ್ಪರ ಮತ್ತು ಚಲನೆಯ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಸಾಫ್ಟ್ವೇರ್ನಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿವೆ, ಬಳಕೆದಾರರಿಗೆ ಅಡಿಯಲ್ಲಿ ಇರುವ ಡೇಟಾ ಅಂಶಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಅವಕಾಶ ನೀಡುತ್ತವೆ.
ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು ಸಂಕೀರ್ಣ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಸಾರಾಂಶಗೊಳಿಸಲು ಅವರ ಸರಳತೆ ಮತ್ತು ಪರಿಣಾಮಕಾರಿತ್ವದ ಕಾರಣದಿಂದ ಕಾಲಾವಧಿಯ ಪರೀಕ್ಷೆಯನ್ನು ಸಹನೆಗೊಂಡಿವೆ. ಇವು ಹಲವಾರು ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿನ ಮುಖ್ಯಸ್ಥರಾಗಿವೆ.
ಇಲ್ಲಿ ವಿವಿಧ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಭಾಷೆಗಳಲ್ಲಿ ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ ಅನ್ನು ರಚಿಸಲು ಉದಾಹರಣೆಗಳಿವೆ:
1=QUARTILE(A1:A100,1) ' Q1
2=MEDIAN(A1:A100) ' ಮಧ್ಯಮ
3=QUARTILE(A1:A100,3) ' Q3
4=MIN(A1:A100) ' ಕನಿಷ್ಠ
5=MAX(A1:A100) ' ಗರಿಷ್ಠ
6
1## 'ಡೇಟಾ' ನಿಮ್ಮ ಸಂಖ್ಯೆಗಳ ವೆಕ್ಟರ್ ಎಂದು ಪರಿಗಣಿಸಿದರೆ
2boxplot(data)
3
1% 'ಡೇಟಾ' ನಿಮ್ಮ ಸಂಖ್ಯೆಗಳ ವೆಕ್ಟರ್ ಎಂದು ಪರಿಗಣಿಸಿದರೆ
2boxplot(data)
3
1// D3.js ಅನ್ನು ಬಳಸುವುದು
2var svg = d3.select("body").append("svg")
3 .attr("width", 400)
4 .attr("height", 300);
5
6var data = [/* ನಿಮ್ಮ ಡೇಟಾ ಅರೆ */];
7
8var boxplot = svg.append("g")
9 .datum(data)
10 .call(d3.boxplot());
11
1import matplotlib.pyplot as plt
2import numpy as np
3
4data = [/* ನಿಮ್ಮ ಡೇಟಾ ಅರೆ */]
5plt.boxplot(data)
6plt.show()
7
1import org.jfree.chart.ChartFactory;
2import org.jfree.chart.ChartPanel;
3import org.jfree.chart.JFreeChart;
4import org.jfree.data.statistics.DefaultBoxAndWhiskerCategoryDataset;
5
6DefaultBoxAndWhiskerCategoryDataset dataset = new DefaultBoxAndWhiskerCategoryDataset();
7dataset.add(Arrays.asList(/* ನಿಮ್ಮ ಡೇಟಾ */), "Series 1", "Category 1");
8
9JFreeChart chart = ChartFactory.createBoxAndWhiskerChart(
10 "ಬಾಕ್ಸ್ ಪ್ಲಾಟ್", "ವರ್ಗ", "ಮೌಲ್ಯ", dataset, true);
11
ನಿಮ್ಮ ಕೆಲಸದ ಹಂತಕ್ಕೆ ಉಪಯೋಗಿಸಬಹುದಾದ ಹೆಚ್ಚು ಉಪಕರಣಗಳನ್ನು ಹುಡುಕಿ ಹೊಸ ಉಪಕರಣಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ