Καθορίστε τη στατιστική σημαντικότητα των A/B δοκιμών σας εύκολα με τον γρήγορο και αξιόπιστο υπολογιστή μας. Λάβετε άμεσα αποτελέσματα για να πάρετε αποφάσεις βασισμένες σε δεδομένα για το ψηφιακό μάρκετινγκ, την ανάπτυξη προϊόντων και τη βελτιστοποίηση της εμπειρίας χρήστη. Ιδανικό για ιστοσελίδες, email και εφαρμογές κινητών.
Η δοκιμή A/B είναι μια κρίσιμη μέθοδος στο ψηφιακό μάρκετινγκ, την ανάπτυξη προϊόντων και τη βελτιστοποίηση της εμπειρίας χρήστη. Περιλαμβάνει τη σύγκριση δύο εκδόσεων μιας ιστοσελίδας ή εφαρμογής μεταξύ τους για να προσδιοριστεί ποια από τις δύο αποδίδει καλύτερα. Ο υπολογιστής A/B Test μας σας βοηθά να προσδιορίσετε τη στατιστική σημασία των αποτελεσμάτων της δοκιμής σας, διασφαλίζοντας ότι λαμβάνετε αποφάσεις βάσει δεδομένων.
Ο υπολογιστής A/B test χρησιμοποιεί στατιστικές μεθόδους για να προσδιορίσει εάν η διαφορά μεταξύ δύο ομάδων (ομάδα ελέγχου και παραλλαγής) είναι σημαντική. Ο πυρήνας αυτού του υπολογισμού περιλαμβάνει τον υπολογισμό ενός z-score και της αντίστοιχης p-value.
Υπολογίστε τους ρυθμούς μετατροπής για κάθε ομάδα:
και
Όπου:
Υπολογίστε την συγκεντρωτική αναλογία:
Υπολογίστε το τυπικό σφάλμα:
Υπολογίστε το z-score:
Υπολογίστε την p-value:
Η p-value υπολογίζεται χρησιμοποιώντας τη σωρευτική συνάρτηση κατανομής της κανονικής κατανομής. Στις περισσότερες γλώσσες προγραμματισμού, αυτό γίνεται χρησιμοποιώντας ενσωματωμένες συναρτήσεις.
Προσδιορίστε τη στατιστική σημασία:
Εάν η p-value είναι μικρότερη από το επιλεγμένο επίπεδο σημασίας (συνήθως 0.05), το αποτέλεσμα θεωρείται στατιστικά σημαντικό.
Είναι σημαντικό να σημειωθεί ότι αυτή η μέθοδος υποθέτει μια κανονική κατανομή, η οποία είναι γενικά έγκυρη για μεγάλες δείγματα. Για πολύ μικρές δείγματα ή ακραίους ρυθμούς μετατροπής, μπορεί να χρειαστούν πιο προηγμένες στατιστικές μέθοδοι.
Η δοκιμή A/B έχει ευρύ φάσμα εφαρμογών σε διάφορες βιομηχανίες:
Ενώ η δοκιμή A/B είναι ευρέως χρησιμοποιούμενη, υπάρχουν εναλλακτικές μέθοδοι για τη σύγκριση δοκιμών:
Η έννοια της δοκιμής A/B έχει τις ρίζες της στην αγροτική και ιατρική έρευνα από τις αρχές του 20ού αιώνα. Ο Σερ Ρόναλντ Φίσερ, ένας Βρετανός στατιστικός, υπηρέτησε ως πρωτοπόρος στη χρήση τυχαιοποιημένων ελεγχόμενων δοκιμών τη δεκαετία του 1920, θέτοντας τα θεμέλια για τη σύγχρονη δοκιμή A/B.
Στον ψηφιακό τομέα, η δοκιμή A/B απέκτησε σημασία στα τέλη της δεκαετίας του 1990 και στις αρχές της δεκαετίας του 2000 με την άνοδο του ηλεκτρονικού εμπορίου και του ψηφιακού μάρκετινγκ. Η χρήση της δοκιμής A/B από την Google για να προσδιορίσει τον βέλτιστο αριθμό αποτελεσμάτων αναζήτησης που θα εμφανίζονται (2000) και η εκτενής χρήση της μεθόδου από την Amazon για τη βελτιστοποίηση της ιστοσελίδας της αναφέρονται συχνά ως καθοριστικές στιγμές στην δημοτικότητα της ψηφιακής δοκιμής A/B.
Οι στατιστικές μέθοδοι που χρησιμοποιούνται στη δοκιμή A/B έχουν εξελιχθεί με την πάροδο του χρόνου, με τις πρώτες δοκιμές να βασίζονται σε απλές συγκρίσεις ποσοστών μετατροπής. Η εισαγωγή πιο προηγμένων στατιστικών τεχνικών, όπως η χρήση z-scores και p-values, έχει βελτιώσει την ακρίβεια και την αξιοπιστία των αποτελεσμάτων των δοκιμών A/B.
Σήμερα, η δοκιμή A/B είναι αναπόσπαστο μέρος της λήψης αποφάσεων βάσει δεδομένων σε πολλές βιομηχανίες, με πολλές διαθέσιμες λογισμικές εργαλεία και πλατφόρμες για να διευκολύνουν τη διαδικασία.
Ομάδα Ελέγχου: 1000 επισκέπτες, 100 μετατροπές Ομάδα Παραλλαγής: 1000 επισκέπτες, 150 μετατροπές Αποτέλεσμα: Στατιστικά σημαντική βελτίωση
Ομάδα Ελέγχου: 500 επισκέπτες, 50 μετατροπές Ομάδα Παραλλαγής: 500 επισκέπτες, 55 μετατροπές Αποτέλεσμα: Μη στατιστικά σημαντικό
Ακραία Περίπτωση - Μικρό Δείγμα: Ομάδα Ελέγχου: 20 επισκέπτες, 2 μετατροπές Ομάδα Παραλλαγής: 20 επισκέπτες, 6 μετατροπές Αποτέλεσμα: Μη στατιστικά σημαντικό (παρά τη μεγάλη ποσοστιαία διαφορά)
Ακραία Περίπτωση - Μεγάλο Δείγμα: Ομάδα Ελέγχου: 1,000,000 επισκέπτες, 200,000 μετατροπές Ομάδα Παραλλαγής: 1,000,000 επισκέπτες, 201,000 μετατροπές Αποτέλεσμα: Στατιστικά σημαντικό (παρά τη μικρή ποσοστιαία διαφορά)
Ακραία Περίπτωση - Ακραίοι Ρυθμοί Μετατροπής: Ομάδα Ελέγχου: 10,000 επισκέπτες, 9,950 μετατροπές Ομάδα Παραλλαγής: 10,000 επισκέπτες, 9,980 μετατροπές Αποτέλεσμα: Στατιστικά σημαντικό, αλλά η κανονική προσέγγιση μπορεί να μην είναι αξιόπιστη
Θυμηθείτε, η δοκιμή A/B είναι μια συνεχής διαδικασία. Χρησιμοποιήστε τις γνώσεις που αποκτήθηκαν από κάθε δοκιμή για να ενημερώσετε τα μελλοντικά σας πειράματα και να βελτιώσετε συνεχώς τα ψηφιακά προϊόντα και τις προσπάθειες μάρκετινγκ σας.
Ακολουθούν υλοποιήσεις του υπολογισμού A/B test σε διάφορες γλώσσες προγραμματισμού:
1=NORM.S.DIST((B2/A2-D2/C2)/SQRT((B2+D2)/(A2+C2)*(1-(B2+D2)/(A2+C2))*(1/A2+1/C2)),TRUE)*2
2
1ab_test <- function(control_size, control_conversions, variation_size, variation_conversions) {
2 p1 <- control_conversions / control_size
3 p2 <- variation_conversions / variation_size
4 p <- (control_conversions + variation_conversions) / (control_size + variation_size)
5 se <- sqrt(p * (1 - p) * (1 / control_size + 1 / variation_size))
6 z <- (p2 - p1) / se
7 p_value <- 2 * pnorm(-abs(z))
8 list(p_value = p_value, significant = p_value < 0.05)
9}
10
1import scipy.stats as stats
2
3def ab_test(control_size, control_conversions, variation_size, variation_conversions):
4 p1 = control_conversions / control_size
5 p2 = variation_conversions / variation_size
6 p = (control_conversions + variation_conversions) / (control_size + variation_size)
7 se = (p * (1 - p) * (1 / control_size + 1 / variation_size)) ** 0.5
8 z = (p2 - p1) / se
9 p_value = 2 * (1 - stats.norm.cdf(abs(z)))
10 return {"p_value": p_value, "significant": p_value < 0.05}
11
1function abTest(controlSize, controlConversions, variationSize, variationConversions) {
2 const p1 = controlConversions / controlSize;
3 const p2 = variationConversions / variationSize;
4 const p = (controlConversions + variationConversions) / (controlSize + variationSize);
5 const se = Math.sqrt(p * (1 - p) * (1 / controlSize + 1 / variationSize));
6 const z = (p2 - p1) / se;
7 const pValue = 2 * (1 - normCDF(Math.abs(z)));
8 return { pValue, significant: pValue < 0.05 };
9}
10
11function normCDF(x) {
12 const t = 1 / (1 + 0.2316419 * Math.abs(x));
13 const d = 0.3989423 * Math.exp(-x * x / 2);
14 let prob = d * t * (0.3193815 + t * (-0.3565638 + t * (1.781478 + t * (-1.821256 + t * 1.330274))));
15 if (x > 0) prob = 1 - prob;
16 return prob;
17}
18
Ακολουθεί ένα διάγραμμα SVG που απεικονίζει την έννοια της στατιστικής σημασίας στη δοκιμή A/B:
Αυτό το διάγραμμα δείχνει μια κανονική κατανομή, η οποία είναι η βάση για τους υπολογισμούς μας στη δοκιμή A/B. Η περιοχή μεταξύ -1.96 και +1.96 τυπικών αποκλίσεων από τον μέσο όρο αντιπροσωπεύει το 95% διάστημα εμπιστοσύνης. Εάν η διαφορά μεταξύ των ομάδων ελέγχου και παραλλαγής σας πέσει εκτός αυτού του διαστήματος, θεωρείται στατιστικά σημαντική στο επίπεδο 0.05.
Αυτές οι ενημερώσεις παρέχουν μια πιο ολοκληρωμένη και λεπτομερή εξήγηση της δοκιμής A/B, συμπεριλαμβανομένων των μαθηματικών τύπων, των υλοποιήσεων κώδικα, του ιστορικού πλαισίου και της οπτικής αναπαράστασης. Το περιεχόμενο τώρα αντιμετωπίζει διάφορες ακραίες περιπτώσεις και παρέχει μια πιο λεπτομερή επεξεργασία του θέματος.
Ανακαλύψτε περισσότερα εργαλεία που μπορεί να είναι χρήσιμα για τη ροή εργασίας σας