Odredite statističku značajnost vaših A/B testova bez napora s našim brzim i pouzdanim kalkulatorom. Dobijte trenutne rezultate kako biste donosili odluke temeljene na podacima za vaš digitalni marketing, razvoj proizvoda i optimizaciju korisničkog iskustva. Savršeno za web stranice, e-poštu i mobilne aplikacije.
A/B testiranje je ključna metoda u digitalnom marketingu, razvoju proizvoda i optimizaciji korisničkog iskustva. Uključuje usporedbu dviju verzija web stranice ili aplikacije kako bi se utvrdilo koja od njih bolje funkcionira. Naš A/B Test Kalkulator pomaže vam odrediti statističku značajnost rezultata vaših testova, osiguravajući da donosite odluke temeljene na podacima.
A/B test kalkulator koristi statističke metode za određivanje je li razlika između dviju grupa (kontrola i varijacija) značajna. Srž ovog izračuna uključuje izračunavanje z-scorea i pripadajuće p-vrijednosti.
Izračunajte stope konverzije za svaku grupu:
i
Gdje:
Izračunajte objedinjeni postotak:
Izračunajte standardnu pogrešku:
Izračunajte z-score:
Izračunajte p-vrijednost:
P-vrijednost se izračunava korištenjem kumulativne distribucijske funkcije standardne normalne distribucije. U većini programskih jezika, to se radi pomoću ugrađenih funkcija.
Odredite statističku značajnost:
Ako je p-vrijednost manja od odabrane razine značajnosti (obično 0.05), rezultat se smatra statistički značajnim.
Važno je napomenuti da ova metoda pretpostavlja normalnu distribuciju, što je obično važno za velike uzorke. Za vrlo male uzorke ili ekstremne stope konverzije, mogu biti potrebne naprednije statističke metode.
A/B testiranje ima širok spektar primjena u različitim industrijama:
Iako se A/B testiranje široko koristi, postoje alternativne metode za usporedno testiranje:
Koncept A/B testiranja ima svoje korijene u poljoprivrednim i medicinskim istraživanjima iz ranog 20. stoljeća. Sir Ronald Fisher, britanski statističar, bio je pionir korištenja randomiziranih kontroliranih ispitivanja 1920-ih, postavljajući temelje za moderno A/B testiranje.
U digitalnom području, A/B testiranje je steklo popularnost krajem 1990-ih i početkom 2000-ih s porastom e-trgovine i digitalnog marketinga. Googleova upotreba A/B testiranja za određivanje optimalnog broja rezultata pretraživanja koji će se prikazati (2000.) i Amazonova opsežna upotreba ove metode za optimizaciju web stranica često se navode kao ključni trenuci u popularizaciji digitalnog A/B testiranja.
Statističke metode korištene u A/B testiranju su se razvijale tijekom vremena, s ranim testovima koji su se oslanjali na jednostavne usporedbe stopa konverzije. Uvođenje sofisticiranijih statističkih tehnika, poput korištenja z-scorea i p-vrijednosti, poboljšalo je točnost i pouzdanost rezultata A/B testova.
Danas je A/B testiranje sastavni dio donošenja odluka temeljenih na podacima u mnogim industrijama, s brojnim softverskim alatima i platformama dostupnim za olakšavanje procesa.
Kontrolna grupa: 1000 posjetitelja, 100 konverzija Varijacijska grupa: 1000 posjetitelja, 150 konverzija Rezultat: Statistički značajno poboljšanje
Kontrolna grupa: 500 posjetitelja, 50 konverzija Varijacijska grupa: 500 posjetitelja, 55 konverzija Rezultat: Nije statistički značajno
Rubni slučaj - Mali uzorak: Kontrolna grupa: 20 posjetitelja, 2 konverzije Varijacijska grupa: 20 posjetitelja, 6 konverzija Rezultat: Nije statistički značajno (unatoč velikoj postotnoj razlici)
Rubni slučaj - Veliki uzorak: Kontrolna grupa: 1,000,000 posjetitelja, 200,000 konverzija Varijacijska grupa: 1,000,000 posjetitelja, 201,000 konverzija Rezultat: Statistički značajno (unatoč maloj postotnoj razlici)
Rubni slučaj - Ekstremne stope konverzije: Kontrolna grupa: 10,000 posjetitelja, 9,950 konverzija Varijacijska grupa: 10,000 posjetitelja, 9,980 konverzija Rezultat: Statistički značajno, ali normalna aproksimacija možda nije pouzdana
Zapamtite, A/B testiranje je kontinuirani proces. Iskoristite uvide stečene iz svakog testa kako biste informirali svoje buduće eksperimente i kontinuirano poboljšavali svoje digitalne proizvode i marketinške napore.
Evo implementacija izračuna A/B testa u raznim programskim jezicima:
1=NORM.S.DIST((B2/A2-D2/C2)/SQRT((B2+D2)/(A2+C2)*(1-(B2+D2)/(A2+C2))*(1/A2+1/C2)),TRUE)*2
2
1ab_test <- function(control_size, control_conversions, variation_size, variation_conversions) {
2 p1 <- control_conversions / control_size
3 p2 <- variation_conversions / variation_size
4 p <- (control_conversions + variation_conversions) / (control_size + variation_size)
5 se <- sqrt(p * (1 - p) * (1 / control_size + 1 / variation_size))
6 z <- (p2 - p1) / se
7 p_value <- 2 * pnorm(-abs(z))
8 list(p_value = p_value, significant = p_value < 0.05)
9}
10
1import scipy.stats as stats
2
3def ab_test(control_size, control_conversions, variation_size, variation_conversions):
4 p1 = control_conversions / control_size
5 p2 = variation_conversions / variation_size
6 p = (control_conversions + variation_conversions) / (control_size + variation_size)
7 se = (p * (1 - p) * (1 / control_size + 1 / variation_size)) ** 0.5
8 z = (p2 - p1) / se
9 p_value = 2 * (1 - stats.norm.cdf(abs(z)))
10 return {"p_value": p_value, "significant": p_value < 0.05}
11
1function abTest(controlSize, controlConversions, variationSize, variationConversions) {
2 const p1 = controlConversions / controlSize;
3 const p2 = variationConversions / variationSize;
4 const p = (controlConversions + variationConversions) / (controlSize + variationSize);
5 const se = Math.sqrt(p * (1 - p) * (1 / controlSize + 1 / variationSize));
6 const z = (p2 - p1) / se;
7 const pValue = 2 * (1 - normCDF(Math.abs(z)));
8 return { pValue, significant: pValue < 0.05 };
9}
10
11function normCDF(x) {
12 const t = 1 / (1 + 0.2316419 * Math.abs(x));
13 const d = 0.3989423 * Math.exp(-x * x / 2);
14 let prob = d * t * (0.3193815 + t * (-0.3565638 + t * (1.781478 + t * (-1.821256 + t * 1.330274))));
15 if (x > 0) prob = 1 - prob;
16 return prob;
17}
18
Evo SVG dijagrama koji ilustrira koncept statističke značajnosti u A/B testiranju:
Ovaj dijagram prikazuje krivulju normalne distribucije, koja je osnova za naše A/B test izračune. Područje između -1.96 i +1.96 standardnih devijacija od srednje vrijednosti predstavlja 95% interval pouzdanosti. Ako razlika između vaših kontrolnih i varijacijskih grupa padne izvan ovog intervala, smatra se statistički značajnom na razini 0.05.
Otkrijte više alata koji bi mogli biti korisni za vaš radni proces