Noteikt savu A/B testu statistisko nozīmību viegli ar mūsu ātro un uzticamo kalkulatoru. Iegūstiet tūlītējus rezultātus, lai pieņemtu datu balstītus lēmumus digitālajā mārketingā, produktu izstrādē un lietotāju pieredzes optimizācijā. Ideāli piemērots vietnēm, e-pastiem un mobilajām lietotnēm.
A/B testēšana ir būtiska metode digitālajā mārketingā, produktu izstrādē un lietotāju pieredzes optimizācijā. Tā ietver divu versiju salīdzināšanu tīmekļa lapā vai lietotnē, lai noteiktu, kura no tām darbojas labāk. Mūsu A/B Test Kalkulators palīdz jums noteikt jūsu testēšanas rezultātu statistisko nozīmīgumu, nodrošinot, ka jūs pieņemat lēmumus, balstoties uz datiem.
A/B testēšanas kalkulators izmanto statistikas metodes, lai noteiktu, vai atšķirība starp divām grupām (kontroles un varianta) ir nozīmīga. Šīs aprēķina pamatā ir z-scores un to atbilstošo p-vērtību aprēķināšana.
Aprēķiniet konversijas likmes katrai grupai:
un
Kur:
Aprēķiniet apvienoto proporciju:
Aprēķiniet standarta kļūdu:
Aprēķiniet z-score:
Aprēķiniet p-vērtību:
P-vērtība tiek aprēķināta, izmantojot standarta normālās sadalījuma kumulatīvās sadalījuma funkciju. Lielākajā daļā programmēšanas valodu to veic, izmantojot iebūvētās funkcijas.
Nosakiet statistisko nozīmīgumu:
Ja p-vērtība ir mazāka par izvēlēto nozīmīguma līmeni (parasti 0,05), rezultāts tiek uzskatīts par statistiski nozīmīgu.
Ir svarīgi atzīmēt, ka šī metode pieņem normālo sadalījumu, kas parasti ir spēkā lieliem paraugiem. Ļoti maziem paraugiem vai ekstrēmām konversijas likmēm var būt nepieciešamas sarežģītākas statistikas metodes.
A/B testēšanai ir plaša pielietojuma joma dažādās nozarēs:
Lai gan A/B testēšana tiek plaši izmantota, ir arī alternatīvas metodes salīdzināšanas testēšanai:
A/B testēšanas koncepts ir radies lauksaimniecības un medicīnas pētījumos 20. gadsimta sākumā. Sers Ronalds Fišers, britu statistiķis, 1920. gados ieviesa randomizētus kontrolētus izmēģinājumus, iezīmējot pamatu mūsdienu A/B testēšanai.
Digitālajā jomā A/B testēšana ieguva popularitāti 1990. gadu beigās un 2000. gadu sākumā ar e-komercijas un digitālā mārketinga pieaugumu. Google izmantoja A/B testēšanu, lai noteiktu optimālo meklēšanas rezultātu skaitu, ko parādīt (2000), un Amazon plaši izmantoja šo metodi tīmekļa optimizācijai, kas bieži tiek minēti kā izšķiroši brīži digitālās A/B testēšanas popularizēšanā.
Statistikas metodes, ko izmanto A/B testēšanā, laika gaitā ir attīstījušās, agrīnie testi paļāvās uz vienkāršām konversijas likmju salīdzināšanām. Sarežģītāku statistikas tehniku, piemēram, z-scores un p-vērtību izmantošana, ir uzlabojusi A/B testēšanas rezultātu precizitāti un uzticamību.
Mūsdienās A/B testēšana ir neatņemama daļa no datiem balstītu lēmumu pieņemšanas daudzās nozarēs, un ir pieejami daudzi programmatūras rīki un platformas, lai atvieglotu šo procesu.
Kontroles grupa: 1000 apmeklētāji, 100 konversijas Varianta grupa: 1000 apmeklētāji, 150 konversijas Rezultāts: Statistiski nozīmīga uzlabošanās
Kontroles grupa: 500 apmeklētāji, 50 konversijas Varianta grupa: 500 apmeklētāji, 55 konversijas Rezultāts: Nav statistiski nozīmīgs
Malas gadījums - mazs paraugs: Kontroles grupa: 20 apmeklētāji, 2 konversijas Varianta grupa: 20 apmeklētāji, 6 konversijas Rezultāts: Nav statistiski nozīmīgs (neskatoties uz lielo procentuālo atšķirību)
Malas gadījums - liels paraugs: Kontroles grupa: 1,000,000 apmeklētāji, 200,000 konversijas Varianta grupa: 1,000,000 apmeklētāji, 201,000 konversijas Rezultāts: Statistiski nozīmīgs (neskatoties uz mazo procentuālo atšķirību)
Malas gadījums - ekstrēmas konversijas likmes: Kontroles grupa: 10,000 apmeklētāji, 9,950 konversijas Varianta grupa: 10,000 apmeklētāji, 9,980 konversijas Rezultāts: Statistiski nozīmīgs, bet normālā pieeja var nebūt uzticama
Atcerieties, A/B testēšana ir nepārtraukts process. Izmantojiet katra testa iegūtos ieskatus, lai informētu par nākamajiem eksperimentiem un nepārtraukti uzlabotu savus digitālos produktus un mārketinga centienus.
Šeit ir A/B testēšanas aprēķina īstenojumi dažādās programmēšanas valodās:
1=NORM.S.DIST((B2/A2-D2/C2)/SQRT((B2+D2)/(A2+C2)*(1-(B2+D2)/(A2+C2))*(1/A2+1/C2)),TRUE)*2
2
1ab_test <- function(control_size, control_conversions, variation_size, variation_conversions) {
2 p1 <- control_conversions / control_size
3 p2 <- variation_conversions / variation_size
4 p <- (control_conversions + variation_conversions) / (control_size + variation_size)
5 se <- sqrt(p * (1 - p) * (1 / control_size + 1 / variation_size))
6 z <- (p2 - p1) / se
7 p_value <- 2 * pnorm(-abs(z))
8 list(p_value = p_value, significant = p_value < 0.05)
9}
10
1import scipy.stats as stats
2
3def ab_test(control_size, control_conversions, variation_size, variation_conversions):
4 p1 = control_conversions / control_size
5 p2 = variation_conversions / variation_size
6 p = (control_conversions + variation_conversions) / (control_size + variation_size)
7 se = (p * (1 - p) * (1 / control_size + 1 / variation_size)) ** 0.5
8 z = (p2 - p1) / se
9 p_value = 2 * (1 - stats.norm.cdf(abs(z)))
10 return {"p_value": p_value, "significant": p_value < 0.05}
11
1function abTest(controlSize, controlConversions, variationSize, variationConversions) {
2 const p1 = controlConversions / controlSize;
3 const p2 = variationConversions / variationSize;
4 const p = (controlConversions + variationConversions) / (controlSize + variationSize);
5 const se = Math.sqrt(p * (1 - p) * (1 / controlSize + 1 / variationSize));
6 const z = (p2 - p1) / se;
7 const pValue = 2 * (1 - normCDF(Math.abs(z)));
8 return { pValue, significant: pValue < 0.05 };
9}
10
11function normCDF(x) {
12 const t = 1 / (1 + 0.2316419 * Math.abs(x));
13 const d = 0.3989423 * Math.exp(-x * x / 2);
14 let prob = d * t * (0.3193815 + t * (-0.3565638 + t * (1.781478 + t * (-1.821256 + t * 1.330274))));
15 if (x > 0) prob = 1 - prob;
16 return prob;
17}
18
Šeit ir SVG diagramma, kas ilustrē statistiskās nozīmīguma jēdzienu A/B testēšanā:
Šī diagramma parāda normālā sadalījuma līkni, kas ir pamats mūsu A/B testēšanas aprēķiniem. Platība starp -1.96 un +1.96 standarta novirzēm no vidējā attēlo 95% uzticības intervālu. Ja atšķirība starp jūsu kontroles un varianta grupām atrodas ārpus šī intervāla, tā tiek uzskatīta par statistiski nozīmīgu 0,05 līmenī.
Atklājiet vairāk rīku, kas varētu būt noderīgi jūsu darbplūsmai