Tambua umuhimu wa takwimu za majaribio yako ya A/B kwa urahisi na kihesabu chetu cha haraka na cha kuaminika. Pata matokeo ya papo hapo ili kufanya maamuzi yanayotokana na data kwa ajili ya masoko yako ya kidijitali, maendeleo ya bidhaa, na kuboresha uzoefu wa mtumiaji. Inafaa kwa tovuti, barua pepe, na programu za rununu.
A/B testing ni njia muhimu katika masoko ya kidijitali, maendeleo ya bidhaa, na kuboresha uzoefu wa mtumiaji. Inahusisha kulinganisha toleo mbili za ukurasa wa wavuti au programu dhidi ya kila mmoja ili kubaini ni ipi inafanya kazi vizuri zaidi. Kihesabu cha A/B Test kinakusaidia kubaini umuhimu wa takwimu za matokeo yako, kuhakikisha kuwa unafanya maamuzi yanayotokana na data.
Kihesabu cha A/B test kinatumia mbinu za takwimu ili kubaini kama tofauti kati ya vikundi viwili (udhibiti na toleo) ni muhimu. Msingi wa hesabu hii ni kuhesabu z-score na p-value inayohusiana nayo.
Hesabu viwango vya ubadilishaji kwa kila kundi:
na
Ambapo:
Hesabu uwiano wa pamoja:
Hesabu makosa ya kiwango:
Hesabu z-score:
Hesabu p-value:
P-value inahesabiwa kwa kutumia kazi ya usambazaji wa kawaida wa kawaida. Katika lugha nyingi za programu, hii inafanywa kwa kutumia kazi za ndani.
Tambua umuhimu wa takwimu:
Ikiwa p-value ni ndogo kuliko kiwango kilichochaguliwa cha umuhimu (kawaida 0.05), matokeo yanachukuliwa kuwa muhimu takwimu.
Ni muhimu kutambua kuwa njia hii inadhani usambazaji wa kawaida, ambayo kwa ujumla ni halali kwa saizi kubwa za sampuli. Kwa saizi ndogo sana za sampuli au viwango vya ubadilishaji vya kipekee, mbinu za takwimu za hali ya juu zinaweza kuwa muhimu zaidi.
A/B testing ina matumizi mengi katika sekta mbalimbali:
Ingawa A/B testing inatumika sana, kuna mbinu mbadala za kupima kulinganisha:
Dhana ya A/B testing ina mizizi yake katika utafiti wa kilimo na matibabu kutoka karne ya 20. Sir Ronald Fisher, mchambuzi wa takwimu kutoka Uingereza, alianzisha matumizi ya majaribio yaliyodhibitiwa kwa bahati nasibu katika miaka ya 1920, akifanya msingi wa A/B testing ya kisasa.
Katika ulimwengu wa kidijitali, A/B testing ilipata umaarufu mwishoni mwa miaka ya 1990 na mapema miaka ya 2000 ilipoongezeka kwa e-commerce na masoko ya kidijitali. Matumizi ya A/B testing na Google kubaini idadi bora ya matokeo ya utaftaji kuonyesha (2000) na matumizi makubwa ya mbinu hii na Amazon kwa ajili ya kuboresha tovuti mara nyingi yanatajwa kama matukio muhimu katika kueneza A/B testing ya kidijitali.
Mbinu za takwimu zinazotumiwa katika A/B testing zimebadilika kwa wakati, huku majaribio ya mapema yakitegemea kulinganisha viwango vya ubadilishaji rahisi. Utambulisho wa mbinu za takwimu za hali ya juu, kama vile matumizi ya z-scores na p-values, umeongeza usahihi na uaminifu wa matokeo ya A/B test.
Leo, A/B testing ni sehemu muhimu ya kufanya maamuzi yanayotokana na data katika sekta nyingi, huku zikiwa na zana na majukwaa mengi yanayopatikana ili kuwezesha mchakato huo.
Kundi la Udhibiti: wageni 1000, ubadilishaji 100 Kundi la Toleo: wageni 1000, ubadilishaji 150 Matokeo: Uboreshaji muhimu takwimu
Kundi la Udhibiti: wageni 500, ubadilishaji 50 Kundi la Toleo: wageni 500, ubadilishaji 55 Matokeo: Siyo muhimu takwimu
Kesi ya Mpaka - Saizi Ndogo ya Sampuli: Kundi la Udhibiti: wageni 20, ubadilishaji 2 Kundi la Toleo: wageni 20, ubadilishaji 6 Matokeo: Siyo muhimu takwimu (ingawa tofauti kubwa ya asilimia)
Kesi ya Mpaka - Saizi Kubwa ya Sampuli: Kundi la Udhibiti: wageni 1,000,000, ubadilishaji 200,000 Kundi la Toleo: wageni 1,000,000, ubadilishaji 201,000 Matokeo: Muhimu takwimu (ingawa tofauti ndogo ya asilimia)
Kesi ya Mpaka - Viwango vya Ubadilishaji vya Kipekee: Kundi la Udhibiti: wageni 10,000, ubadilishaji 9,950 Kundi la Toleo: wageni 10,000, ubadilishaji 9,980 Matokeo: Muhimu takwimu, lakini dhana ya kawaida inaweza isiwe ya kuaminika
Kumbuka, A/B testing ni mchakato endelevu. Tumia maarifa yaliyopatikana kutoka kila mtihani kuimarisha majaribio yako ya baadaye na kuboresha bidhaa zako za kidijitali na juhudi za masoko.
Hapa kuna utekelezaji wa hesabu ya A/B test katika lugha mbalimbali za programu:
1=NORM.S.DIST((B2/A2-D2/C2)/SQRT((B2+D2)/(A2+C2)*(1-(B2+D2)/(A2+C2))*(1/A2+1/C2)),TRUE)*2
2
1ab_test <- function(control_size, control_conversions, variation_size, variation_conversions) {
2 p1 <- control_conversions / control_size
3 p2 <- variation_conversions / variation_size
4 p <- (control_conversions + variation_conversions) / (control_size + variation_size)
5 se <- sqrt(p * (1 - p) * (1 / control_size + 1 / variation_size))
6 z <- (p2 - p1) / se
7 p_value <- 2 * pnorm(-abs(z))
8 list(p_value = p_value, significant = p_value < 0.05)
9}
10
1import scipy.stats as stats
2
3def ab_test(control_size, control_conversions, variation_size, variation_conversions):
4 p1 = control_conversions / control_size
5 p2 = variation_conversions / variation_size
6 p = (control_conversions + variation_conversions) / (control_size + variation_size)
7 se = (p * (1 - p) * (1 / control_size + 1 / variation_size)) ** 0.5
8 z = (p2 - p1) / se
9 p_value = 2 * (1 - stats.norm.cdf(abs(z)))
10 return {"p_value": p_value, "significant": p_value < 0.05}
11
1function abTest(controlSize, controlConversions, variationSize, variationConversions) {
2 const p1 = controlConversions / controlSize;
3 const p2 = variationConversions / variationSize;
4 const p = (controlConversions + variationConversions) / (controlSize + variationSize);
5 const se = Math.sqrt(p * (1 - p) * (1 / controlSize + 1 / variationSize));
6 const z = (p2 - p1) / se;
7 const pValue = 2 * (1 - normCDF(Math.abs(z)));
8 return { pValue, significant: pValue < 0.05 };
9}
10
11function normCDF(x) {
12 const t = 1 / (1 + 0.2316419 * Math.abs(x));
13 const d = 0.3989423 * Math.exp(-x * x / 2);
14 let prob = d * t * (0.3193815 + t * (-0.3565638 + t * (1.781478 + t * (-1.821256 + t * 1.330274))));
15 if (x > 0) prob = 1 - prob;
16 return prob;
17}
18
Hapa kuna mchoro wa SVG unaoonyesha dhana ya umuhimu wa takwimu katika A/B testing:
Mchoro huu unaonyesha curve ya usambazaji wa kawaida, ambayo ndiyo msingi wa hesabu zetu za A/B test. Eneo kati ya -1.96 na +1.96 viwango vya kawaida kutoka kwa kati linaonyesha muda wa kujiamini wa 95%. Ikiwa tofauti kati ya vikundi vyako vya udhibiti na toleo inashuka nje ya eneo hili, inachukuliwa kuwa muhimu takwimu kwa kiwango cha 0.05.
Mabadiliko haya yanatoa maelezo ya kina na ya kina zaidi kuhusu A/B testing, ikiwa ni pamoja na fomula za kihesabu, utekelezaji wa msimbo, muktadha wa kihistoria, na uwakilishi wa kuona. Maudhui sasa yanashughulikia kesi mbalimbali za mipaka na yanatoa matibabu ya kina zaidi ya mada hiyo.
Gundua zana zaidi ambazo zinaweza kuwa na manufaa kwa mtiririko wako wa kazi