Определете статистическата значимост на вашите A/B тестове лесно с нашия бърз и надежден калкулатор. Получете незабавни резултати, за да вземете решения, основани на данни, за вашия дигитален маркетинг, разработка на продукти и оптимизация на потребителското изживяване. Перфектен за уебсайтове, имейли и мобилни приложения.
A/B тестването е важен метод в цифровия маркетинг, разработката на продукти и оптимизацията на потребителското изживяване. То включва сравняване на две версии на уеб страница или приложение помежду им, за да се определи коя от тях работи по-добре. Нашият A/B тест калькулатор ви помага да определите статистическата значимост на резултатите от теста, осигурявайки, че вземате решения, основани на данни.
Калькулаторът за A/B тест използва статистически методи, за да определи дали разликата между две групи (контролна и вариация) е значима. Основата на това изчисление включва изчисляване на z-скор и съответстващата му p-стойност.
Изчислете коефициентите на конверсия за всяка група:
и
Където:
Изчислете обединеното пропорционално:
Изчислете стандартната грешка:
Изчислете z-скора:
Изчислете p-стойността:
P-стойността се изчислява с помощта на кумулативната функция на разпределението на стандартното нормално разпределение. В повечето програмни езици това се прави с вградени функции.
Определете статистическата значимост:
Ако p-стойността е по-малка от избраното ниво на значимост (обикновено 0.05), резултатът се счита за статистически значим.
Важно е да се отбележи, че този метод предполага нормално разпределение, което обикновено е валидно за големи размери на пробата. За много малки размери на пробата или крайни коефициенти на конверсия, могат да бъдат необходими по-напреднали статистически методи.
A/B тестването има широк спектър от приложения в различни индустрии:
Докато A/B тестването е широко използвано, съществуват алтернативни методи за сравнение на тестовете:
Концепцията за A/B тестване има корени в агрономичните и медицинските изследвания от началото на 20-ти век. Сър Роналд Фишър, британски статистик, е пионер в използването на рандомизирани контролирани опити през 1920-те години, полагайки основите на съвременното A/B тестване.
В цифровата сфера A/B тестването придоби популярност в края на 1990-те и началото на 2000-те години с възхода на електронната търговия и цифровия маркетинг. Използването на A/B тестване от Google за определяне на оптималния брой резултати от търсенето (2000) и обширната употреба на метода от Amazon за оптимизация на уебсайтове често се цитират като ключови моменти в популяризацията на цифровото A/B тестване.
Статистическите методи, използвани в A/B тестването, са се развили с времето, като ранните тестове разчитаха на прости сравнения на коефициентите на конверсия. Въведението на по-сложни статистически техники, като използването на z-скорове и p-стойности, е подобрило точността и надеждността на резултатите от A/B тестовете.
Днес A/B тестването е неразривна част от вземането на решения, основани на данни, в много индустрии, с множество софтуерни инструменти и платформи, налични за улесняване на процеса.
Контролна група: 1000 посетители, 100 конверсии Вариационна група: 1000 посетители, 150 конверсии Резултат: Статистически значимо подобрение
Контролна група: 500 посетители, 50 конверсии Вариационна група: 500 посетители, 55 конверсии Резултат: Не е статистически значимо
Граничен случай - Малък размер на пробата: Контролна група: 20 посетители, 2 конверсии Вариационна група: 20 посетители, 6 конверсии Резултат: Не е статистически значимо (въпреки голямата процентна разлика)
Граничен случай - Голям размер на пробата: Контролна група: 1,000,000 посетители, 200,000 конверсии Вариационна група: 1,000,000 посетители, 201,000 конверсии Резултат: Статистически значимо (въпреки малката процентна разлика)
Граничен случай - Крайни коефициенти на конверсия: Контролна група: 10,000 посетители, 9,950 конверсии Вариационна група: 10,000 посетители, 9,980 конверсии Резултат: Статистически значимо, но нормалната апроксимация може да не е надеждна
Помнете, A/B тестването е непрекъснат процес. Използвайте получените прозрения от всеки тест, за да информирате бъдещите си експерименти и непрекъснато да подобрявате цифровите си продукти и маркетингови усилия.
Ето реализации на изчислението на A/B теста на различни програмни езици:
1=NORM.S.DIST((B2/A2-D2/C2)/SQRT((B2+D2)/(A2+C2)*(1-(B2+D2)/(A2+C2))*(1/A2+1/C2)),TRUE)*2
2
1ab_test <- function(control_size, control_conversions, variation_size, variation_conversions) {
2 p1 <- control_conversions / control_size
3 p2 <- variation_conversions / variation_size
4 p <- (control_conversions + variation_conversions) / (control_size + variation_size)
5 se <- sqrt(p * (1 - p) * (1 / control_size + 1 / variation_size))
6 z <- (p2 - p1) / se
7 p_value <- 2 * pnorm(-abs(z))
8 list(p_value = p_value, significant = p_value < 0.05)
9}
10
1import scipy.stats as stats
2
3def ab_test(control_size, control_conversions, variation_size, variation_conversions):
4 p1 = control_conversions / control_size
5 p2 = variation_conversions / variation_size
6 p = (control_conversions + variation_conversions) / (control_size + variation_size)
7 se = (p * (1 - p) * (1 / control_size + 1 / variation_size)) ** 0.5
8 z = (p2 - p1) / se
9 p_value = 2 * (1 - stats.norm.cdf(abs(z)))
10 return {"p_value": p_value, "significant": p_value < 0.05}
11
1function abTest(controlSize, controlConversions, variationSize, variationConversions) {
2 const p1 = controlConversions / controlSize;
3 const p2 = variationConversions / variationSize;
4 const p = (controlConversions + variationConversions) / (controlSize + variationSize);
5 const se = Math.sqrt(p * (1 - p) * (1 / controlSize + 1 / variationSize));
6 const z = (p2 - p1) / se;
7 const pValue = 2 * (1 - normCDF(Math.abs(z)));
8 return { pValue, significant: pValue < 0.05 };
9}
10
11function normCDF(x) {
12 const t = 1 / (1 + 0.2316419 * Math.abs(x));
13 const d = 0.3989423 * Math.exp(-x * x / 2);
14 let prob = d * t * (0.3193815 + t * (-0.3565638 + t * (1.781478 + t * (-1.821256 + t * 1.330274))));
15 if (x > 0) prob = 1 - prob;
16 return prob;
17}
18
Ето SVG диаграма, илюстрираща концепцията за статистическа значимост в A/B тестването:
Тази диаграма показва крива на нормалното разпределение, която е основата на нашите изчисления за A/B тест. Площта между -1.96 и +1.96 стандартни отклонения от средното представлява 95% доверителен интервал. Ако разликата между вашите контролна и вариационна групи попада извън този интервал, се счита за статистически значима на ниво 0.05.
Тези актуализации предоставят по-подробно и обширно обяснение на A/B тестването, включително математическите формули, кодовите реализации, историческия контекст и визуалното представяне. Съдържанието сега адресира различни гранични случаи и предоставя по-задълбочено разглеждане на темата.
Открийте още инструменти, които може да бъдат полезни за вашия работен процес