Snadno určete statistickou významnost vašich A/B testů s naším rychlým a spolehlivým kalkulátorem. Získejte okamžité výsledky pro informovaná rozhodnutí založená na datech pro vaše digitální marketingové aktivity, vývoj produktů a optimalizaci uživatelského zážitku. Ideální pro webové stránky, e-maily a mobilní aplikace.
A/B testování je klíčová metoda v digitálním marketingu, vývoji produktů a optimalizaci uživatelského zážitku. Zahrnuje porovnání dvou verzí webové stránky nebo aplikace, aby se zjistilo, která z nich má lepší výkon. Náš A/B Test Kalkulátor vám pomůže určit statistickou významnost vašich testovacích výsledků, což zajišťuje, že se rozhodujete na základě dat.
Kalkulátor A/B testu používá statistické metody k určení, zda je rozdíl mezi dvěma skupinami (kontrolní a varianta) významný. Jádrem tohoto výpočtu je výpočet z-skóre a odpovídající p-hodnoty.
Vypočítejte míry konverze pro každou skupinu:
a
Kde:
Vypočítejte sdružený podíl:
Vypočítejte standardní chybu:
Vypočítejte z-skóre:
Vypočítejte p-hodnotu:
P-hodnota se vypočítá pomocí kumulativní distribuční funkce standardního normálního rozdělení. Většina programovacích jazyků to provádí pomocí vestavěných funkcí.
Určete statistickou významnost:
Pokud je p-hodnota menší než zvolená úroveň významnosti (obvykle 0,05), výsledek je považován za statisticky významný.
Je důležité poznamenat, že tato metoda předpokládá normální rozdělení, což je obecně platné pro velké vzorky. Pro velmi malé vzorky nebo extrémní míry konverze mohou být zapotřebí pokročilejší statistické metody.
A/B testování má široké spektrum aplikací napříč různými odvětvími:
I když je A/B testování široce používáno, existují alternativní metody pro porovnávací testování:
Koncept A/B testování má své kořeny v zemědělském a lékařském výzkumu z počátku 20. století. Sir Ronald Fisher, britský statistik, byl průkopníkem používání randomizovaných kontrolovaných zkoušek ve 20. letech, čímž položil základy moderního A/B testování.
V digitální sféře se A/B testování stalo populárním na konci 90. let a začátku 2000. let s nástupem e-commerce a digitálního marketingu. Použití A/B testování společností Google k určení optimálního počtu výsledků vyhledávání (2000) a rozsáhlé používání této metody společností Amazon pro optimalizaci webových stránek jsou často citovány jako klíčové momenty v popularizaci digitálního A/B testování.
Statistické metody používané v A/B testování se v průběhu času vyvinuly, přičemž rané testy spoléhající na jednoduché porovnání míry konverze. Zavedení sofistikovanějších statistických technik, jako je používání z-skóre a p-hodnot, zlepšilo přesnost a spolehlivost výsledků A/B testů.
Dnes je A/B testování nedílnou součástí rozhodování založeného na datech v mnoha odvětvích, přičemž existuje řada softwarových nástrojů a platforem, které usnadňují tento proces.
Kontrolní skupina: 1000 návštěvníků, 100 konverzí Varianta: 1000 návštěvníků, 150 konverzí Výsledek: Statisticky významné zlepšení
Kontrolní skupina: 500 návštěvníků, 50 konverzí Varianta: 500 návštěvníků, 55 konverzí Výsledek: Není statisticky významné
Hraniční případ - Malá velikost vzorku: Kontrolní skupina: 20 návštěvníků, 2 konverze Varianta: 20 návštěvníků, 6 konverzí Výsledek: Není statisticky významné (navzdory velkému procentuálnímu rozdílu)
Hraniční případ - Velká velikost vzorku: Kontrolní skupina: 1 000 000 návštěvníků, 200 000 konverzí Varianta: 1 000 000 návštěvníků, 201 000 konverzí Výsledek: Statisticky významné (navzdory malému procentuálnímu rozdílu)
Hraniční případ - Extrémní míry konverze: Kontrolní skupina: 10 000 návštěvníků, 9 950 konverzí Varianta: 10 000 návštěvníků, 9 980 konverzí Výsledek: Statisticky významné, ale normální aproximace nemusí být spolehlivá
Pamatujte, že A/B testování je průběžný proces. Využijte poznatky získané z každého testu k informování vašich budoucích experimentů a k neustálému zlepšování vašich digitálních produktů a marketingových snah.
Zde jsou implementace výpočtu A/B testu v různých programovacích jazycích:
1=NORM.S.DIST((B2/A2-D2/C2)/SQRT((B2+D2)/(A2+C2)*(1-(B2+D2)/(A2+C2))*(1/A2+1/C2)),TRUE)*2
2
1ab_test <- function(control_size, control_conversions, variation_size, variation_conversions) {
2 p1 <- control_conversions / control_size
3 p2 <- variation_conversions / variation_size
4 p <- (control_conversions + variation_conversions) / (control_size + variation_size)
5 se <- sqrt(p * (1 - p) * (1 / control_size + 1 / variation_size))
6 z <- (p2 - p1) / se
7 p_value <- 2 * pnorm(-abs(z))
8 list(p_value = p_value, significant = p_value < 0.05)
9}
10
1import scipy.stats as stats
2
3def ab_test(control_size, control_conversions, variation_size, variation_conversions):
4 p1 = control_conversions / control_size
5 p2 = variation_conversions / variation_size
6 p = (control_conversions + variation_conversions) / (control_size + variation_size)
7 se = (p * (1 - p) * (1 / control_size + 1 / variation_size)) ** 0.5
8 z = (p2 - p1) / se
9 p_value = 2 * (1 - stats.norm.cdf(abs(z)))
10 return {"p_value": p_value, "significant": p_value < 0.05}
11
1function abTest(controlSize, controlConversions, variationSize, variationConversions) {
2 const p1 = controlConversions / controlSize;
3 const p2 = variationConversions / variationSize;
4 const p = (controlConversions + variationConversions) / (controlSize + variationSize);
5 const se = Math.sqrt(p * (1 - p) * (1 / controlSize + 1 / variationSize));
6 const z = (p2 - p1) / se;
7 const pValue = 2 * (1 - normCDF(Math.abs(z)));
8 return { pValue, significant: pValue < 0.05 };
9}
10
11function normCDF(x) {
12 const t = 1 / (1 + 0.2316419 * Math.abs(x));
13 const d = 0.3989423 * Math.exp(-x * x / 2);
14 let prob = d * t * (0.3193815 + t * (-0.3565638 + t * (1.781478 + t * (-1.821256 + t * 1.330274))));
15 if (x > 0) prob = 1 - prob;
16 return prob;
17}
18
Zde je SVG diagram ilustrující koncept statistické významnosti v A/B testování:
Tento diagram ukazuje křivku normálního rozdělení, která je základem našich výpočtů A/B testu. Oblast mezi -1,96 a +1,96 standardními odchylkami od průměru představuje 95% interval spolehlivosti. Pokud rozdíl mezi vašimi kontrolními a variantními skupinami spadá mimo tento interval, považuje se za statisticky významný na úrovni 0,05.
Tyto aktualizace poskytují komplexnější a podrobnější vysvětlení A/B testování, včetně matematických vzorců, kódových implementací, historického kontextu a vizuální reprezentace. Obsah nyní řeší různé hraniční případy a poskytuje důkladnější zpracování tématu.
Objevte další nástroje, které by mohly být užitečné pro vaši pracovní postup.