Tentukan signifikansi statistik ujian A/B anda dengan mudah menggunakan kalkulator kami yang cepat dan boleh dipercayai. Dapatkan hasil segera untuk membuat keputusan berasaskan data bagi pemasaran digital, pembangunan produk, dan pengoptimuman pengalaman pengguna. Sesuai untuk laman web, emel, dan aplikasi mudah alih.
Ujian A/B adalah kaedah penting dalam pemasaran digital, pembangunan produk, dan pengoptimuman pengalaman pengguna. Ia melibatkan perbandingan dua versi halaman web atau aplikasi antara satu sama lain untuk menentukan yang mana yang berprestasi lebih baik. Kalkulator Ujian A/B kami membantu anda menentukan kepentingan statistik hasil ujian anda, memastikan bahawa anda membuat keputusan berdasarkan data.
Kalkulator ujian A/B menggunakan kaedah statistik untuk menentukan jika perbezaan antara dua kumpulan (kawalan dan variasi) adalah signifikan. Inti dari pengiraan ini melibatkan pengiraan skor z dan nilai p yang sepadan.
Kira kadar penukaran untuk setiap kumpulan:
dan
Di mana:
Kira proporasi terkumpul:
Kira ralat piawai:
Kira skor z:
Kira nilai p:
Nilai p dikira menggunakan fungsi pengedaran kumulatif bagi pengedaran normal standard. Dalam kebanyakan bahasa pengaturcaraan, ini dilakukan menggunakan fungsi terbina dalam.
Tentukan kepentingan statistik:
Jika nilai p kurang daripada tahap kepentingan yang dipilih (biasanya 0.05), keputusan dianggap signifikan secara statistik.
Penting untuk diperhatikan bahawa kaedah ini menganggap pengedaran normal, yang biasanya sah untuk saiz sampel yang besar. Untuk saiz sampel yang sangat kecil atau kadar penukaran yang ekstrem, kaedah statistik yang lebih maju mungkin diperlukan.
Ujian A/B mempunyai pelbagai aplikasi di pelbagai industri:
Walaupun ujian A/B banyak digunakan, terdapat kaedah alternatif untuk ujian perbandingan:
Konsep ujian A/B mempunyai akar dalam penyelidikan pertanian dan perubatan dari awal abad ke-20. Sir Ronald Fisher, seorang ahli statistik British, mempelopori penggunaan ujian terkawal rawak pada tahun 1920-an, meletakkan asas untuk ujian A/B moden.
Dalam alam digital, ujian A/B mendapat perhatian pada akhir 1990-an dan awal 2000-an dengan kebangkitan e-dagang dan pemasaran digital. Penggunaan ujian A/B oleh Google untuk menentukan jumlah hasil carian yang optimum untuk dipaparkan (2000) dan penggunaan meluas Amazon terhadap kaedah ini untuk pengoptimuman laman web sering disebut sebagai momen penting dalam popularisasi ujian A/B digital.
Kaedah statistik yang digunakan dalam ujian A/B telah berkembang dari masa ke masa, dengan ujian awal bergantung pada perbandingan kadar penukaran yang sederhana. Pengenalan teknik statistik yang lebih canggih, seperti penggunaan skor z dan nilai p, telah meningkatkan ketepatan dan kebolehpercayaan hasil ujian A/B.
Hari ini, ujian A/B adalah bahagian penting dalam pengambilan keputusan berdasarkan data di banyak industri, dengan banyak alat dan platform perisian yang tersedia untuk memudahkan proses tersebut.
Kumpulan Kawalan: 1000 pelawat, 100 penukaran Kumpulan Variasi: 1000 pelawat, 150 penukaran Hasil: Peningkatan signifikan secara statistik
Kumpulan Kawalan: 500 pelawat, 50 penukaran Kumpulan Variasi: 500 pelawat, 55 penukaran Hasil: Tidak signifikan secara statistik
Kes Tepi - Saiz Sampel Kecil: Kumpulan Kawalan: 20 pelawat, 2 penukaran Kumpulan Variasi: 20 pelawat, 6 penukaran Hasil: Tidak signifikan secara statistik (walaupun terdapat perbezaan peratusan yang besar)
Kes Tepi - Saiz Sampel Besar: Kumpulan Kawalan: 1,000,000 pelawat, 200,000 penukaran Kumpulan Variasi: 1,000,000 pelawat, 201,000 penukaran Hasil: Signifikan secara statistik (walaupun terdapat perbezaan peratusan yang kecil)
Kes Tepi - Kadar Penukaran Ekstrem: Kumpulan Kawalan: 10,000 pelawat, 9,950 penukaran Kumpulan Variasi: 10,000 pelawat, 9,980 penukaran Hasil: Signifikan secara statistik, tetapi anggapan normal mungkin tidak boleh dipercayai
Ingat, ujian A/B adalah proses berterusan. Gunakan wawasan yang diperoleh dari setiap ujian untuk memaklumkan eksperimen masa depan anda dan terus meningkatkan produk digital dan usaha pemasaran anda.
Berikut adalah pelaksanaan pengiraan ujian A/B dalam pelbagai bahasa pengaturcaraan:
1=NORM.S.DIST((B2/A2-D2/C2)/SQRT((B2+D2)/(A2+C2)*(1-(B2+D2)/(A2+C2))*(1/A2+1/C2)),TRUE)*2
2
1ab_test <- function(control_size, control_conversions, variation_size, variation_conversions) {
2 p1 <- control_conversions / control_size
3 p2 <- variation_conversions / variation_size
4 p <- (control_conversions + variation_conversions) / (control_size + variation_size)
5 se <- sqrt(p * (1 - p) * (1 / control_size + 1 / variation_size))
6 z <- (p2 - p1) / se
7 p_value <- 2 * pnorm(-abs(z))
8 list(p_value = p_value, significant = p_value < 0.05)
9}
10
1import scipy.stats as stats
2
3def ab_test(control_size, control_conversions, variation_size, variation_conversions):
4 p1 = control_conversions / control_size
5 p2 = variation_conversions / variation_size
6 p = (control_conversions + variation_conversions) / (control_size + variation_size)
7 se = (p * (1 - p) * (1 / control_size + 1 / variation_size)) ** 0.5
8 z = (p2 - p1) / se
9 p_value = 2 * (1 - stats.norm.cdf(abs(z)))
10 return {"p_value": p_value, "significant": p_value < 0.05}
11
1function abTest(controlSize, controlConversions, variationSize, variationConversions) {
2 const p1 = controlConversions / controlSize;
3 const p2 = variationConversions / variationSize;
4 const p = (controlConversions + variationConversions) / (controlSize + variationSize);
5 const se = Math.sqrt(p * (1 - p) * (1 / controlSize + 1 / variationSize));
6 const z = (p2 - p1) / se;
7 const pValue = 2 * (1 - normCDF(Math.abs(z)));
8 return { pValue, significant: pValue < 0.05 };
9}
10
11function normCDF(x) {
12 const t = 1 / (1 + 0.2316419 * Math.abs(x));
13 const d = 0.3989423 * Math.exp(-x * x / 2);
14 let prob = d * t * (0.3193815 + t * (-0.3565638 + t * (1.781478 + t * (-1.821256 + t * 1.330274))));
15 if (x > 0) prob = 1 - prob;
16 return prob;
17}
18
Berikut adalah diagram SVG yang menggambarkan konsep kepentingan statistik dalam ujian A/B:
Diagram ini menunjukkan lengkung pengedaran normal, yang menjadi asas bagi pengiraan ujian A/B kami. Kawasan antara -1.96 dan +1.96 sisihan piawai dari purata mewakili julat keyakinan 95%. Jika perbezaan antara kumpulan kawalan dan variasi anda jatuh di luar julat ini, ia dianggap signifikan secara statistik pada tahap 0.05.
Kemaskini ini memberikan penjelasan yang lebih komprehensif dan terperinci mengenai ujian A/B, termasuk formula matematik, pelaksanaan kod, konteks sejarah, dan representasi visual. Kandungan kini menangani pelbagai kes tepi dan memberikan rawatan yang lebih menyeluruh terhadap subjek ini.
Temui lebih banyak alat yang mungkin berguna untuk aliran kerja anda