Whiz Tools
sampleDataDescription

T-检验计算器

介绍

t检验是一种基本的统计工具,用于确定组均值之间是否存在显著差异。它广泛应用于心理学、医学和商业等各个领域的假设检验。此计算器允许您执行各种类型的t检验:

  • 单样本t检验:测试单个组的均值是否与已知值不同。
  • 双样本t检验(独立样本):比较两个独立组的均值。
  • 配对t检验:比较同一组在不同时间(例如,治疗前和治疗后)的均值。

t检验的类型

样本数据 总体均值 单样本t检验 样本1 样本2 均值差异 双样本t检验 差异 配对t检验

如何使用此计算器

  1. 选择t检验的类型

    • 单样本t检验
    • 双样本t检验
    • 配对t检验
  2. 输入所需的参数

    • 对于单样本t检验

      • 样本均值 (xˉ\bar{x})
      • 样本标准差 (ss)
      • 样本大小 (nn)
      • 总体均值 (μ0\mu_0)
    • 对于双样本t检验

      • 样本1的均值 (xˉ1\bar{x}_1)
      • 样本1的标准差 (s1s_1)
      • 样本1的样本大小 (n1n_1)
      • 样本2的均值 (xˉ2\bar{x}_2)
      • 样本2的标准差 (s2s_2)
      • 样本2的样本大小 (n2n_2)
      • 方差假设:选择方差是否假定相等或不相等。
    • 对于配对t检验

      • 差异数据:输入配对差异。
      • 或者,输入差异均值 (dˉ\bar{d})差异标准差 (sds_d)样本大小 (nn)
  3. 设置显著性水平 (α\alpha)

    • 常见选择为0.05(95%置信水平)或0.01(99%置信水平)。
  4. 选择检验方向

    • 双尾检验:测试是否有任何差异。
    • 单尾检验:测试方向性差异(指定是否测试大于或小于)。
  5. 点击“计算”按钮

    • 计算器将显示:

      • t统计量
      • 自由度
      • p值
      • 结论:是否拒绝或不拒绝零假设。

假设

在使用t检验之前,请确保满足以下假设:

  • 正态性:数据应近似正态分布。
  • 独立性:观察值必须彼此独立。
    • 对于双样本t检验,两个组应独立。
    • 对于配对t检验,差异应独立。
  • 方差相等
    • 对于假定方差相等的双样本t检验,两个总体的方差应相等(同方差性)。
    • 如果此假设不成立,请使用Welch的t检验(不等方差)。

公式

单样本t检验

t统计量的计算公式为:

t=xˉμ0snt = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}}
  • xˉ\bar{x}:样本均值
  • μ0\mu_0:零假设下的总体均值
  • ss:样本标准差
  • nn:样本大小

双样本t检验(独立样本)

假定方差相等
t=xˉ1xˉ2sp1n1+1n2t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}

合并标准差 (sps_p):

sp=(n11)s12+(n21)s22n1+n22s_p = \sqrt{\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}}
不等方差(Welch的t检验)
t=xˉ1xˉ2s12n1+s22n2t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

配对t检验

t=dˉsdnt = \frac{\bar{d}}{\frac{s_d}{\sqrt{n}}}
  • dˉ\bar{d}:差异的均值
  • sds_d:差异的标准差
  • nn:配对数量

自由度

单样本和配对t检验:
df=n1df = n - 1
假定方差相等的双样本t检验:
df=n1+n22df = n_1 + n_2 - 2
Welch的t检验:
df=(s12n1+s22n2)2(s12n1)2n11+(s22n2)2n21df = \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \right)^2}{\frac{\left( \frac{s_1^2}{n_1} \right)^2}{n_1 -1} + \frac{\left( \frac{s_2^2}{n_2} \right)^2}{n_2 -1}}

计算

计算器执行以下步骤:

  1. 使用所选检验的适当公式计算t统计量
  2. 确定自由度 (df)
  3. 计算与t统计量和df对应的p值
    • 使用t分布查找概率。
  4. 将p值与显著性水平 (α\alpha) 进行比较
    • 如果 pαp \leq \alpha拒绝零假设。
    • 如果 p>αp > \alpha不拒绝零假设。
  5. 解释结果
    • 在检验的上下文中提供结论。

使用案例

单样本t检验

  • 测试新药的有效性
    • 确定新药的平均恢复时间是否与已知的平均恢复时间不同。
  • 质量控制
    • 检查制造零件的平均长度是否偏离规定标准。

双样本t检验

  • 市场营销中的A/B测试
    • 比较两个不同网页设计之间的转化率。
  • 教育研究
    • 评估两种教学方法之间的考试成绩是否存在差异。

配对t检验

  • 前后研究
    • 评估饮食方案前后的体重变化。
  • 匹配样本
    • 比较同一受试者在服药前后的血压测量值。

替代方法

虽然t检验功能强大,但它有可能不总是满足假设。替代方法包括:

  • Mann-Whitney U检验
    • 当数据不符合正态分布时,双样本t检验的非参数替代。
  • Wilcoxon符号秩检验
    • 配对t检验的非参数等价物。
  • ANOVA(方差分析)
    • 用于比较超过两个组的均值。

历史

t检验由威廉·西利·戈塞特于1908年开发,他在都柏林的健尼斯酿酒厂工作时以**“学生”的笔名发表。该检验旨在通过确定样本批次是否与酿酒厂的标准一致来监控黑啤酒的质量。由于保密协议,戈塞特使用了笔名“学生”,导致了“学生t检验”**这一术语的出现。

随着时间的推移,t检验已成为统计分析的基石,广泛教授并应用于各个科学学科。它为更复杂的统计方法的发展铺平了道路,并在推断统计领域中占据了基础地位。

示例

以下是在各种编程语言中执行单样本t检验的代码示例:

Excel

' Excel VBA中的单样本t检验
Sub OneSampleTTest()
    Dim sampleData As Range
    Set sampleData = Range("A1:A9") ' 替换为您的数据范围
    Dim hypothesizedMean As Double
    hypothesizedMean = 50 ' 替换为您的假设均值

    Dim sampleMean As Double
    Dim sampleStdDev As Double
    Dim sampleSize As Integer
    Dim tStat As Double

    sampleMean = Application.WorksheetFunction.Average(sampleData)
    sampleStdDev = Application.WorksheetFunction.StDev_S(sampleData)
    sampleSize = sampleData.Count

    tStat = (sampleMean - hypothesizedMean) / (sampleStdDev / Sqr(sampleSize))

    MsgBox "t统计量: " & Format(tStat, "0.00")
End Sub

R

## R中的单样本t检验
sample_data <- c(51, 49, 52, 48, 50, 47, 53, 49, 51)
t_test_result <- t.test(sample_data, mu = 50)
print(t_test_result)

Python

import numpy as np
from scipy import stats

## Python中的单样本t检验
sample_data = [51, 49, 52, 48, 50, 47, 53, 49, 51]
t_statistic, p_value = stats.ttest_1samp(sample_data, 50)
print(f"t统计量: {t_statistic:.2f}, p值: {p_value:.4f}")

JavaScript

// JavaScript中的单样本t检验
function oneSampleTTest(sample, mu0) {
  const n = sample.length;
  const mean = sample.reduce((a, b) => a + b) / n;
  const sd = Math.sqrt(sample.map(x => (x - mean) ** 2).reduce((a, b) => a + b) / (n - 1));
  const t = (mean - mu0) / (sd / Math.sqrt(n));
  return t;
}

// 示例用法:
const sampleData = [51, 49, 52, 48, 50, 47, 53, 49, 51];
const tStatistic = oneSampleTTest(sampleData, 50);
console.log(`t统计量: ${tStatistic.toFixed(2)}`);

MATLAB

% MATLAB中的单样本t检验
sampleData = [51, 49, 52, 48, 50, 47, 53, 49, 51];
[h, p, ci, stats] = ttest(sampleData, 50);
disp(['t统计量: ', num2str(stats.tstat)]);
disp(['p值: ', num2str(p)]);

Java

import org.apache.commons.math3.stat.inference.TTest;

public class OneSampleTTest {
    public static void main(String[] args) {
        double[] sampleData = {51, 49, 52, 48, 50, 47, 53, 49, 51};
        TTest tTest = new TTest();
        double mu = 50;
        double tStatistic = tTest.t(mu, sampleData);
        double pValue = tTest.tTest(mu, sampleData);
        System.out.printf("t统计量: %.2f%n", tStatistic);
        System.out.printf("p值: %.4f%n", pValue);
    }
}

C#

using System;
using MathNet.Numerics.Statistics;

class OneSampleTTest
{
    static void Main()
    {
        double[] sampleData = {51, 49, 52, 48, 50, 47, 53, 49, 51};
        double mu0 = 50;
        int n = sampleData.Length;
        double mean = Statistics.Mean(sampleData);
        double stdDev = Statistics.StandardDeviation(sampleData);
        double tStatistic = (mean - mu0) / (stdDev / Math.Sqrt(n));
        Console.WriteLine($"t统计量: {tStatistic:F2}");
    }
}

Go

package main

import (
    "fmt"
    "math"
)

func oneSampleTTest(sample []float64, mu0 float64) float64 {
    n := float64(len(sample))
    var sum, mean, sd float64

    for _, v := range sample {
        sum += v
    }
    mean = sum / n

    for _, v := range sample {
        sd += math.Pow(v - mean, 2)
    }
    sd = math.Sqrt(sd / (n - 1))

    t := (mean - mu0) / (sd / math.Sqrt(n))
    return t
}

func main() {
    sample_data := []float64{51, 49, 52, 48, 50, 47, 53, 49, 51}
    tStatistic := oneSampleTTest(sample_data, 50.0)
    fmt.Printf("t统计量: %.2f\n", tStatistic)
}

Swift

import Foundation

func oneSampleTTest(sample: [Double], mu0: Double) -> Double {
    let n = Double(sample.count)
    let mean = sample.reduce(0, +) / n
    let sd = sqrt(sample.map { pow($0 - mean, 2) }.reduce(0, +) / (n - 1))
    let t = (mean - mu0) / (sd / sqrt(n))
    return t
}

let sampleData = [51, 49, 52, 48, 50, 47, 53, 49, 51]
let tStatistic = oneSampleTTest(sample: sampleData, mu0: 50)
print(String(format: "t统计量: %.2f", tStatistic))

PHP

<?php
function oneSampleTTest($sample, $mu0) {
    $n = count($sample);
    $mean = array_sum($sample) / $n;
    $sd = sqrt(array_sum(array_map(function($x) use ($mean) {
        return pow($x - $mean, 2);
    }, $sample)) / ($n - 1));
    $t = ($mean - $mu0) / ($sd / sqrt($n));
    return $t;
}

$sampleData = [51, 49, 52, 48, 50, 47, 53, 49, 51];
$tStatistic = oneSampleTTest($sampleData, 50);
echo "t统计量: " . number_format($tStatistic, 2);
?>

Ruby

## Ruby中的单样本t检验
def one_sample_t_test(sample, mu0)
  n = sample.size
  mean = sample.sum(0.0) / n
  sd = Math.sqrt(sample.map { |x| (x - mean)**2 }.sum / (n - 1))
  t = (mean - mu0) / (sd / Math.sqrt(n))
  t
end

sample_data = [51, 49, 52, 48, 50, 47, 53, 49, 51]
t_statistic = one_sample_t_test(sample_data, 50)
puts format("t统计量: %.2f", t_statistic)

Rust

// Rust中的单样本t检验
fn one_sample_t_test(sample: &Vec<f64>, mu0: f64) -> f64 {
    let n = sample.len() as f64;
    let mean: f64 = sample.iter().sum::<f64>() / n;
    let sd = (sample.iter().map(|x| (x - mean).powi(2)).sum::<f64>() / (n - 1.0)).sqrt();
    let t = (mean - mu0) / (sd / n.sqrt());
    t
}

fn main() {
    let sample_data = vec![51.0, 49.0, 52.0, 48.0, 50.0, 47.0, 53.0, 49.0, 51.0];
    let t_statistic = one_sample_t_test(&sample_data, 50.0);
    println!("t统计量: {:.2}", t_statistic);
}

数值示例

问题:制造商声称电池的平均寿命为50小时。消费者团体测试了9个电池并记录了以下寿命(单位:小时):

51, 49, 52, 48, 50, 47, 53, 49, 5151,\ 49,\ 52,\ 48,\ 50,\ 47,\ 53,\ 49,\ 51

0.05的显著性水平下,是否有证据表明平均电池寿命与50小时不同?

解决方案

  1. 陈述假设

    • 零假设 (H0H_0):μ=50\mu = 50
    • 备择假设 (HaH_a):μ50\mu \neq 50
  2. 计算样本均值 (xˉ\bar{x})

    xˉ=51+49+52+48+50+47+53+49+519=50.00\bar{x} = \frac{51 + 49 + 52 + 48 + 50 + 47 + 53 + 49 + 51}{9} = 50.00
  3. 计算样本标准差 (ss)

    s=(xixˉ)2n1=2.0s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n - 1}} = 2.0
  4. 计算t统计量

    t=xˉμ0sn=50.00502.09=0.00t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}} = \frac{50.00 - 50}{\frac{2.0}{\sqrt{9}}} = 0.00
  5. 自由度

    df=n1=8df = n - 1 = 8
  6. 确定p值

    • 对于 t=0.00t = 0.00df=8df = 8,p值为1.00
  7. 结论

    • 由于p值 (1.00) > α\alpha (0.05),我们不拒绝零假设。
    • 解释:没有足够的证据表明平均电池寿命与50小时不同。

参考文献

  1. 戈塞特,W. S. (1908). "均值的可能误差". 生物统计学, 6(1), 1–25. JSTOR.
  2. 学生t检验. 维基百科. https://en.wikipedia.org/wiki/Student%27s_t-test
  3. GraphPad统计指南:理解t检验。 链接
  4. Laerd统计:独立t检验。 链接

附加资源

  • 假设检验
    • 使用Shapiro-Wilk检验检查正态性。
    • 使用Levene检验检查方差相等性。
  • 软件工具
    • SPSSSASStataR用于高级统计分析。
  • 进一步阅读
    • 《统计学习导论》,作者:Gareth James, Daniela Witten, Trevor Hastie, 和 Robert Tibshirani。
    • 《统计方法》,作者:George W. Snedecor 和 William G. Cochran。
Feedback