Sample样本 Populationsample mean样本均值 population mean μ总体均值
central tendency集中趋势average平均数mean(Arismatric)算数平均数median中位数更有代表性mode众数
极差是取的是最大与最小的,中程数是这两个数的平均值中程数是考虑数据集中趋势的又一种方式
极差中程数:极差:最大数减去最小数中程数考虑集中趋势的一种方式中程数计算方式:最大与最小值的算术平均值
平均数:集中趋势
law of large number 从本质上来说是样本正一步步变成整体,自己慢慢变成真的自己。
均值即是成功的概率,方差等于成功概率和不成功概率的乘积。
伯努利分布是二项分布的特殊情况,n=1的特殊情况
单样本的做法:总体均值约等于样本均值,总体方差约等于样本方差,再用总体方差推测样本均值的方差,最终得到样本均值的概率密度函数,正态分布函数。最终得到一定区间的置信区间。
从稳定的分布中取值,用分子组后的均值来得到正态分布。
从任意分布中抽取样本容量为n,则样本均值的方差等于原分布的方差除以n
当样本容量变大时,方差会变小,样本均值更接近于总体均值。
样本容量对正态分布的影响。知道正峰偏锋和左偏右偏,峰度反应了尾部的厚度,峰度为3时为正态分布。
从和正态分布无关的分布中取任意数量的样本值,把大量样本的和或均值画到图上后都能得到正态分布。
牢记1西格玛为68%,2西格玛为95.5,3西格玛为99.73%
Z分数是对某个具体值的
区分哪些是正态分布,哪些不是的。
CDF(X)累计分布函数,表格函数为normdist(x,u,σ,1)概率是概率密度函数对自变量区间的积分。
正态分布只能计算有限区间的概率,随着抛硬币次数的增多,正态分布越来越近乎二项分布。
当样本数无限增加后样本均值接近期望值。每一个样本的概率都是独立的确定的。