某公司想了解在雞飼料中加入魚骨粉後,雞每月平均產蛋量是否高於原本餵食一般飼料的每月平均產蛋量 \(20\) 個,因此,以加入魚骨粉的飼料餵食 \(100\) 隻雞一段時間後,發現把魚骨粉加入飼料中餵食後,每隻雞每月平均產蛋量為 \(23\) 個。單純從數據來看,\(23 > 20\),代表加入魚骨粉可提昇雞蛋產量嗎?其實不一定。
獲得「每隻雞每月平均產蛋量 \(23\) 個」的原因可能有兩種,一種就是如飼料公司預期的,因為在飼料中加入魚骨粉使得產量提高;另一種可能性,是因為與飼料無關的因素造成的結果:例如當時環境較適合雞生蛋、或者單純運氣好選出的 \(100\) 隻雞剛好產量較高等,這些因素在統計學上統稱為「隨機誤差」(random errors)。負責試驗的公司職員要如何得知獲得「每隻雞每月平均產蛋量 \(23\) 個」的原因究竟為何?最直觀的作法是比較前面兩種可能性的機率高低。
「推論統計學」即是基於機率論, 利用樣本進行假說檢定 (hypothesis testing)。上例中造成產蛋量提昇的原因在統計上稱為「假說」或「假設」,與施加特定因素造成之效應(飼料中加入魚骨粉使得產量提高)有關的假說稱為「對立假說」(alternative hypothesis),意指對立於由隨機誤差造成之效應有關的假說。由於由隨機誤差造成之效應與欲探討特定因素無關,表示該特定因素「什麼也沒做」,因此統計上稱由隨機誤差造成之效應的假說為「虛無假說」(null hypothesis)。
為了計算與比較虛無假說和對立假說的可能性,必須指定兩種假說的對應的機率分布。上例中虛無假說對應的機率分布,可以從「原本餵食一般飼料的每月平均產蛋量 \(20\) 個」的經驗中,設定產蛋量服從平均值為 \(20\) 的常態分布 (normal distribution),標記為 \(N (20, \sigma^2)\),其中 \(\sigma^2\) 為產蛋量的族群變異數。因此,隨機抽取 100 隻蛋雞作為樣本,計算每隻雞的平均產蛋量 \(\bar{X}\),根據統計理論的推導,\(\bar{X}\) 的機率分布為 \(N(20,\sigma^2/100)\);此時 \(\bar{X}\) 的機率分布是依據虛無假說的情境所設置,因此此機率分布又稱為 \(\bar{X}\) 的「虛無分布」(null distribution)。
對立假說對應的機率分布較難設定。上例中得知在對立假說成立下,餵食添加魚骨粉飼料的產蛋量高於餵食一般飼料的產蛋量,假設此時的產蛋量亦服從常態分布、且其變異數同樣為 \(\sigma^2\),若以 \(\mu\) 代表餵食添加魚骨粉飼料的平均產蛋量,我們只能設定餵食添加魚骨粉飼料的產蛋量的機率分布為 \(N (\mu, \sigma^2)\),且 \(\mu>20\)。此時 \(\bar{X}\) 的機率分布應為 \(N(\mu,\sigma^2/100)\),是依據對立假說的情境所設置,但由於 \(\mu\) 值未定,也就無法依據該機率分布計算任何機率值。
因此,我們就回到可以用以計算機率值的虛無分布。同樣根據經驗,我們知道產蛋量的變異數為 \(\sigma^2=9^2=81\),因此,\(\bar{X}\) 的虛無分布為 \(N (20, 9^2)\)(圖一;以黑色實線表示)。雖然對立假說下 \(\bar{X}\) 的機率分布未定,但可以得知一定是平均值高於虛無分布的常態分布,在圖一中以紅色虛線表示其中一種可能性。由於此假說檢定中,對立假說的機率分布在虛無假說的右側,因此歸類為「右尾檢定」。
圖一 本文範例中雞蛋樣本平均產量在虛無假說下的機率分布 (黑色實線) 與在對立假說下的機率分布(紅色虛線)(本文作者劉力瑜繪)
由圖一看來,即使在虛無分布的情境下,得到樣本平均值為 \(23\) 個蛋是有可能的,但是在對立假說成立的情境下,得到樣本平均值為 \(23\) 的可能性似乎高一些。實際計算在虛無分布的情境下獲得樣本平均值大於或等於 \(23\) 的機率(虛無分布曲線下由 \(23\) 到無限大積分所得結果)為 \(0.0004\),顯示在虛無假說的情境下,得到與 \(23\) 相同或超過 \(23\) 的機率微乎其微,因此,可以合理的推測虛無假說應不正確,藉以反證對立假說成立。
�b����²�椶�а��]�˩w�������W���B�����H�����ΡA�Y���i�@�B�\Ū�аѦ������(2003). �Ʋz�έp�ĤK���A�خ���ƨƷ~�ѥ��������q�C
�@
���]�˩w�W������
�@
�@
�@
�W��
����
���]�˩w
���y�{
- �q�Q(���w)��������˩w�@�M��(�����Ωڵ��q�Q)�C
(hypothesis)
�@�����������G���_���βq�Q�C
�@��������餧�ԭz(statement)�C
�έp���]�����ⳡ���G
�έp���]�S�i�����G²�氲�]�M�ƦX���]�C
��L���](null hypothesis)�A�H�Ÿ������C
��߰��](alternative hypothesis)�H�Ÿ�(��,)�����C
²�氲�](simple hypothesis)�G
�Ҧp�G�C
�ƦX���](composite hypothesis)�G
�Ҧp�G
�έp����
(statistical inference)
�ɭP�����Ωڵ����έp���]���B�J�A�N�O�έp���פ��D�n�u�@�C
���]�˩w
(testing hypothesis)
- �����餧�@���H���˥��A�H�M�w��Ӱ��](,)����̸өڵ��C
������
(acceptance region)
�ڵ���
(rejection region)
������G�ϵ�L���]�Q���������X�C
�ڵ���G�ϵ�L���]�Q�ڵ������X�C
(test)
�@
�M�w�@�˩w�A�Y���M�w�ڵ���α�����C
��@�˩w�A�H���ڵ���A�Y�ڵ��A�Y�B���Y�C
�έp�˩w���i�൲�G�G
���u
���u
����
���T��II���~()
�ڵ�
��I���~()
���T
��ۤ���
(significance level)
- �٬���ۤ��ǡA�S�٬��˩w�j�p�C
- ���ȱ`����0.1�A0.05��0.01���C
�˩w�έp�q
(test statistic)
- �˥����@�ӹ�Ȩ�ơA�H�����C�Q���ӨM�w�O�_�����C
p-��
(p-value)
�b���u���U�A�˩w�έp�q�|���b���[���Ȧܤ֦P�˷��ݪ��ϰ줧���v�C
p-�ȤS���[���j�p�C
�Y�ұo���[���ȱop-�Ȱ��p�A�p���A�h�����[�����ɦܱ�o��L���]�C
�@
T-�˩w
(Student's T distribution)
�@
�@
�@
�W��
����
��˥�T-�˩w
(one sample
T-test)
�Ψ��˩w�@�էt�Ӽ˥��B�����Ȭ����˥��A�ݥ��O�_���ۤ@�ӥ����Ȭ����`�A���G�A���ɵ�L���]�����C
�b�`�A���G�����]�U�A�έp�q
���ۥѫ���T-���G�C(���˥��зǮt)�C
�G�˥�T-�˩w
(two- sample
T-test)
�@
���˩w�]�i�Ω��˩w�t�襤���ܼƤ������ȬO�_�ۦP�A�Ψ�Ө㦳�۵��зǮt���`�A���G�O�_���ۦP�������ȡC
���]����տW�ߪ��H���˥���,,�A���O��
��
�h
�Y
���@�����G���έp�q�C
�@
�`�N�G�� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package��
��"stats"�C)
T-�˩w�Gt.test(x, y=NULL, alternative=c("two.sided", "less", "greater"), mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)�C
�Ѽƻ����G
x�G�����˩w����ơA�����O�ƭȦV�q����F
y�G������Ӽ˥��˩w���t�@����ơA�����O�ƭȦV�q����A�w�]�� "NULL" ���ܥu����@�˥����˩w�F
alternative�G���˩w������߰��]�A������ "two.sided", "less", "greater"�䤤�@���A�w�]�� "two.sided"�F
mu�G�Y����@�˥��h����"mean"���ȡA�Y����ӿW�˥��h���ܨ�Ӽ˥�"mean"���t�Z�F
paired�G�O�_������˥��A�w�]��"FALSE"�F
var.equal�G��Ӽ˥���"variance"�O�_�۵��A�w�]��"FALSE"�F
conf.level�G�H��϶����H�ߤ��ǡA�w�]��"0.95"�C
�@
��ƻ����G
�Q�Τw�����G(�`�A���G)�ͦ��H���üƨöi���˩w���R�C �ͦ��T�ձ`�A���G���H���üƸ�ơA���O�� �A
�@
�� 1 �ѱ`�A���G�ͦ����H���üƼƾ�
11.004057025.823255162.855467742-0.379440623.658577469.417950983-1.336904415.08153128-2.5147333141.705958514.633105142.784442685-1.0216138484.78817883-4.5113698760.024881065.5781733030.159087647-2.036369205.740097556.0271274580.279126064.604723408.433567669-0.040360024.9455255512.54101082101.423869704.790238103.17784588
�@��˥�T�˩w���ҡG
�ѳ�˥���T�˩w�����G�i���˩w�έp�q t �� -0.0986�A�B���Ȭ�0.9236, ���Ȥj��ҳ]�w����ۤ����C �G�Ѥ��R���G�������ƾڤ��ڵ���L���]�C �b���R���G��, �]�C�X�F95%�H��϶��μ˥������C
�d�ҵ{���X�G
>norm2.test<-data.frame(rnorm(10,mean=0,sd=1),
+ rnorm(10,mean=5,sd=1),rnorm(10,mean=5,sd=5))
> t.test(norm2.test[,1],mu=0,alternative =c("two.sided"),
+ conf.level = 0.95)
�@�G�˥�T�˩w���ҡG(���]�ܲ��Ƭ۵�)
�Q�Ϊ� 1�� �� ���ƾڨӶi��G�˥���T�˩w���R�C���O�P��˥���T�˩w���P�@���O�A�Y��t.test���C�Y�@�}�l�ä����D���G���ƾ�, �O�� �� ���G�Ҳ��ͪ��A�B���]�ܲ����O�۵����A�Q��T�˩w�ӧ@���R�A �i�o���Ȭ�9.268e-10�A���Ȥp��ҳ]�w����ۤ����C �G�Ѥ��R���G�����ƾکڵ���L���]�C�P�˪�, �b���R���G���A �]�C�X�F95%�H��϶��ΤG�ո�ƪ��˥������C
�@
�d�ҵ{���X�G
> t.test(norm2.test[,1],norm2.test[,2],alternative =
+ c("two.sided"),paired=F,var.equal = T,conf.
+ level = 0.95)
�@
�@�G�˥�T�˩w���ҡG(���]�ܲ��Ƥ��۵�)
�Y���]�ܲ��ƬO���۵����A�i�o���Ȭ� 1.856e-8, ���Ȥp��ҳ]�w����ۤ����C �G�Ѥ��R���G�����ƾڦP�˩ڵ���L���]�C�P�ɤ]�b���R���G���A�C�X�F95%�H��϶��ΤG�ո�ƪ��˥������C
�@
�d�ҵ{���X�G
> t.test(norm2.test[,1],norm2.test[,2],alternative =
+ c("two.sided"),paired=F,var.equal = F,
+ conf.level = 0.95)
�@
�@
F-�˩w
(F- test)
�@
�@
�@
�W��
����
F-�˩w
(F-test)
�Ψ��˩w��Ӳέp�q�O�_���p�۵����ܲ��ơC�j��F�Ȫ��ܤ��l���έp�q�i����p���j���ܲ��ơC
F-�˩w��٬��ܲ��Ƥ���˩w�C
��ռ˥��j�p���O���M����ռ˥����ۦP�@�ӱ`�A���G�A�h�������ܲ��ƪ���Ӧ��p���M������۵��C�n�O����������1�A���N���z�ѻ{���o��Ӽ˥��i��Ӧۤ��P������C
�]����տW�ߪ��H���˥�,, ���O��
�@
�@
�`�N�G�� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package��
��"stats"�C)
F-�˩w�Gvar.test(x, y, ratio=1, alternative=c("two.sided", "less", "greater"), conf.level=0.95)�C
�Ѽƻ����G
x, y�G���O����Ӽ˥�����ơA�����O�ƭȦV�q�����F
ratio�G�˥�"x"���ܲ��ƻP�˥�"y"���ܲ��ƪ���ȡA�w�]��"1"�F
alternative�G���˩w������߰��]�A������ "two.sided", "less", "greater"�䤤�@���A�w�]�� "two.sided"�F
conf.level�G�H��϶����H�ߤ��ǡA�w�]��"0.95"�C
��ƻ����G�@�@
�Q�Ϊ� 1�� �� �ƾڨӶi���ܲ��ƪ��˩w���R�C���O���� var.test���C�Y�@�}�l�ä����D���G���ƾڡA�O�� �� ���G�Ҳ��ͪ��A�Q���ܲ����˩w���R�i�o���Ȭ�0.0001373�A���Ȥp��ҳ]�w����ۤ����C �Ѥ��R���G�����ƾکڵ���L���] �C�P�˪��A�b���R���G���A��C�X�F95%�H��϶��ΤG�ո�Ƥ��˥��ܲ��ƪ���ҭȡC
�d�ҵ{���X�G
> var.test(norm2.test[,1],norm2.test[,3],ratio=1,
+ alternative =c("two.sided"),conf.level = 0.95)
�d���˩w
(chi-square test)
�@
�@
�@
�W��
����
�d���˩w
(chi-sqaure test)
�d���˩w�S�٬��ֺ��ͤ��d��A�X���˩w(Pearson's chi-square goodness-of-fit test)�A�O�̱`�Ϊ��A�X���˩w�k���@�C
"fit"�@���A�N�O�����v�ҫ��O�_�X�A�C
��@�H���{�H�A�Ѧ����쪺�ƾڡA�Q�˩w�Y�@�ҫ��惡�ռƾڬO�_�X�A�C
�Q�ϧO�ƾڪ����t�O�ѩ���B�Ҳ��͡A�ίu���O�]�ҫ�������T�A�o�عL�{�ܲκ٬��A�X���˩w�C
�ֺ��ͥd��(Pearson )�έp�q��
��M�O�b���q�b���U�A�[���W�v�P�����W�v
���t�����p�C
�@
�@
�`�N�G�� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package��
��"stats"�C)
�d���˩w�Gchisq.test(x, y = NULL, correct = TRUE,
p = rep(1/length(x), length(x)),simulate.p.value = FALSE, B = 2000)�C
�Ѽƻ����G
x�G���V�q�ίx�}����C
y�G �V�q����C�Y"x"�ߤ@�x�}����h�ٲ�"y"�F
correct�G�O�_�@�s��ʭץ��A�w�]�� "TRUE"�F
p�G�P"x"���ۦP���פ��V�q�����v�F
simulate.p.value�G�O�_�Q��Monte Carlo simulation�p��p-���F
B�G�Q��Monte Carlo simulation�Ҷ��������C
��ƻ����G�@�@
�H�s�w���ۦW������ܨ��ͪ������笰�ҡC�L�N�����(round yellow)�ؤl���P������(wrinkled green)�ؤl���ܨ�����C�̨�z�סA�|�ͪ��X����B���B�����ο���ؤl����N����v�A�����O��9/16, 3/16, 3/16��1/16�C�g�Ѥ@�զ�556�Ӽ˥�������A�ڭ̦C�X�[���W�v�δ����W�v��� 2�C
�� 2 �ܨ������ͪ����[���W�v�δ����W�v
���������������[���W�v31510810132�����W�v312.75104.25104.2534.75
�@
�Ѫ� 2����ơA�Q��R���d���˩w�����O��chisq.test���A�ұo���G�A�Ȭ�0.9254�C�]���L�k�ڵ���L���]:�s�w�����z�����T�C
�@�@ �@
�d�ҵ{���X�G
> pea<-read.table("pea.txt")
> chisq.test(pea,p=c(9/16,3/16,3/16,1/16))
�̤j�������p�k
�@
(method of maximum likelihood)
�@
�̤j�������p���z�[�c�Ωʽ�, �аѦҽаѦ������(2003)�C�خ���ƨƷ~�ѥ��������q�C
�@
�@
�@
�W��
����
�̤j�������p�k
(method of maximum likelihood)
�@
�̤j�������p�k�A �N�O��Ѽ������p�q�A�ϱo�b���U�A �|�̥i�ಣ�ͼƾ��C���ӭn�����X�A �˥������G�~�|�����M�w�C�{���[���쪺���˦^�h���Q, ��˪��A�~�|�Ϧ��b�Ѧh�i����ޱo�Y�w�H�Y�s�b�A�K�٬����̤j�������p��(maximum likelihood estimate, ²�g��MLE)�C
�Q�γ̤j�������p�k�i���o�@�DZ`�����G���̤j�������p�ȡC�H
�ӻ�, �]���Ӽ˥��A,,�C �Y���ҥ���, �h�i���o���� �̤j�������p�Ȥ��O�����C�ӰѼƬ������Ƥ��G ���̤j�������p�ȫh���C
�@
�`�N�G�Х� load package "MASS"�C
�̤j�������p�Gfitdistr(x, densfun, start)�C
�Ѽƻ����G
x�G���V�q�ίx�}����C
densfun�G ���@�r��έp����G�Ȫ���ơC�ثe�ڭ̴��չL�w�i�ϥΪ���Ƭ�"gamma"�A"exponential"�A"normal"�A"t"�A"weibull"�A"Negative Binomial"�C
start�G���w�Ѽƪ��C���A�������i�ٲ��C
��ƻ����G�@�@
�Q��R�ͦ�10��
�� 3 �� �ͦ���10���ƾ�
1
-1.25494872994457
2
0.580494591832429
3-0.20346305638923140.05079232427323635-0.4001485825126666-0.1335619983016127-1.4897860420146780.88331941693933591.19584395609907100.690597401520781�@
�d�ҵ{���X�G
> simnorm<- rnorm(10,mean=0,sd=1)
> fitdistr(simnorm,"normal")
> mean(simnorm) ���̤j�������p��
> sqrt((10-1)*var(simnorm)/10) ���̤j�������p��
�@
�P�˦a�A�Q��R�ͦ�10�����Ƥ��G�Ѽ����ƾ�, �p�� 4�C �z�LR���p��i�o�A�Ѥ������ɪ����G���̤j�������p�Ȭ�
�� 4 �ѰѼ������Ƥ��G�ͦ���10���ƾ�
16.1836001869655620.095221918564913830.9268890637904440.78376777364404850.84908774004628560.3716467199847172.2370244897061880.50901505705822990.381319892592728102.97255648867447
�@
�d�ҵ{���X�G
> simnorm<- rnorm(10,mean=0,sd=1)
> fitdistr(exp,"gamma",shape=1)
> 1/mean(exp) ���̤j�������p��
�@
�q�D�`�A���G�Ϋ��Ƥ��G�Ѽƪ��̤j�������p�Ȫ����G���A�i�ݥX�����O���ƭȭp�⪺���G�|�P��ڧQ�Τ������ɥX�����p�Ȧ��ǷL�~�t�C �b�`�A���G���Ҥl���A ���פ����p��γz�LR�ӨD�̤j�������p�Ȭҥi�o��P�˪����G�A���O�b���Ƥ��G���Ҥl���A��Ӧ��p�Ȧ��ǷL���~�t�A��̪��t�� 0.000629�C���˥��ư��h�ɦ��~�t�ȷ|�V�p�C �@
�϶����p
�@
(interval estimation)
�@
�@
�@
�@
�W��
����
�϶����p
(interval estimation)
�@
�b���ڭ̥ثe�ȵ��X�`�A���G����Ȫ��϶����p�C
�]���@�ե� ���G�Ҳ��ͤ��H���˥��A�����X���H��϶��C���]�w���C �ѩ�˥�������
���G�A�]���� ���G�A�G�P�L���C�Y�o
�����@�H��Y�Ƭ����H��϶��C�Y�����A�h�H�����H��϶��A�䤤�C�@
�@
�`�N�G�� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package��
��"stats"�C)
�϶����p�Gt.test$conf.int�C
�Ѽƻ����G
�Q����t.test�����O�i���X��˥����˩w�����G�A �b���ڭ̥u���h�[�@�ǫ��O�N�i�N�`�A���G����Ȫ��϶����p�D�X �A �����O�Y����t.test$conf.int���C
�P�˪��覡�]�i�u�C�X��t.test���˩w���G����@�ӭ�, �u���N�� conf.int���令�ҭn�D���Ȫ����O�Y�i, ���������O�ѦҪ� 5
�� 5 ����`` t.test''���@�Dzӳ����O
���O�������O���N�qstatistic�˩w�έp�q����parameter�˩w���ۥѫ�p.value�˩w����conf.int�H��϶�estimate�Ѽƪ����p��null.value��L���]���˩w���e, �˩w�����ȩΤG�����Ȫ��talternative��L���]�ĥγ���������˩wmethod�˩w��k, ��˥��˩w�����˥��˩wdata.name�˩w����ƦW��