某公司想了解在雞飼料中加入魚骨粉後,雞每月平均產蛋量是否高於原本餵食一般飼料的每月平均產蛋量 \(20\) 個,因此,以加入魚骨粉的飼料餵食 \(100\) 隻雞一段時間後,發現把魚骨粉加入飼料中餵食後,每隻雞每月平均產蛋量為 \(23\) 個。單純從數據來看,\(23 > 20\),代表加入魚骨粉可提昇雞蛋產量嗎?其實不一定。 獲得「每隻雞每月平均產蛋量 \(23\) 個」的原因可能有兩種,一種就是如飼料公司預期的,因為在飼料中加入魚骨粉使得產量提高;另一種可能性,是因為與飼料無關的因素造成的結果:例如當時環境較適合雞生蛋、或者單純運氣好選出的 \(100\) 隻雞剛好產量較高等,這些因素在統計學上統稱為「隨機誤差」(random errors)。負責試驗的公司職員要如何得知獲得「每隻雞每月平均產蛋量 \(23\) 個」的原因究竟為何?最直觀的作法是比較前面兩種可能性的機率高低。 「推論統計學」即是基於機率論, 利用樣本進行假說檢定 (hypothesis testing)。上例中造成產蛋量提昇的原因在統計上稱為「假說」或「假設」,與施加特定因素造成之效應(飼料中加入魚骨粉使得產量提高)有關的假說稱為「對立假說」(alternative hypothesis),意指對立於由隨機誤差造成之效應有關的假說。由於由隨機誤差造成之效應與欲探討特定因素無關,表示該特定因素「什麼也沒做」,因此統計上稱由隨機誤差造成之效應的假說為「虛無假說」(null hypothesis)。 為了計算與比較虛無假說和對立假說的可能性,必須指定兩種假說的對應的機率分布。上例中虛無假說對應的機率分布,可以從「原本餵食一般飼料的每月平均產蛋量 \(20\) 個」的經驗中,設定產蛋量服從平均值為 \(20\) 的常態分布 (normal distribution),標記為 \(N (20, \sigma^2)\),其中 \(\sigma^2\) 為產蛋量的族群變異數。因此,隨機抽取 100 隻蛋雞作為樣本,計算每隻雞的平均產蛋量 \(\bar{X}\),根據統計理論的推導,\(\bar{X}\) 的機率分布為 \(N(20,\sigma^2/100)\);此時 \(\bar{X}\) 的機率分布是依據虛無假說的情境所設置,因此此機率分布又稱為 \(\bar{X}\) 的「虛無分布」(null distribution)。 對立假說對應的機率分布較難設定。上例中得知在對立假說成立下,餵食添加魚骨粉飼料的產蛋量高於餵食一般飼料的產蛋量,假設此時的產蛋量亦服從常態分布、且其變異數同樣為 \(\sigma^2\),若以 \(\mu\) 代表餵食添加魚骨粉飼料的平均產蛋量,我們只能設定餵食添加魚骨粉飼料的產蛋量的機率分布為 \(N (\mu, \sigma^2)\),且 \(\mu>20\)。此時 \(\bar{X}\) 的機率分布應為 \(N(\mu,\sigma^2/100)\),是依據對立假說的情境所設置,但由於 \(\mu\) 值未定,也就無法依據該機率分布計算任何機率值。 因此,我們就回到可以用以計算機率值的虛無分布。同樣根據經驗,我們知道產蛋量的變異數為 \(\sigma^2=9^2=81\),因此,\(\bar{X}\) 的虛無分布為 \(N (20, 9^2)\)(圖一;以黑色實線表示)。雖然對立假說下 \(\bar{X}\) 的機率分布未定,但可以得知一定是平均值高於虛無分布的常態分布,在圖一中以紅色虛線表示其中一種可能性。由於此假說檢定中,對立假說的機率分布在虛無假說的右側,因此歸類為「右尾檢定」。 圖一 本文範例中雞蛋樣本平均產量在虛無假說下的機率分布 (黑色實線) 與在對立假說下的機率分布(紅色虛線)(本文作者劉力瑜繪) 由圖一看來,即使在虛無分布的情境下,得到樣本平均值為 \(23\) 個蛋是有可能的,但是在對立假說成立的情境下,得到樣本平均值為 \(23\) 的可能性似乎高一些。實際計算在虛無分布的情境下獲得樣本平均值大於或等於 \(23\) 的機率(虛無分布曲線下由 \(23\) 到無限大積分所得結果)為 \(0.0004\),顯示在虛無假說的情境下,得到與 \(23\) 相同或超過 \(23\) 的機率微乎其微,因此,可以合理的推測虛無假說應不正確,藉以反證對立假說成立。 �b����²�椶�а��]�˩w�������W���B�����H�����ΡA�Y���i�@�B�\Ū�аѦ������(2003). �Ʋz�έp�ĤK���A�خ���ƨƷ~�ѥ��������q�C �@ ���]�˩w�W������ �@ �@ �@ �W�� ���� ���]�˩w ���y�{
(hypothesis)
��L���](null hypothesis)�A�H�Ÿ������C ��߰��](alternative hypothesis)�H�Ÿ�(��,)�����C ²�氲�](simple hypothesis)�G �Ҧp�G�C �ƦX���](composite hypothesis)�G �Ҧp�G �C�έp���� (statistical inference)
���]�˩w (testing hypothesis)
������ (acceptance region) �ڵ��� (rejection region)
(test) �@
���u ���u ���� ���T��II���~() �ڵ� ��I���~() ���T ��ۤ��� (significance level)
�˩w�έp�q (test statistic)
p-�� (p-value)
�@ T-�˩w (Student's T distribution) �@ �@ �@ �W�� ���� ��˥�T-�˩w (one sample T-test)
���ۥѫ���T-���G�C(���˥��зǮt)�C �G�˥�T-�˩w (two- sample T-test) �@
���]����տW�ߪ��H���˥���,,�A���O�� �� �C �O�A���A���O���Ĥ@�դβĤG�ռ˥����˥������μ˥��ܲ��ơC�h�� ���G�C�S�h �Y �����B���۵�, �h�ëD�έp�q�C ���Y �A�h�A �䤤���@�����G���έp�q�C �@ �`�N�G�Х� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package�� ��"stats"�C)
�Ѽƻ����G
�@ ��ƻ����G �Q�Τw�����G(�`�A���G)�ͦ��H���üƨöi���˩w���R�C �ͦ��T�ձ`�A���G���H���üƸ�ơA���O�� �A�A �A�C�ո�ƦU��10���ƾڡC ��Ƥ��e�p�� 1�C�@ �� 1 �ѱ`�A���G�ͦ����H���üƼƾ� �@��˥�T�˩w���ҡG �ѳ�˥���T�˩w�����G�i���˩w�έp�q t �� -0.0986�A�B���Ȭ�0.9236, ���Ȥj��ҳ]�w����ۤ����C �G�Ѥ��R���G�������ƾڤ��ڵ���L���]�C �b���R���G��, �]�C�X�F95%�H��϶��μ˥������C �d�ҵ{���X�G >norm2.test<-data.frame(rnorm(10,mean=0,sd=1), > t.test(norm2.test[,1],mu=0,alternative =c("two.sided"),
�@�G�˥�T�˩w���ҡG(���]�ܲ��Ƭ۵�) �Q�Ϊ� 1�� �� ���ƾڨӶi��G�˥���T�˩w���R�C���O�P��˥���T�˩w���P�@���O�A�Y��t.test���C�Y�@�}�l�ä����D���G���ƾ�, �O�� �� ���G�Ҳ��ͪ��A�B���]�ܲ����O�۵����A�Q��T�˩w�ӧ@���R�A �i�o���Ȭ�9.268e-10�A���Ȥp��ҳ]�w����ۤ����C �G�Ѥ��R���G�����ƾکڵ���L���]�C�P�˪�, �b���R���G���A �]�C�X�F95%�H��϶��ΤG�ո�ƪ��˥������C�@ �d�ҵ{���X�G > t.test(norm2.test[,1],norm2.test[,2],alternative = + level = 0.95)
�@ �@�G�˥�T�˩w���ҡG(���]�ܲ��Ƥ��۵�) �Y���]�ܲ��ƬO���۵����A�i�o���Ȭ� 1.856e-8, ���Ȥp��ҳ]�w����ۤ����C �G�Ѥ��R���G�����ƾڦP�˩ڵ���L���]�C�P�ɤ]�b���R���G���A�C�X�F95%�H��϶��ΤG�ո�ƪ��˥������C �@ �d�ҵ{���X�G > t.test(norm2.test[,1],norm2.test[,2],alternative = + conf.level = 0.95)
�@ �@ F-�˩w (F- test) �@ �@ �@ �W�� ���� F-�˩w (F-test)
F-�˩w��٬��ܲ��Ƥ���˩w�C ��ռ˥��j�p���O���M����ռ˥����ۦP�@�ӱ`�A���G�A�h�������ܲ��ƪ���Ӧ��p���M������۵��C�n�O����������1�A���N���z�ѻ{���o��Ӽ˥��i��Ӧۤ��P������C �]����տW�ߪ��H���˥�,, ���O�� �� ���G�C �S�H�A���O����ռ˥����˥��ܲ��ơC ���˩w�C���]�Ҭ��w���C�h�Y�Ҭ������A �����u�ɡA�h �@ �@ �`�N�G�Х� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package�� ��"stats"�C)
�Ѽƻ����G
��ƻ����G�@�@ �Q�Ϊ� 1�� �� �ƾڨӶi���ܲ��ƪ��˩w���R�C���O���� var.test���C�Y�@�}�l�ä����D���G���ƾڡA�O�� �� ���G�Ҳ��ͪ��A�Q���ܲ����˩w���R�i�o���Ȭ�0.0001373�A���Ȥp��ҳ]�w����ۤ����C �Ѥ��R���G�����ƾکڵ���L���] �C�P�˪��A�b���R���G���A��C�X�F95%�H��϶��ΤG�ո�Ƥ��˥��ܲ��ƪ���ҭȡC�d�ҵ{���X�G > var.test(norm2.test[,1],norm2.test[,3],ratio=1, �d���˩w (chi-square test) �@ �@ �@ �W�� ���� �d���˩w (chi-sqaure test)
"fit"�@���A�N�O�����v�ҫ��O�_�X�A�C ��@�H���{�H�A�Ѧ����쪺�ƾڡA�Q�˩w�Y�@�ҫ��惡�ռƾڬO�_�X�A�C �Q�ϧO�ƾڪ����t�O�ѩ���B�Ҳ��͡A�ίu���O�]�ҫ�������T�A�o�عL�{�ܲκ٬��A�X���˩w�C �ֺ��ͥd��(Pearson )�έp�q�� ��M�O�b���q�b���U�A�[���W�v�P�����W�v ���t�����p�C �@ �@ �`�N�G�Х� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package�� ��"stats"�C)
�Ѽƻ����G
��ƻ����G�@�@ �H�s�w���ۦW������ܨ��ͪ������笰�ҡC�L�N�����(round yellow)�ؤl���P������(wrinkled green)�ؤl���ܨ�����C�̨�z�סA�|�ͪ��X����B���B�����ο���ؤl����N����v�A�����O��9/16, 3/16, 3/16��1/16�C�g�Ѥ@�զ�556�Ӽ˥�������A�ڭ̦C�X�[���W�v�δ����W�v��� 2�C �� 2 �ܨ������ͪ����[���W�v�δ����W�v ���������������[���W�v31510810132�����W�v312.75104.25104.2534.75 �@ �Ѫ� 2����ơA�Q��R���d���˩w�����O��chisq.test���A�ұo���G�A�Ȭ�0.9254�C�]���L�k�ڵ���L���]:�s�w�����z�����T�C �@�@ �@ �d�ҵ{���X�G > pea<-read.table("pea.txt") �̤j�������p�k �@ (method of maximum likelihood) �@ �̤j�������p���z�[�c�Ωʽ�, �аѦҽаѦ������(2003)�C�خ���ƨƷ~�ѥ��������q�C �@ �@ �@ �W�� ���� �̤j�������p�k (method of maximum likelihood) �@
�@ �`�N�G�Х� load package "MASS"�C
�Ѽƻ����G
��ƻ����G�@�@ �Q��R�ͦ�10�� ���ƾڡA�p�� 3�C ��R�����O�p���i�o������ƪ����A�Ѥ������ɪ����G�����̤j�������p�Ȥ��O���� �C�� 3 �� �ͦ���10���ƾ�1 -1.25494872994457 2 0.580494591832429 3-0.20346305638923140.05079232427323635-0.4001485825126666-0.1335619983016127-1.4897860420146780.88331941693933591.19584395609907100.690597401520781�@ �d�ҵ{���X�G > simnorm<- rnorm(10,mean=0,sd=1) > mean(simnorm) ���̤j�������p�� > sqrt((10-1)*var(simnorm)/10) ���̤j�������p�� �@ �P�˦a�A�Q��R�ͦ�10�����Ƥ��G�Ѽ����ƾ�, �p�� 4�C �z�LR���p��i�o�A�Ѥ������ɪ����G���̤j�������p�Ȭ� �C�� 4 �ѰѼ������Ƥ��G�ͦ���10���ƾ� 16.1836001869655620.095221918564913830.9268890637904440.78376777364404850.84908774004628560.3716467199847172.2370244897061880.50901505705822990.381319892592728102.97255648867447 �@ �d�ҵ{���X�G > simnorm<- rnorm(10,mean=0,sd=1) > 1/mean(exp) ���̤j�������p�� �@ �q�D�`�A���G�Ϋ��Ƥ��G�Ѽƪ��̤j�������p�Ȫ����G���A�i�ݥX�����O���ƭȭp�⪺���G�|�P��ڧQ�Τ������ɥX�����p�Ȧ��ǷL�~�t�C �b�`�A���G���Ҥl���A ���פ����p��γz�LR�ӨD�̤j�������p�Ȭҥi�o��P�˪����G�A���O�b���Ƥ��G���Ҥl���A��Ӧ��p�Ȧ��ǷL���~�t�A��̪��t�� 0.000629�C���˥��ư��h�ɦ��~�t�ȷ|�V�p�C �@ �϶����p �@ (interval estimation) �@ �@ �@ �@ �W�� ���� �϶����p (interval estimation) �@
�@ �`�N�G�� load package "ctest"�C(�Y���s�� R1.9.0���A�h�� package�� ��"stats"�C)
�Ѽƻ����G
�P�˪��覡�]�i�u�C�X��t.test���˩w���G����@�ӭ�, �u���N�� conf.int���令�ҭn�D���Ȫ����O�Y�i, ���������O�ѦҪ� 5
���O�������O���N�qstatistic�˩w�έp�q����parameter�˩w���ۥѫ�p.value�˩w����conf.int�H��϶�estimate�Ѽƪ����p��null.value��L���]���˩w���e, �˩w�����ȩΤG�����Ȫ��talternative��L���]�ĥγ���������˩wmethod�˩w��k, ��˥��˩w�����˥��˩wdata.name�˩w����ƦW�� 如何做假設檢定?最初研究假设为真相不明。. 提出相关的虛無假說和對立假說。. 考虑检验中对样本做出的统计假设;例如,关于母體資料的分布形式或关于独立性的假设。 ... . 选择一个顯著水準(α),若低于这个概率阈值,就拒绝零假设。 ... . 選擇適合的检验统计量(Test statistic) T 。. 在設定虛無假說為真下推导检验统计量的分布。. 假設檢定怎麼看?當樣本檢定量越大,越容易拒絕H0時,即為右尾檢定;反之,當樣本檢定量越小,越容易拒絕H0時,就稱為左尾檢定;若樣本檢定量越大或越小均可能拒絕H0時,則為雙尾檢定。 然而,如果虛無假設在事實上成立,但是檢驗的結果卻將虛無假設推翻,而造成檢定錯誤,我們稱之為型一誤差(Type I Error)。
H0怎麼假設?打一個比方,以法官判案來說,我們的虛無假設H0是「被告無罪」,對立假設H1是「被告有罪」。 如果我們有足夠的證據來推翻H0「被告無罪」,我們就可以證明對立假設H1「被告有罪」,但我們不會說我們接受H0「被告無罪」,而是因為沒有足夠的證據證明H1「被告有罪」,因此不拒絕H0「被告無罪」。
假設檢定的方法可為哪三種?假設檢定有三種. ∎ 雙尾檢定: H0 : θ=θ0; H1 : θ≠θ0.. ∎ 左尾檢定: H0 : θ≧θ0 ; H1 : θ<θ0.. ∎ 右尾檢定: H0 : θ≦θ0 ; H1 : θ>θ0.. |