对一个变数求出其平均数及标准差之后VIP免费

下载本文档

阅读 105
下载 20
格式 docx
大小 373.76 KB
约10页
2024-11-06 发布于河南
收藏
评论
点赞(0)
海报
举报

1/10页

2/10页

3/10页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/10

文本预览下载提示常见问题

對一個變數求出其平均數及標準差之後，我們知道它的平均數落在一定的區間以內，但是我們還想知道它是否有一些特別的假設可以驗證，例如這個變數的平均數是否有可能等於某個值，例如0。透過統計方法，我們可以對等距尺度的變數做以上的檢定。但是對於類別資料，我們比較關心它是否呈現隨機分布。1.先看看等距或等比資料的分布。我們選擇「a9dn有幾個小孩」做為變數，然後看其是否為常態分布。記得先將「99」轉為遺漏值。「統計圖」「直方圖」，選「顯示常態曲線」很明顯的小孩子的數目集中在2個及4個，6個以上非常少。如果這個樣本來自於常態分配，而平均數為2.9，標準差為1.48的情況下，我們可以說95%的觀察值落在[2.9-1.96*0.039,2.9+1.96*0.039]之間，也是[2.81,2.976]之間。而我們還可以進一步檢驗，是否2.9這個平均值，若多做幾次抽樣之後，仍然確實是等於0。此處用的是「單一樣本T檢定」。顧名思義，t檢定指的是用t分布來看我們所要檢定的值是否會落在一定的區域內。若是會的話，那麼我們不拒絕虛無假設，即平均值等於0這個假設。如果不會的話，那麼我們可以拒絕這個虛無假設，也就是平均值可能不會等於0。常態分布跟t分布的不一樣地方是t分布適用於小樣本，如果觀察值小於60的時候。當觀察值大於60時，我們還是可以用t分布，但是得到的檢定事實上與常態分布無異。參考網頁上附的常態分布與t分布的對應機率與值。在單一樣本檢定時，求t值的公式為x−ks√n，k是我們要檢定的值。在95%信心水準下，求平均值的上下區間公式為：[(X-k)-tbs√n,(X-k)+tbs√n]。tb是t值在α/2而且自由度為n-1時候的值，也就是所謂的臨界點。s√n是標準誤，也就是standarderrorofmean，簡寫為SE，也就是平均值的散布情形。而標準誤代表的就是平均值所在的範圍。以這個例子來說，k為0，平均值為2.89，而標準誤為1.477，個數為1419，因此自由度等於1418，代入公式及查表（自由度大於120且信賴區間為95%時，t的臨界值為1.96）後得[2.81,2.976]。2.89落在這個區間之間，而且這個區間包含了95%的信賴區間，也就是說抽無數次後，95%所得的平均值將落在這個區間內，因此等於0的機會是非常小，所以我們拒絕我們的虛無假設。或者是說，求出t值為73.603，而這個值遠大於我們的t檢定值1.96，因此可以拒絕等於0這個虛無假設。「分析」「比較平均數法」「單一樣本T檢定」試著檢定平均值等於3或10的假設，也可以發現會遭到拒絕。但是若設定平均值等於2.85，則將無法拒絕，表示樣本平均值跟這個值相差不多，有可能在這個區間內。0對我們特別重要，因為若平均值可能等於0，那麼我們要考慮是否測到的其實是不存在的。這裡用t分布是因為t分布近似常態分布，而且適用於小樣本。t分布的臨界值比z分布來得大，因為t分布比較扁平，也因此檢定時比較不容易拒斥其假設。2.接下來我們可以檢證是否兩組觀察值在某一個變數上是否有相同的平均值，也就是檢驗是否兩群人有在某一變數上有相同的特徵。這樣做的好處是觀察是否不同的人有不同的平均值；如果不同的話，那麼意味著各有各的特色，即兩群人並不相同，違反了樣本彼此互相是獨立的假設。如果相同的話，意味兩群人是來自相同的母體。虛無假設是兩者是有著相同的平均數，也就是平均數的差異等於0，而拒斥的假設即是差異不等於0。我們用「c4e配偶的工時」來看受訪的「a1性別」是否獨立。虛無假設是兩者獨立，即平均數相同。先把配偶工時高於90的轉換為遺漏值。「分析」「比較平均數法」「獨立樣本T檢定」。選性別填入「分組變數」，並且按「定義組別」，填入性別的類別1與2。從下表可以看到，顯著性均大於0.05，所以不拒絕虛無假設，也就是說這兩個分組中的樣本應該是一致的，或者是這兩組樣本的樣本沒有差異。以男女這兩個組來說，樣本數為915，而自由度為913。另外平均數的差距為46.14-47.21=1.07。由於我們假設男女來自不同的母體，而且假設兩組人的變異數相等，所以可以用集合變異數估計找出兩個母體的共同標準差。算法為Sp2=(N1−1)s12+(N2−1)s22N1+N2−2=200.197。而計算t值的公式為x2−x1SE(x2−x1)=x2−x1√Sp2N1+Sp2N2=-1.05。根據自由度及95%信賴水準，t分...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

对一个变数求出其平均数及标准差之后

對一個變數求出其平均數及標準差之後，我們知道它的平均數落在一定的區間以內，但是我們還想知道它是否有一些特別的假設可以驗證，例如這個變數的平均數是否有可能等於某個值，例如0

透過統計方法，我們可以對等距尺度的變數做以上的檢定

但是對於類別資料，我們比較關心它是否呈現隨機分布

先看看等距或等比資料的分布

我們選擇「a9dn有幾個小孩」做為變數，然後看其是否為常態分布

記得先將「99」轉為遺漏值

「統計圖」「直方圖」，選「顯示常態曲線」很明顯的小孩子的數目集中在2個及4個，6個以上非常少

如果這個樣本來自於常態分配，而平均數為2

9，標準差為1

48的情況下，我們可以說95%的觀察值落在[2

039]之間，也是[2

976]之間

而我們還可以進一步檢驗，是否2

9這個平均值，若多做幾次抽樣之後，仍然確實是等於0

此處用的是「單一樣本T檢定」

顧名思義，t檢定指的是用t分布來看我們所要檢定的值是否會落在一定的區域內

若是會的話，那麼我們不拒絕虛無假設，即平均值等於0這個假設

如果不會的話，那麼我們可以拒絕這個虛無假設，也就是平均值可能不會等於0

常態分布跟t分布的不一樣地方是t分布適用於小樣本，如果觀察值小於60的時候

當觀察值大於60時，我們還是可以用t分布，但是得到的檢定事實上與常態分布無異

參考網頁上附的常態分布與t分布的對應機率與值

在單一樣本檢定時，求t值的公式為x−ks√n，k是我們要檢定的值

在95%信心水準下，求平均值的上下區間公式為：[(X-k)-tbs√n,(X-k)+tbs√n]

tb是t值在α/2而且自由度為n-1時候的值，也就是所謂的臨界點

s√n是標準誤，也就是standarderrorofmean，簡寫為SE，也就是平均值的散布情形

而標準誤代表的就是平均值所在的範圍

以這個例子來說，k為

您可能关注的文档

墨香书阁 + 关注: 实名认证
内容提供者

热爱教学事业，对互联网知识分享很感兴趣

收藏店铺进入空间

对一个变数求出其平均数及标准差之后VIP免费

对一个变数求出其平均数及标准差之后

您可能关注的文档

相关文档

热门下载

相关标签