Minitab基礎知識 minitab學習教程

1、Minitab 中包括哪些隨機數據和概率分布功能
生成隨機數據根據一列數據或從選定的數據分布創建一個或多個隨機數據列 。在 Minitab 中 , 選擇計算 > 隨機數據 。
要根據工作表中的數據創建隨機樣本 , 請選擇來自列的樣本 。要根據某特定分布創建隨機樣本 , 請指定該分布和相應參數 。指定隨機數字生成器為隨機數生成器指定一個起點 , 以便將來生成相同的隨機數據集 。在 Minitab 中 , 選擇計算 > 設置基數 。創建分布的 PDF、CDF 或逆 CDF 。計算所選分布的 PDF、CDF 或逆 CDF 。在 Minitab 中 , 選擇計算 > 概率分布 。
2、訪問數據分布的方式
一組數據可按許多不同方式分布或散布 。例如 , 擲骰子所得的數據可以是從 1 到 6 的隨機整數值 。制造過程所得的數據可以目標值為中心進行分布 , 也可以包括遠離中心值的數據值 。
可以通過圖形、描述性統計量或者與理論分布的比較來評估數據分布:圖形通過圖形(如直方圖) , 可以直接深入了解數據集的分布情況 。直方圖可以幫助您觀測:
數據聚類是圍繞單個值 , 還是具有多個峰值或模式 。數據是稀疏散布于寬廣的范圍 , 還是位于較小的范圍 。數據是偏斜的還是對稱的 。描述性統計量用于描述包含數字值的數據的中心趨勢(平均值、中位數)和展開(方差、標準差)的描述性統計 , 這些統計添加了明細層并且可用于與其他數據集進行比較 。理論分布最后 , 一些常見分布可通過正態分布、Weibull 分布和指數分布等進行標識和稱呼 。例如 , 正態分布始終為鐘形 , 且沿均值對稱分布 。真實數據將只能接近于這些完全分布 。如果存在緊密擬合 , 則可認為數據由給定分布進行了合理建模 ??墒褂媒y計 > 質量工具 > 個體分布標識來確定最適合您數據的分布 。
3、連續和離散概率分布
概率分布要么是連續概率分布 , 要么是離散概率分布 , 這取決于它們是定義連續變量還是離散變量的概率 。
什么是連續分布? 連續分布描述連續隨機變量的可能值的概率 。連續隨機變量是具有一組無限且不可計數的可能值(稱為范圍)的隨機變量 。連續隨機變量 (X) 的概率被定義為其 PDF 曲線下的面積 。因此 , 只有值范圍才能具有非零的概率 。連續隨機變量等于某個值的概率始終為零 。重量分布示例 連續正態分布可以描述成年男性的體重分布 。例如 , 可以計算男性體重為 160 到 170 磅之間的概率 。

Minitab基礎知識 minitab學習教程

文章插圖

但是 , X 精確等于某個值的概率始終為零 , 因為曲線下單個點的面積為零(沒有寬度) 。例如 , 男子體重恰好為 190 磅(至無限精確)的概率為零 。您可以計算男性體重超過 190 磅或小于 190 磅的概率 , 或者介于 189.9 到 190.1 磅之間的概率 , 但恰好等于 190 磅的概率為零 。
什么是離散分布? 離散分布描述離散隨機變量的每個值的發生概率 。離散隨機變量是指具有可計數的值的隨機變量 , 例如非負整數的列表 。在離散概率分布中 , 離散隨機變量的每個可能值可與一個非零概率相關聯 。因此 , 離散概率分布通常具有表格形式 ??蛻敉对V數量示例 不同于連續分布 , 在離散分布中 , 您可以計算 X 恰好等于某個值的概率 。例如 , 可以使用離散 Poisson 分布來描述一天內的客戶投訴數量 。假設平均每天的投訴數量為 10 , 并且您想知道在一天中接收 5、10、15 個客戶投訴的概率 。
Minitab基礎知識 minitab學習教程

文章插圖

您還可以查看分布圖上的離散分布 , 以了解各范圍之間的概率 。
Minitab基礎知識 minitab學習教程

文章插圖

4、使用概率密度函數 (PDF)
什么是概率密度函數 (PDF)?離散 PDF 的示例連續 PDF 的示例什么是概率密度函數 (PDF)? 概率密度函數可幫助確定隨機變量值的較高和較低概率的區域 。離散 PDF 的示例 對于離散變量 , PDF 將給出給定 x 值的概率值 。例如 , 糖果制造商生產多種顏色的某一類型糖果 。生產的糖果中有 30% 為黃色 , 10% 為橙色 , 10% 為紅色 , 20% 為綠色 , 30% 為藍色 。
Minitab基礎知識 minitab學習教程

文章插圖
【Minitab基礎知識 minitab學習教程】
連續 PDF 的示例 概率密度函數 (PDF) 是一個用于表示連續隨機變量的概率分布的等式 。例如 , 為葡萄酒瓶切割軟木塞的機器可產生直徑不同的軟木塞 。在下面的軟木塞直徑條形圖中 , 每個條形表示具有相應直徑的軟木塞的百分比 。
Minitab基礎知識 minitab學習教程

文章插圖

Minitab基礎知識 minitab學習教程

文章插圖

廣為熟知的鐘形曲線表示正態分布的 PDF 。盡管軟木塞直徑服從正態分布 , 但其他測量值(如將軟木塞從酒瓶中拔出所需的力)可能服從其他分布 。例如 , 對數正態分布的 PDF 有一個長的右尾 。例如 , 對數正態分布的 PDF 有一個長的右尾 。
Minitab基礎知識 minitab學習教程

文章插圖

5、使用累積分布函數 (CDF)
什么是累積分布函數 (CDF)?使用 CDF 評估填充重量的示例使用 CDF 計算 p 值什么是累積分布函數 (CDF)? 累積分布函數 (CDF) 計算給定 x 值的累積概率 ??墒褂?CDF 確定取自總體的隨機觀測值將小于或等于特定值的概率 。還可以使用此信息來確定觀測值將大于特定值或介于兩個值之間的概率 。使用 CDF 評估填充重量的示例 例如 , 罐裝蘇打水的填充重量服從正態分布 , 且均值為 12 盎司 , 標準差為 0.25 盎司 。概率密度函數 (PDF) 描述了填充重量的可能值的可能性 。CDF 提供每個 x 值的累積概率 。
Minitab基礎知識 minitab學習教程

文章插圖

使用 CDF 可以確定隨機選擇的罐裝蘇打水的填充重量小于 11.5 盎司、大于 12.5 盎司或介于 11.5 到 12.5 盎司之間的概率 。
Minitab基礎知識 minitab學習教程

文章插圖

Minitab基礎知識 minitab學習教程

文章插圖

Minitab基礎知識 minitab學習教程

文章插圖

使用 CDF 計算 p 值 為了計算 F 檢驗所對應的 p 值 , 必須首先計算累積分布函數 (CDF) 。p 值為 1 – CDF 。假設您使用下列自由度執行一個多元線性回歸分析:DF(回歸)= 3;DF(誤差)= 25;F 統計量 = 2.44 。計算 F 檢驗的 p 值選擇計算 > 概率分布 > F 。選擇累積概率 。在非中心參數中 , 輸入 0 。在分子自由度中 , 輸入 3 。在分母自由度中 , 輸入 25 。選擇輸入常量 , 并輸入 2.44 。在可選存儲中 , 輸入 K1 。單擊確定 。K1 包含累積分布函數 。使用“計算器”從 1 減去 p 值
選擇計算 > 計算器 。在將結果存儲在變量中中 , 輸入 P 值 。在表達式中 , 輸入 1-K1 。單擊確定 。計算的 p 值為 0.08795 。使用 0.05 的截止值 , 您不能斷定統計顯著性 , 因為 0.08795 不小于 0.05 。注意 該示例適用于 F 分布;但是可針對其他分布使用類似的方法 。
6、使用逆累積分布函數 (ICDF)
什么是逆累積分布函數 (ICDF)? 逆累積分布函數給出與特定累積概率關聯的值 。可使用逆 CDF 確定與特定概率相關聯的變量值 。使用 ICDF 確定保修期的示例 例如 , 一家電器制造商要調查其烤箱內加熱管的失效時間 。他們想要確定特定百分比的加熱管失效的時間 , 以便設定保修期限 。加熱管的失效時間服從正態分布 , 其均值為 1000 小時 , 標準差為 300 小時 。概率密度函數 (PDF) 可幫助確定較高和較低失效概率的范圍 。逆累積分布函數給出每個累積概率的對應失效時間 。使用逆累積分布函數估計 5% 的加熱管失效所需的時間 , 95% 的加熱管開始失效以及全部失效所需的時間 , 或僅剩 5% 加熱管未失效的時間 。特定累積概率的逆累積分布函數等于概率密度函數曲線下陰影區域右側的失效時間 。確定 5% 的加熱管失效所需的時間選擇計算 > 概率分布 > 正態 。選擇逆累積概率 。在均值中 , 輸入 1000 。在標準差中 , 輸入 300 。在輸入常量中 , 輸入 0.05 。單擊確定 。5% 的加熱管失效所需的時間預計為 0.05 倍的逆累積分布函數或 506.544 小時 。
Minitab基礎知識 minitab學習教程

文章插圖

確定 95% 的加熱管失效所需的時間
選擇計算 > 概率分布 > 正態 。選擇逆累積概率 。在均值中 , 輸入 1000 。在標準差中 , 輸入 300 。在輸入常量中 , 輸入 0.025 。單擊確定 。2.5% 的加熱管失效所需的時間預計為 0.025 倍的逆累積分布函數或 412 小時 。重復步驟 2 , 但輸入 0.975 而非 0.025 。單擊確定 。97.5% 的加熱管失效所需的時間預計為 0.975 倍的逆累積分布函數或 1588 小時 。因此 , 95% 的加熱管開始失效和全部失效所需的時間預計分別為 0.025 倍和 0.975 倍的逆累積分布函數或 412 小時和 1588 小時 。
Minitab基礎知識 minitab學習教程

文章插圖

確定 5% 的加熱管未失效的時間
選擇計算 > 概率分布 > 正態 。選擇逆累積概率 。在均值中 , 輸入 1000 。在標準差中 , 輸入 300 。在輸入常量中 , 輸入 0.95 。單擊確定 。僅剩 5% 的加熱管未失效的時間預計為 .95 倍的逆累積分布函數或 1493 小時 。
Minitab基礎知識 minitab學習教程

文章插圖

將 CDF 和 ICDF 與超幾何分布結合使用的示例 在嘗試確定離散分布的逆累積概率時 , 輸出結果中將包含兩組列 。假設某個比率的逆累積概率為 p 。輸出內容中第一組列將列出最大的 x , 使 P(X ≤ x) ≤ p 。第二組列將列出最小的 x , 使 P(X ≤ x) ≥ p 。計算超幾何分布的累積概率在工作表的 C1 列中 , 輸入 0 1 2 。
Minitab基礎知識 minitab學習教程

文章插圖

選擇計算 > 概率分布 > 超幾何 。選擇累積概率 。在總體大小 (N)中 , 鍵入 20000 。在總體中的事件計數 (M)中 , 鍵入 2000 。在樣本數量 (n)中 , 鍵入 20 。選擇輸入列并輸入 C1 。單擊確定 。將出現此輸出:
Minitab基礎知識 minitab學習教程

文章插圖

可以按如下方式解釋輸出內容:
P(X ≤ 0) = 0.121448 。獲得 0 個缺陷的概率大約為 12% 。P(X ≤ 1) = 0.391619 。獲得 0 或 1 個缺陷的概率大約為 39% 。P(X ≤ 2) = 0.676941 。獲得 0、1 或 2 個缺陷的概率大約為 68% 。計算超幾何分布的逆累積概率 現在 , 您知道了與缺陷數相關聯的累積概率 , 可以計算逆累積概率了 。假設您要計算缺陷數 x , 使累積概率 p 為 0.50 。通過前面的結果了解到 , P(X ≤ 1 ) = 0.391619 并且 P(X ≤ 2 ) = 0.676941 。由于超幾何分布是一種離散分布 , 缺陷數無法介于 1 和 2 之間 。換言之 , 可以有 1 個或 2 個缺陷 , 但不會有 1.4 個缺陷 。因此 , 如果選擇輸入常量并輸入 0.50 , 則 Minitab 將會在輸出中計算這兩個概率 , 如以下示例所示:
選擇計算 > 概率分布 > 超幾何 。選擇逆累積概率 。在總體大小 (N)中 , 鍵入 20000 。在總體中的事件計數 (M)中 , 鍵入 2000 。在樣本數量 (n)中 , 鍵入 20 。選擇輸入常量 , 并鍵入 0.50 。單擊確定 。將出現此輸出:
Minitab基礎知識 minitab學習教程

文章插圖

第一個概率指示 x 的值 , 使 P(X ≤ x) < p;第二個概率指示最小的 x , 使 P(X ≤ x) ≥ p 。在該示例中 , 第一個概率顯示最大缺陷數 x = 2 , 使 P(X ≤ 2) < 0.5;第二個概率顯示最小缺陷數 x = 3 , 使 P(X ≤ 3) ≥ 0.5 。
使用 ICDF 計算臨界值 可以使用 Minitab 計算一個假設檢驗的臨界值 , 而不用在表格中查找該值 。假設您在 α = 0.02、自由度等于 12 的情況下執行卡方檢驗 。對應的臨界值是多少?α = 0.02 所對應累積概率值為 1 – 0.02 = 0.98 。選擇計算 > 概率分布 > 卡方 。選擇逆累積概率 。在自由度中 , 輸入 12 。選擇輸入常量并輸入 0.98 。單擊確定 。Minitab 顯示臨界值 24.054 。對于卡方檢驗 , 如果檢驗統計量大于臨界值 , 則可以斷定存在否定原假設的統計學證據 。注意 此示例使用卡方分布 。但是 , 您可以為所選擇的任何分布執行相同的步驟 。
?
,