spss資料類型轉換 spss變量類型轉換



文章插圖
spss資料類型轉換 spss變量類型轉換

文章插圖
首先了解基本統計知識(大約5分鐘) , 接著選擇正確的研究方法進行結果解讀;與此同時 , 了解一些問卷研究的思路使得研究更加順手 。與此同時 , 掌握一些數據清理的技能更好 , 比如對異常數據處理 。
01. 基礎知識
【spss資料類型轉換 spss變量類型轉換】(1)數據類型識別
數據共分為兩類 , 定量和定類數據:
術語說明舉例定量數據數字大小具有比較意義您對天貓的滿意度情況(非常不滿意 , 比較不滿意 , 中立,比較滿意 , 非常滿意)定類數據數字大小代表分類性別(男和女) , 專業(文科、理科、工科)
(2)P值的意義
p 值是統計學名詞 , 其用于測量數據間的規律情況把握程度 。如果p 值小于0.01即說明某件事情的發生至少有99%的把握 , 如果p 值小于0.05(并且大于0.01)則說明某件事情的發生至少有95%的把握 。
研究人員想研究不同性別人群的購買意愿是否有明顯的差異 , 如果對應的p 值小于0.05 , 則說明呈現出0.05水平的顯著性差異 , 即說明不同性別人群的購買意愿有著明顯的差異 , 而且對此類差異至少有95%的把握 , 絕大多數研究均希望p 值小于0.05 , 即說明有影響 , 有關系 , 或者有差異等 。
(3)量表
量表答項類似于“非常同意”、“同意”、“不一定”、“不同意”、“非常不同意” , 也或者“非常滿意”、“比較滿意”、“中立”、“比較不滿意” , “非常不滿意”等 。大多數統計方法均只能針對量表 。量表是一種非常典型的定量數據 , 當然個別情況時也可以將其看成定類(即認可態度不同的幾類群體 , 但這種時候非常少) 。
02. 分析方法選擇使用
在確認好數據類型后 , 接著便可選擇正確的研究方法 。如下說明:
參考資料:https://spssau.com/helps/basics/concept.html
SPSSAU建議:先描述想研究什么用一句話描述 。話里面拆成X和Y:然后結合X與Y的數據類型 , 選擇對應的方法 。
比如性別/專業等為定類數據 , 那么基本情況分析部分 , 直接使用頻數分析即可;
如果數據中有量表態度題 , 那么基本情況分析時 , 可計算量表題的平均值 , 了解樣本的平均態度情況;
進一步想深入分析差異關系 , 如果是定類和定類關系 , 比如‘性別’和‘是否吸煙’的關系 , 那么可使用交叉(卡方)分析;如果是定類和定量關系 , 比如‘性別’和‘身高’的關系 , 那么可使用方差分析;
進一步想深入分析影響關系 , 即X對于Y的影響 , 如果Y是定量數據(比如身高) , 那么可使用線性回歸 。如果說Y是定類數據(比如是否愿意購買電影票 , 購買哪種類型的電影票) , 那么就需要使用Logit回歸分析 , 比如Y為是否愿意(yes和no兩項) , 那么就使用二元Logit回歸 , 如果是多個類別(比如購買‘愛情類’ , ‘喜劇類’ , ‘恐怖類’) , 那么此時使用多分類Logit回歸即可 。
如果數據中有量表數據即態度題 , 那么通常需要使用測量數據的真實性和量表設計的有效性 , 可使用信度和效度分析 。
如果數據中有多選題(多選題是一種特殊的定類數據 , 其分析應該以‘某個多選題的所有選項作為整體’一次性分析) , 可使用SPSSAU問卷研究里面的‘多選題’ , ‘單選-多選’ , ‘多選-多選’ , ‘多選-單選’ 。分別分析多選題各項的選擇比例 , 也或者單選題和多選題的差異關系 , 也或者多選題和多選題的差異關系 , 也或者多選題和單選題的差異關系 。
03. 問卷思路剖析
問卷思路上一般分成三個部分 , 分別是基本情況分析 , 差異關系研究和影響關系研究 。
首先是對問卷數據做基本的描述分析 , 結合數據類型 , 選擇使用頻數分析 , 或者描述分析即可;接著研究差異關系情況 , 結合數據類型選擇使用交叉卡方分析 , 或者方差分析即可;接著研究影響關系情況 , 即X對于Y的影響 , 結合Y的數據類型 , 選擇使用線性回歸或者Logit回歸即可 。
參考資料如下:https://spssau.com/helps/basics/framemodule.html
(1)基本情況分析
分析方法:頻數分析/描述分析
了解樣本特征情況 , 基本認知情況 , 基本態度情況比如個體基本特征(性別 , 年齡 , 學歷 , 專業)等基本分布情況如何;比如對于疫情的認知情況或態度情況如何?
(2)探索規律(差異關系)
分析方法:交叉卡方分析/方差分析
深入分析差異情況 , 找出數據規律比如分析不同性別/學歷/專業群體 , 他們對于疫情認知態度差異情況如何?
(3)探索規律(影響關系)
分析方法:線性回歸/Logit回歸
深入分析更進一步的影響關系情況 , 找出數據規律比如分析疫情認知態度情況 對 ‘疫情期間是否外出就讀’的影響關系情況?
(4)其它
如果數據有量表題 , 那么可以測量數據的真實性和量表題設計的有效性 。(僅針對量表題)
分析方法:信度分析/效度分析
探究數據的真實性和量表題設計的有效性比如使用量表題詢問‘消費升級’的態度情況 , 那么回收數據是否真實 , 且是否真的測量了‘消費升級’這個概念 。04.數據清理技能
數據分析前 , 有可能需要對數據進行清理 , 比如某個標題需要修改下 , 也比如數據中有大篇幅沒有填寫 , 也或者很多亂答(都選擇同一個答案) , 那么此時需要做‘無效樣本’處理 。
與此同時 , 數據分析的時候 , 比如想把學歷‘小學/初中/高中/大學/研究生’共5個類別 , 現在想組合成3個類別 , 分別是‘高中及以下/大學/研究生’ , 那么此時需要使用數據編碼功能 。
以上就是本次分享的內容啦 。如果你有什么疑難問題 , 可以在評論區告訴我們 。