欠損値|心理士が選ぶ!公認心理師試験で押さえておきたいトレンドキーワード
- 2021-6-29
- 国家試験対策
欠損値
欠損値とは、収集したデータに記入漏れがあるなど、何かしらの理由で数値や回答が欠けた状態をいいます。欠損値の処理では、欠損値のあるデータをすべて削除するリストワイズが主流でしたが、今では欠損値の種類によって適切な欠損値の処理を行う方法が主流となっています。
欠損値には大きく、
・完全にランダムな欠損(missing completely at random;MCRA)
・観測データに関する欠損(missing at random;MAR)
・欠損データに依存する欠損(missing not at random;MNAR)
があります。
MCRAは、単にデータが欠損してしまったことに由来する欠損で、故意でない記入漏れがこれに当たります。
MARは、介入研究において後半になるにつれて参加者が減少し、欠損値が増えたというように、特定の傾向を持つ人のデータが欠損している場合を指します。
そして最後のMNARは欠損値の発生が欠損値そのものに依存する場合をいい、たとえば、非肥満者は体重を正確に自己申告したけれど、肥満者の多くが体重を申告しなかった場合などが考えられます。
データに欠損が見られたときは、まず、どの欠損パターンであるのか欠損値を分析し、それに応じた対応を心がける必要があります。欠損値の処理において、最も制度の高い補完方法は多重代入法で、この方法での補填が求められます。
予想問題を解いてみよう!
問題:欠損値に関する以下の記述のうち、正しいものを1つ選べ。
①データに欠損値が見られた際に、代表する平均値を代入することをリストワイズと呼ぶ。
②欠損値が少ない場合は、そのままデータを統計分析しても問題ない。
③欠損値がデータに依存する欠損値であったため、多重代入法で欠損値を補填した。
④男性全員が回答せず欠損値となった項目を、完全にランダムな欠損として処理した。
解答を見る
正答:③
①「リストワイズ」でなく「平均値代入法」。
②正確な統計量が推定されないため、欠損値を精査する必要がある。
④男性という性別要因によってデータが欠損している可能性。「観測データに関する欠損」。
【参考文献】
1)高橋将宜・渡辺美智子.欠測データ処理:Rによる単一代入法と多重代入法.東京,共立出版,2017,208p.
(構成・文/公認心理師 洲脇利広)
心理士が選ぶ!公認心理師試験で押さえておきたいトレンドキーワード TOPに戻る
▼こころJOBの試験対策はこちら
・受験対策本
『第2版 本番さながら! 公認心理師試験予想問題 厳選200』☆新刊☆