Last Updated on 2024年3月28日 by カメさん
こんにちは!看護師のカメさん(@49_kame)です。
この記事は5~6分で読めます。
今回は収集したデータが正規分布かどうかを統計解析ソフト(EZR)を使用して確認する方法を解説するよ。
看護研究におけるデータの正確な分析は患者のケア品質を向上させる鍵です。そして正規性の確認は統計解析過程において基本であり、データがどの統計手法に適しているかを判断するために不可欠です。
この記事では、統計ソフトEZRを使用して、看護研究データの正規性を確認する手順とその解釈方法を、具体例を交えながら詳細に解説します。
このブログでは統計解析ソフトしてEZRを使用しています。EZRは無料かつ精度も高い統計解析ソフトであるためおすすめです。EZRの概要とインストール方法については【EZRの概要とインストール方法】看護研究を変える!EZRで効率的な統計解析を参照してください。
はじめに:正規性の確認とは?
正規性の確認は、統計学においてデータが正規分布に従っているかを調べることです。
正規分布は、平均値を中心に左右対称なベル型のグラフで表され、多くの自然現象や生物学的測定値に見られます。看護研究では、正規性の確認はデータ解析を行う上での基礎となり、適切な統計手法の選択に影響を与えます。
基本的にはデータは正規分布に従うと言われているけど、看護研究では対象者数が限られていることや偏りが出てしまうアンケート内容が影響して正規分布に従わないことが多いよ。必ず確認しよう。
正規分布の概要について詳しく知りたい人は【正規分布とは?:概要編】看護研究の疑問を解決「データの分布を理解しよう」を参照してください。
それではさっそく正規性を確認しましょう。
EZRを使った正規性の確認手順
EZRは統計解析を容易に行うための統計解析ソフトです。正規性の確認手順を詳しく解説します。
データセットの例
今回はこちらのデモデータを使用します。
表示しているのは、デモデータの一部です。デモデータは下記からダウンロードできるので使ってみてください。
※正規分布しているデータ(睡眠時間)と正規分布していないデータ(運動時間)があるので使ってみてください。
ランダム関数で作成しているため、今回の結果とズレが出るかもしれませんが、ご了承ください。
今回は上記のデモデータを読み込んだ後の段階から解説します。データの読み込み方法については、【統計解析ソフトにデータを入力】看護研究初めの一歩:EZRにデータセットを入力しよう!を参照してください。
正規性の確認手順
EZRでは、グラフィカルな方法(ヒストグラム)と統計的テスト(「Kolmogorov-Smirnov検定」「Shapiro-Wilk検定」による算出)を用いてデータの正規性を確認します。これらの手法を使ってデータが正規分布に従っているかを評価します。
それでは具体的な手順を解説します。
EZRで正規性を確認する際、まずは「正規性の検定(Kolmogorov-Smirnov コルモゴロフ-スミルノフ検定)」を選択します。
正規性の検定としてKolmogorov-Smirnov検定を選択しますが、解析を行うと「Kolmogorov-Smirnov検定」「Shapiro-Wilk検定」の両方の検定結果が出力されます
次に、正規性を確認したい変数を選択します。変数を選択して、OKをクリックすると解析が始まります。
解析が終わったら、出力結果を確認しましょう。
結果の解釈
正規性が確認できた場合
結果としては、出力の欄にKolmogorov-Smirnov検定のp値と、Shapiro-Wilk検定のp値が表示されます。
また、ヒストグラムも出力されます。ヒストグラムも出力されるため、視覚的にも正規分布かどうか確認することができます。
サンプル数が5000以下の場合は「Shapiro-Wilk normality test」の結果を見ましょう。今回はサンプル数50なので、シャピロウィルク検定の結果を確認します。
「p-value」を確認し、p≧0.05の時は「正規分布している」と判断します。
今回の睡眠時間のデータのp-valueは0.08509 つまりpは0.05以上であり、正規分布しているという判断になります。
ヒストグラムも綺麗な形をしていますね。
ちなみに研究結果として記載る際は、p<0.05 やp≧0.05ではなく、出力された「p=」の値を記載するようにしましょう。
データが正規分布に従っていると確認されれば、パラメトリックな統計手法を使用することが可能です。統計手法の選択について詳しく知りたい方は【統計解析はどれを使えば良いの?】看護研究の悩みを解決!を参照してください。
正規性が確認できない場合
正規性が確認できない場合の例も見てみましょう。デモデータの運動時間のデータについて正規性を確認してみます。
下記が出力結果です。運動時間については、p値が0.001146 つまりpは0.05未満であり、正規分布していないという判断になります。
正規性が確認できない場合は、非パラメトリックな手法を選択します。統計手法の選択について詳しく知りたい方は【統計解析はどれを使えば良いの?】看護研究の悩みを解決!を参照してください。
まとめ
正規性の確認は看護研究における統計解析で非常に重要です。
そして統計ソフトのEZRを使用することで、正規性の検定が容易になり、適切な統計手法の選択につながります。あなたの研究が、さらに信頼性の高いものとなることを願っています。
正規分布の概要について詳しく知りたい方は下記を参照してください。
コメント