Last Updated on 2024年3月30日 by カメさん
こんにちは!看護師のカメさん(@49_kame)です。
今回は3つ以上の群がある時に、データの差を分析する方法について解説するよ!
3つ以上のデータを扱う場合には分散分析を使用します。分散分析は analysis of varianceの頭文字をとってANOVAとも呼ばれています。
3つ以上の群がある場合でも、t検定の時と同様に「対応のあるデータ」と「対応のないデータ」があります。
この記事では、3群以上の対応のないデータの差を分析する方法について解説します。
一元配置分散分析とは?
一元配置分散分析とは?
- 3つ以上の群がある時に、平均値に差があるかを確認する方法
- 対応のないデータに使用する
3つ以上の群にt検定は使えない
3つ以上の群に対して、t検定など2つの群の差を分析する検定を繰り返し行うと正しく判定する確率が下がり間違った結果となるため注意しましょう。
多重比較法とは?
多重比較法とは?
- 3つ以上の群のどの組み合わせに平均値の差があるかをを確認する方法
- 有意差は組み合わせ毎に結果が出る
上記の一元配置分散分析では3つ以上の群全体として差があるかを確認しました。多重比較法は、更にそれぞれの群間で差があるかを分析したものです。
多重比較法の結果は、A群とB群での有意差とA群とC群での有意差など群毎に結果が出るよ。
分散分析のフロー
分散分析の流れを以下に示します。
「データの性質を把握して一元配置分散分析を行う。有意な差があれば多重比較法を行う」というのが一般的な流れです。
詳細は下記の「分散分析のフロー」と「多重比較法のフロー」を参照してください。
分散分析が有意でなければ解析終了
分散分析が有意でなく主効果がないのであれば、そこで分析は終了となります。そのため多重比較法の結果を採用することはありません。
分散分析の用語を確認「要因・水準・主効果とは?」
分散分析に使用される用語についてまとめました。
要因とは?
要因とは?
- 因子とも呼ばれる
- データの差に影響を及ぼす原因となる変数のこと
水準とは?
水準とは?
- 処理とも呼ばれる
- 要因のそれぞれのカテゴリーのこと
主効果とは?
主効果とは?
- 要因の平均差のこと
ちなみに要因で有意な差を認めたならば、多重比較で個々の水準間の有意差を比較するよ。
分散分析の分析方法の選択フロー
まずはデータの分布を確認し、正規分布かどうかをShapiro-Wilk検定にて確認します。
正規分布でなければKruskal-Wallis検定です。正規分布であれば、次にLevene検定にて等分散確認を行います。
等分散であれば一元配置分散分析、等分散でなければWelchの分散分析となります。
Shapiro-Wilk検定はp≧0.05で正規分布
正規分布や等分散の確認の際は、普段の検定とは異なり、Shapiro-Wilk検定やLevene検定で「p≧0.05」の場合が「正規分布」や「等分散」となるので注意してください。
多重比較法の選択フロー
例としてp=0.05を基準としています。
上記の分散分析の分析方法の選択の続きです。分散分析の方法によって、多重比較法の選択が異なります。
分散分析の方法が一元配置分散分析、Welchの分散分析、Kruskal-Wallis検定のどれかに選択できたら、実際に分析を行います。
分散分析で有意差がでなければ解析はそこで終了となります。もし分散分析で有意差があるならば、多重比較で水準間の有意差を確認しましょう。
多重比較法の選択は、一元配置分散分析ならばTukey法、Welchの分散分析ならばGames-Howell法、Kruskal-Wallis検定ならばSteel-Dwass法を選択して分析します。
分散分析・多重比較法の結果の解釈とは?
分散分析・多重比較法がどちらも有意な差があったとすると?
といった結果の読み取り方になります。
分散分析で有意な差があったが、多重比較法で有意な差が無かった場合は?
という結果の解釈になります。
分散分析で有意差がなく多重比較で有意差ありとなった場合?
先の検定である分散分析の結果を採用するため、分散分析のみの結果の解釈になります。
結果の解釈の注意点
どの統計解析でも同じことが言えますが、データの特性値やばらつきなどの統計解析結果以外にも注目するようにしましょう。
有意差ありと出たが、臨床的に本当に意味のある差なのか、極端に偏った値はないかなども検討するようにしてください。
実際の論文での一元配置分散分析
この論文は中堅看護師のプラトー現象(進歩が停滞すること)の実態とその要因を調査した研究です。
以下に分散分析の表を示します。
この表では、自律性の尺度について5年未満、5~20年未満、20年以上の3群に分けて一元配置分散分析とTukeyの多重比較を行っています。
この表ではF値のみが記載されていますがP<0.05などの表記は「*」で表記されています。
この研究では分散分析の他にも相関分析や回帰分析など様々な分析方法が使用されています。
分析方法は、知りたいことや扱うデータの種類によっても異なります。論文を読む際は、なぜその分析方法を選択したのかまで考えながら読むと、理解が深まると思います。
F値とは?
- 分散分析では解析を行うとF値が算出される
- F値とは(群間変動の不偏分散)/(群内変動の不偏分散)で定義される
- F値が大きければ、群ごとの平均値に有意差があるということだけ覚えておけば問題ない
- 多くの統計ソフトでは分散分析の解析の際にF値とともにp値も算出される
まとめ
分散分析による解析方法を選択する際は、扱うデータが対応のない独立したデータなのか対応のあるデータなのかを確認しましょう。またデータが正規分布かどうかによっても分析方法が変わるため、収集したデータの分布も確認するようにしましょう。
分散分析には多重比較法がセットです。2つの解析を行うため結果の解釈を慎重に行うようにしましょう。
おまけ
今回紹介した論文は中堅看護師のプラトーについてでした。結果は中堅看護師はプラトーを感じているとのことでしたが、確かに実感があります。
5年目くらいを過ぎると、業務でできないことは無くなって、挑戦するという気持ちが薄れる時期がありますよね。
この研究で素晴らしいのは、要因まで検討していること。結果としてはプラトーの要因が自律性とのこと。確かに、現場で働いても業務リーダーや委員化、係活動など役割を与えられると、やる気が上がりますよね。
みんなが何となく分かっていたことでも、研究結果という形で示してもらえると対策を立てるきっかけになりますよね。
研究結果と現場の繋がりが増えると、より良い職場環境になりそうですね。
コメント