Last Updated on 2023年12月30日 by カメさん
こんにちは!看護師のカメさん(@49_kame)です。
この記事は5~6分程度で読めます。
今回はデータセットの作成方法について解説します
看護研究における統計解析は、正確なデータセット作成から始まります。この記事では、看護研究で統計解析を行う際に、データセットをどのように作成し、管理し、活用するかに焦点を当てています。
データセットの概要、作成の必要性、具体的な作成方法、そして作成時の注意点について詳しく解説します。この記事が、看護研究におけるデータセット作成の理解を深め、研究の質を向上させるための一助となることを願っています。
データセットの作成は単純作業ですが、統計解析ソフトに読み込むためには注意点が多くあります。間違った方法で作成してしまうと統計解析ソフトに上手く読み込めないので、今回解説するポイントを確認しながら作成するようにしてください。
データセットの基礎
データセットとは?
データセットは統計解析や研究で用いる目的で集められた情報の集合体です。特定の形式で整理された行と列で構成されます。看護研究では患者の健康情報、臨床試験結果、調査回答など、多岐にわたる情報を収集し、データセットとして整理します。
データセットを使用して統計解析を行うことで研究結果を導きます。データセットを効果的に管理し解析することで、研究の信頼性を高め、より質の高いケアを提供するための洞察を得ることができます。
普段の業務にも役立つ
データセットに関する知識は研究だけではなく普段の臨床業務にも活用できます。普段から色々なデータをデータセットにしておくことで、数字に基づいた業務改善をすることができます。是非この機会にデータセットの作り方を身につけましょう。
また、よく似た言葉にデータベースがあります。データベースとは、ルールに従って検索や蓄積が容易にできるように整理された情報の集まりのことです。例えば業務で集めた乱雑で膨大なデータの、形式を整え、いつでも取り出せるようにしたものなどです。日付や時間、対応した看護師名、処置の種類や回数などの業務関連のデータをデータベース化しておくことで、いつでもデータを取り出して分析を行うことができます。
分析のためにデータベースから取り出したデータの集まりがデータセットだね。
今回は統計解析のためのデータセットの作り方を解説します。
なぜデータセットを作成する必要があるの?
調査したデータを統計解析ソフトに取り込んで分析するためには、データセットを作る必要があります。また適切に整理されたデータセットは、分析を容易にするとともに、研究の再現性を保証します。さらには、研究の透明性を高め、あなたの研究の信頼性を高めることができます。
データセットは統計解析のためだけじゃなくて、研究結果の根拠としても重要なんだね。
データセットの具体例
直接統計ソフトにデータを入力することも可能ですが、表計算ソフト(Excelなど)読み込む方が簡単です。今回は表計算ソフトを使用してデータセットを作成する方法を解説します。下記がデータセットをExcelで作成した例です。研究で収集したデータが一覧となっています。
下記にデータセットの例をダウンロードできるようにしておくので良かったら参考にしてください。
それでは、データセットの作り方を解説します。
データセットの作成
データセットの作成方法
データセットの作成は研究の過程で行われます。そのためまずは、研究目的を達成するために何を測定し、どのような情報が必要かを明確にする必要があります。次に、アンケート、電子カルテ、直接観察などの方法を用いてデータを収集します。データを収集したら(もしくはデータ収集と並行して)データセットを作成します。今回はここから解説します。研究のプロセス自体を学びたい方は【これを読めば看護研究ができる!】看護研究は“8つのステップ”「研究テーマ決め→研究発表までの流れを徹底解説」を参照してください。
それでは収集したデータを適切な形式に整理する、つまりデータセットの作成方法を解説します。データセットの作成は、規則性が重要です。下記の手順に従ってデータセットを作成しましょう。
手順➀ | データセットに入力する項目(変数)を決める |
手順② | 項目(変数)の定義を別シートに記載する |
手順③ | 質的変数(カテゴリー変数)をコードに変換する |
手順④ | 1行目に変数を入力する |
手順⑤ | 2行目からデータを入力する |
手順➀:データセットに入力する項目(変数)を決める
手順の1つ目として、データセットに入力する項目(変数)を決めましょう。データセットに入力する項目とは、データセットの一番上の行に記載する項目のことです。
アンケートで収集した全ての項目を記載しても良いですし、解析に使用する項目だけに整理しても良いです。データセットを作成する際は、ただし自由記述等のデータは除外するようにしてください。
手順②:項目(変数)の定義を別シートに記載する
手順の2つ目として項目(変数)の定義を別シートに記載しましょう。
基本的にはデータセットには、データのみの記載が望ましいとされます。そのためデータに関する説明を別シートに記載しておきましょう。
上記の図の他にも、データに関する説明として、アンケートで5件法で収集した場合に「5:とても分かる~1:まったく分からない」の基準を記載したり、収集したデータの単位などを記載しておきましょう。
どのようにデータを定義したかを明確にしておくことは、後々データを解釈する上で重要となります。
手順③:質的変数(カテゴリー変数)をコードに変換する
手順の3つ目として質的変数(カテゴリー変数)をコードに変換しましょう。
質的変数とは、男女などの分類にのみ意味を持つ変数のことです。これらの変数は男性・女性やグループA、グループBなどの形式でデータセットに入力されることが多いのですが、文字データは統計ソフトに読みこめないことが多いので、数字に変換します。下記が、文字データを数字に変化した例です。
数字に変換する作業がコード化です。数字に変化する際は、0.1.2 で数字に変換します。
どの数字が、何を意味するのかは研究結果を解釈する上で重要になるから必ず明記しておこう。
手順④:1行目に変数を入力する
手順の4つ目として、データセットの1行目に手順➀で決めた変数を入力しましょう。下記が変数を入力する部分です。
手順⑤:2行目からデータを入力する
手順の5つ目として、データセットの2行目からデータを入力していきましょう。データセットに入力する項目が決まっているので、後はそれぞれの項目についてデータを入力していく作業です。
この後の、データセットを作成する際の注意点でも説明しますが、1行につき1サンプルのデータになるので注意してください
データセット作成時の注意点
データセットを作成する際には、データの完全性、正確性、一貫性を確保することが重要となります。データの収集と整理は慎重に行い、すべてのデータが正しく記録されていることを確認しましょう。欠損値がある場合は、その旨が分かるようにしておきましょう。
また、データセットに含まれる変数が研究の目的に適しているかどうかを確認し、必要ならば専門家の意見を求めます。加えて、個人情報の取り扱いには特に注意し、倫理規定に従い、データ保護法を遵守することも重要なポイントです。
それではデータセットを作成する際の一般的な注意点を紹介します。データセットを作成する際は、下記の10個のポイントに留意して作成するようにしましょう。先ほどの作成手順と重複する点もありますが、ご容赦ください。
注意点➀ | 1行目は各データの変数名にする |
注意点② | できれば変数名には日本語を使わない |
注意点③ | 最初の文字は数字にしない(errorになる) |
注意点④ | 質的変数はコード化する |
注意点⑤ | データセットとは別シートで対応表を作成する |
注意点⑥ | 変数やデータにスペースを入れない(アンダーバー「_」を使用する) |
注意点⑦ | データに単位を付けない |
注意点⑧ | 1つのセルには1つのデータを入力する |
注意点⑨ | 1行(横一列)にまとめるデータは1サンプルのみとする |
注意点⑩ | CSVファイルで保存する |
経時的データの取り扱いは?
経時的なデータとは、同じ対象について事前・事後・1カ月後などでデータを収集した場合などです。このような経時的なデータについては、同じ対象でもデータを取得したタイミング毎に別サンプルとして扱いましょう。つまり同じ対象でも時期が違えば、それぞれ1行を使用して入力するということです。
データごとに行を作成して、左端のIDは異なるものとしましょう。またデータ取得日が分かるようにdateの項目を作成しておきましょう。
CSVとは?
CSVとは、「Comma Separated Values(カンマ セパレーティド ヴァリューズ)」の略で、各項目間がカンマ(,)で区切られたデータのことです。
データセットのファイル形式は、CSVファイルが推奨されています。CSVファイルはExcelファイルの保存の際にファイルの形式を選択するだけで作成可能です。
まとめ
データセットの作成と管理は、看護研究を達成する上で中心的な役割を果たします。明確で整理されたデータセットにより、研究者は有意義な結果を得るための正確な統計解析を行うことができ、最終的には研究結果に対する洞察を深めることができます。
この記事が、看護師や研究者がデータセットの重要性を理解し、その作成と利用に関するスキルを磨くための一助となることを願っています。
コメント