ビッグデータを用いて解析する際のデータ様式について説明します。
資料はこちら → データ並び替え
p.1 測定者A、B及びCが部品1~10について3回測定したデータは通常、Excelにこのような表でまとめることが多いと思います。Excelの分析ツールを使って解析することは可能です。以下は繰返しのある二元配置の分散分析を分析ツールを用いて実行した結果です。①~⑤の手順で実施します。
p.2 統計ソフトのMinitabを用いて、繰返しのある二元配置の分散分析をするためには、データ配列を入れ替える必要が生じます。例えば、Minitabをもちいて、GRRを算出するためには、分散分析を実施するため、同様なデータ配列にします。
p.3 今後、データを解析するために気を付ける留意点は、①横長のデータ配列から縦長のデータ配列に置き換える必要があります。列:フィールド、項目とし、行:レコード、データとなります。②Excelにおいて、セルの結合は用いない。③1セル1データ、④数値と文字(単位、記号)を一緒にしない、⑤同一列、行内に数値と文字を混在させない、⑥同一語句を省略しない、⑦機種依存の文字を用いない、⑧データを分断させない があります。
ビッグデータを扱う場合は、省略せずに列ごとに全ての情報を入れておくことが重要です。