以前のブログ「悩ましいサンプリング数の設定」の添付資料の最初にあるように、研修生に「当たり付け実験で最低何ポイント、データをとるか?」という質問を必ずしています。
次の資料をご覧ください → データポイント
p.1 上述の質問です。 当たり付けですから「技術設定の段階」です。少なくとも3ポイントとらないと直線なのか、上に凸なのか下に凹なのか傾向は掴めないですよね。 この話を研修生にすると、実際に当たり付けのデータを取り始めます。 「各ポイントはN=1でもいいよ。どうしても気になるようであれば、あと2ポイント追加してください」と言っておくのですが、多くの研修生は3つのポイントで各々3つの繰り返しのデータをとることが多いのです。おそらく再現性を気にしているためだと思います。当たり付けですから、再現性はあまり気にしておらず、傾向を見て欲しいのですが、なかなか意図が伝わらなく困っていました。そこで、p.2以降の資料を作成して説明しました。 少しでもこちらの意図が伝わって欲しいと思っています。
p.2 順番にページを追っていってください。先ずこのページ、2点なら直線。
p.3 赤の点が追加されたら?
p.4 こんな曲線になりますか。
p.5 4点目をとると、これは?
p.6 放物線?
p.7 あれ? もうわからなくなってきました。
p.8 六角形?
p.9 もうなんだかわからない
p.10 円? キリがないので、この辺で止めておきます。
p.11 上のAのパターンです。ポイント1~3まで各々3データ取りしてプロットしました。平均値を折れ線で結ぶと、上に凸の傾向を示しているように見えます。Bのパターンをご覧ください。 ポイント2の一番上のデータ(×印)が間違ったデータで、正しい値が一番下のデータ(●)します。 傾向は下降する直線のように見えます。
p.12 上のA,BはP.11と同じものを再掲しています。3つのポイントで各々繰り返し3つのデータをとると、1個間違ったデータを得るだけで、傾向を見誤る可能性が高いです。 下のCをご覧ください。 同じ9個のデータをとるのであれば、9つのポイントで分散させてとることをお勧めします。1つのポイントが間違っていても外れ値して除外することができ、上のデータのとり方よりも傾向を見る際の信頼性は高いと思います。
スケッチする際に、いきなり1本の線で描かずに、複数の線を描いて形を整えていくのと同じイメージです。 当たり付けデータは、同ポイントで繰り返しとるよりは、分散した点でデータをとりましょう。