技術者や品質管理担当者が気にするのが「サンプリング数の設定」ですね。品質管理の本を読んでも、具体的に幾つにすればよいかについて書かれた本は見たことがありません。いろいろなケースがあって、書けないこともありますし、書いてしまって問題があった場合責任問題にもなりますので書けないのだと思います。ですから、「統計的に十分なサンプル数が必要」という曖昧な表現になってしまうのです。 本日述べることは、一つの考え方ですので参考にしていただければよいと思います。何回かに分けて説明します。
資料をご覧ください。 → 品質・技術者に必要な統計手法②-1
p.2 サンプリング数は、目的に応じて考え方を変えるべきです。技術設定の段階なのか、条件設定の確認段階か分けて考えるべきです。技術設定の段階は、スクリーニング的な「当たり付け」が必要です。 どうも皆さん、マトリックスを作って全ての組み合わせを検討したがる傾向が強いです。 当たり付けでは何点みればよいでしょうか? 最低でも3点は必要ですね。傾向を掴むには。
p.3 傾向を掴む当たり付けには、センスが必要です。例えば9つのポイントがある場合、A、B及びCのような順番で検討することを考えてみてください。Aは9回、Bは7回そしてCは6回で済みます。この場合、ボリュームは数字の大きさとともに音量が増加するという仮定をした場合ですが。
p.4 皆さん求める機能が得られる真中のデータをたくさん検討しようとします。真中より、性能がぎりぎり得られるあるいは得られない境界のデータを多く取る必要があります。境界値がわかれば、分布のばらつきも判断することが可能なのです。 大学の研究は、一番最適な中央値狙いかもしれませんが、製品化検討の場合は、境界の見極めが重要です。
p.5 技術検討、受入試験、工程検査などでサンプリング数を幾つにすればよいか悩みますね。最低3個あれば再現性があると言える? 十分安定した系であればこれでもよいかもしれません。ただし、3つのデータで標準偏差σを計算するのは無理があると思います。
p.6 例えば、個数が10,000個、平均値が50、標準偏差σが20の母集団より、ランダムに5個、10個、20個、30個、50個及び100個サンプリングした標本の平均値と標準偏差をシミュレーションしてみました。各々の標本の平均値及び標準偏差をサンプリング数に対してプロットしてみると、N=30辺りから母集団の平均値及び標準偏差に収束してきます。
p.7 t分布のn数が増加すると正規分布に近づいていきます。定性的ですが、N=30以上あればほぼ正規分布と言えます。
p.8、9 母集団の平均値μをサンプリングした標本の平均値xバー、標準偏差及び信頼度の閾値より推定します。p.9の不等式の範囲が、母集団の平均値μがあると推定される範囲です。p.9右下左の表にある閾値は、例えば分布の上と下側で各々2.5%(α/2)、足して5%(α)の時の閾値で1.96となります。上と下側合わせて5%間違える可能性がある場合の推定値になります。1%間違えても良い場合の閾値は2.57です。 以上のことより、サンプリング数nが大きいと推定値の幅は狭く、間違えても良い確率が小さいと逆に推定幅は広くなります。間違えても良いように幅が広がるのです。 母集団の平均値の推定値を縦軸、サンプリング数を横軸にして図にしたのがp.8です。このグラフの赤丸の部分から右、つまりサンプリング数が約30以上になると推定値が大きく変化しないことがわかります。 母集団の標準偏差σが不明の場合の平均値の推定は青字の式のようになります。Zの代わりにtが閾値となり、この場合は標本数nから1を引いたn-1の自由度に対応した値をt分布表から探して用います。また√nではなく√n-1で標本の標準偏差sを割るところが異なります。n数が大きくなると上述のZ/√nに近づくはずです。
以上のp.6、p.7及びp.8のことより、正規分布?であれば、統計的に議論する最低のサンプリング数は30程度だろうと私は考えています。 異論のある方も居られるかもしれませんが。
p.10 横軸をサンプリング数、左側の縦軸をZ(α/2)×σ/√nで2本の曲線をプロットします。赤の曲線が信頼度の閾値が大、青の曲線が信頼度の閾値が小の場合です。右側の縦軸をコストとしてサンプリング数に対してプロットした直線を描きました。 緑は許容値Eです。緑の直線と青もしくは赤の曲線を交わった点のx座標がサンプリング数、そのn数でのコストはオレンジの直線より求めます。 信頼度の閾値を上げるとサンプル数が増え、コスト高になります。品質部門と協議して最適な検査を設定ください。
p.11 品質工学の直交表実験、例えばL18では18行の実験を1回ずつしかしませんが、N=1でいいの?という質問を受けます。例えば制御因子Bの列をご覧ください。B1、B2及びB3という水準について各々6回(しかもB以外のパラメータがいろいろ変わった組合せ)も検討しているので、十分なのです。
p.12 兎角、品質や技術部門の方は「手順書に書いてあるから」「今までそうだったから」「統計的にする必要があるから」と言って、数が少な過ぎたり、逆に過剰過ぎることが往々にしてあります。もっと深く考えてN数を決めて欲しいものです。
明日は、「サンプルサイズの決め方」(著者:永田 靖 発行所:朝倉書店)の一部を自分なりに解釈して説明する予定です。