分布の加算あるいは減算後の分布の分散がどうなるか、まずは生成AIに質問してみました。
回答はこちら → 寸法公差に関する回答
質問1:平均値と分散が異なる2つの分布を加算した分布と減算した分布の平均値と分散の式を教えて
回答1:加算した場合 平均値: μX+Y = μX + μY 分散: σX+Y^2 = σX^2 + σY^2 (ただし、XとYが独立であるとき)、減算した場合 平均値: μX-Y = μX - μY 分散: σX-Y^2 = σX^2 + σY^2 (ただし、XとYが独立であるとき)
続いて、質問2:減算の場合の分散がσX-Y^2 = σX^2 - σY^2にならない理由を教えてください
回答2:分散は、確率変数がその平均値からどれだけばらつくかを表す指標であり、その計算には各データの平均からの差(偏差)の二乗を用います。そのため、分散は常に正の値を取ります。
以下に、数式で導出した説明をまとめます。
資料はこちら → 寸法交差証明
p.1 以前のブログ「ノイズにはノイズを」とは異なる方法で説明します。分布を加算する場合、x分布の期待値は平均値μx、y分布の期待値はμyです。x分布の分散の期待値はσx2、y分布の分散の期待値はσy2です。x分布とy分布の加算した分布をz分布とします。z分布の期待値はxとy分布の平均値の和です。z分布の分散の期待値は、zにx+yとμzにμx+μyを代入して式を展開していきます。xとyが独立の場合、E[xy]=E[x]E[y]が成り立つので、代入して整理すると、σz2=σx2+σy2が得られます。σ2は分散ですので、x分布の分散とy分布の分散の加算したものがz分布の分散になることを示しています。分散の加法性が成り立ちます。
p.2 x分布からy分布を減算した場合の分散を、p.1と同様に導出します。z=x−yに置き換えるだけで、結果は、σz2=σx2+σy2が得られます。平均値は減算で小さくなりますが、分散は足し算で加法性が成り立っていることがわかります。
p.3 別法です。分散は一番上のような定義式となります。この式の意味は、(X−μ)2が変数Xが分布の平均値μからの距離の2乗つまり離れ具合を表しています。ばらつきが大きいとこの数値が大きくなります。f(X)は確率密度関数です。分布の各変数Xの点において、(X−μ)2とf(X)の掛け算を算出して−∞から∞まで足し合わせたものが、(X−μ)2の期待値である分散V(X)となります。展開して解いていく段階で、f(X)を−∞から∞まで積分する項があります。確率密度を全ての領域で足し合わせた確率は1ですね。Xf(X)を−∞から∞まで積分した期待値E(X)は、平均値μです。すると、青字で示した公式が得られます。この式に、XにX+YあるいはX−Yを代入するいずれの場合もV(X)+V(Y)となります。
p.4 E[xy]=E[x]E[y]が成り立つことを、xとyの変数が3つの場合で、検証してみます。期待値=(変数✕確率)の和です。x、yおよびxyの確率を表にしてあります。xyの確率を足していく際に(p1+p2+p3)=1を用いて式を整理すると、E[xy]=E[x]E[y]となりました。p.3の積分の式も期待値を求める式なので、難しそうに見えますが、これと同じです。
昨日のシミュレーション結果と今回の数学的な導出により、寸法分布の平均値の加算と減算は式通り足したり引いたりしますが、分散に関しては常に足し算になることがわかりました。やっと、本件については私の中で一件落着です。