Note of Pediatric Surgery

腸内細菌、R、ときどき小児外科

Rでエラーバー付き折れ線グラフを書く ( 1 ) エラーバーとSDとSE

エラーバーについて書いていこうと思います。エラーバーとは何かというと、棒グラフや折れ線グラフについているエ字の棒です。あれがあると統計分かってる風に見えて格好いいのもありますが、統計学的には非常に大切なことです。

まずエラーバーとはWikipediaを引用すると

  エラーバー(英: error bar)は、データの変動性の図形描写であり、誤差(エラー)あるいは報告された測定の不確かさを示すためにグラフにおいて使用される。エラーバーは測定がどれほど正確か、逆にいえば、真の値が報告された値からどれほど離れているかの概念を与える。

とあります。で、僕が今回疑問に思ったのはこの先です。

  エラーバーはしばしば、不確かさの標準偏差、標準誤差、あるいは任意の信頼区間(例えば95%信頼区間)を表わす。これらの量は同じではないため、グラフあるいは説明文にはエラーバーが何を表わしているかを明確に記さなければならない。

重要なことは、あのエ字のバーが示している区間標準偏差、標準誤差、95%信頼区間、またデータの範囲(最小〜最大)であり、グラフによってというよりグラフ作成者が自由に選んで言いということです。

当然頭に浮かぶ疑問は、どういう時にどの区間を使用すれば良いのだろうか?ということだと思います。僕が作りたいのはマウスの2群4匹ずつの体重の平均の変化を表す折れ線グラフで、そこにエラーバーを付けたいと考えています。

いろいろとgoogleで引っかかったwebサイトを見ていたら、統計の知識がきちんと整理されていない僕は頭がパンクしてしまったので、なるべくシンプルにまとめていきます。数学的な裏付けや詳細は参照のURLや他のサイトを参考にして下さい。まず結論から示すと

標準偏差→エラーバーで「標本集団(サンプル)」の「バラツキ」を表現したい時 ・標準誤差・95%信頼区間→エラーバーで「母集団」の「平均値が収まる範囲」を表現したい時

というように使い分けるといいようです。もう少し定義などを簡単に書いておくと

標準偏差:Standard deviation ( SD ) データの「分散」の平方根をとったものなので、データの「バラツキ」を表します。

・標準誤差: Standard Error of Mean ( SE ) SDをサンプル数の平方根で割ったものです。サンプル数が増えると分母が大きくなるため、「誤差」は小さくなり、「精度」が上がります。SEはSDよりも必ず小さくなるので、SEを用いほうがデータのバラつきが少ないように見えカッコよくなると書かれていることが多いですが本質的なことではないです。

まず、ん?と思った人もいると思います。標準誤差と95%信頼区間はまとめちゃっていいわけ?と。95%信頼区間は一般に「標本平均±1.96×標準誤差 」として示される(標本が正規分布しているなどの制約があるようだがここでは割愛)ので、意味するところは違うとしても、本質的には同じものと考えます。

さて生物系の実験結果はほとんどが標準誤差・95%信頼区間を表したエラーバーを用いると考えてよさそうです。よって今回僕が書こうとマウスの体重の変化も標準誤差で良さそうです。

というのは、僕らが実験で直接扱うのは標本平均 ( 実際の計測値 ) です。でも知りたい・比較したいのは標本平均ではなく神様しか知り得ない母平均です。母平均を標本平均を使って推測し、A群とB群で「母平均に差があるのかどうか?」を調べることが実験の意味です。と書くとエラーバーを標準誤差・95%信頼区間で表現した方が良いということがなんとなくわかるでしょうか?

さて論文を読む際にもエラーバーはたくさん出てきますが、その解釈にはかなり注意が必要です。Points of significanceコラム 1:標準偏差(SD)と標準誤差(SEM)を区別するによくまとまっていたので引用させていただきます。

d0194774_1142488

  ここではこの結果を3種類のエラーバー(すなわちSD、SEM、95%CI)を用いて表現したものを下の図5に示す。2つの標本の平均は0と1.0とする。図5aは、3種類のエラーバーでP値は異なるが、同じ長さで表現した場合である。2つの標本のエラーバーがちょうど接するとき、3種類でP値は全く異なることを示している。図5bでは、同じP=0.05になるようなエラーバーとしたところ、3種類の長さは異なり、オーバーラップまたはギャップがあることを示す。図5bで分かるように、「エラーバーどうしが重なり合っていない場合、2つの標本の平均の間には有意な差がある」とか「エラーバーが重なっているので、平均間に有意差はない」という思い込みは、どちらも全く誤りである。

兎にも角にもそのエラーバーが何を意味しているのか?エラーバーの重なりがあっても吟味して判断しなければいけない。ということですね。

最後に、医学書院の今日から使える医療統計学講座【Lesson10】グラフの読み方・使い方は下記の ( 有り難い ) 言葉で締めくくられています。

  *エラーバーはそれが何を示すのか、必ず記載する。 *推定比較には標準誤差より信頼区間のエラーバーを用いる。 *標準偏差はデータの記述に適するが推定比較には適さない。 *ダイナマイトプロット(棒グラフに上側だけエラーバーを付けたもの)は使用しない。歪んだデータの場合,平均値は外れ値の影響を大きく受ける。 *分布を表す箱ひげ図の使用が望ましい。

参照 ・Error bars in experimental biology http://jcb.rupress.org/content/177/1/7.full標準偏差と標準誤差:どちらを使うべきか? http://www.acs.dis.titech.ac.jp/suzuki/sdandse.pdf標準偏差(SD:standard deviation)と標準誤差(SE:standard error of mean)と信頼区間(CI:Confidence interval) http://rockymuku.sakura.ne.jp/kousyuueisei/SDtoSEtoCI.pdf ・Points of significanceコラム 1:標準偏差(SD)と標準誤差(SEM)を区別する http://syodokukai.exblog.jp/20678618 ・今日から使える医療統計学講座【Lesson10】グラフの読み方・使い方 http://www.igaku-shoin.co.jp/paperDetail.do?id=PA02967_03