Note of Pediatric Surgery

腸内細菌、R、ときどき小児外科

菌叢解析結果の比較 ( 1 ) 検定法はどれを選ぶか?

次世代シーケンサーで解析したmeta16Sの結果の統計学的処理をどうすればいいのか?ということについてまとめてみました。

5人から糞便サンプルを集めて、A-Eの5通りでDNAの抽出を行い、meta16Sをかけ抽出法の違いで細菌叢に差が出るか検討しました。話を簡便にするために、先ずはphylum levelでの比較を行うことにしました。統計処理はRを使用しています。

基礎的な統計知識が十分でないこともあり、meta16Sの関連論文を読んでさっぱりわからず思いあぐねていたところ、DNAマイクロアレイの解析を参考にすれば良いのでは?という先輩のアドバイスからブレイクスルーすることができました。確かに菌叢解析も16S遺伝子の頻度をみているわけですから、解析自体はマイクロアレイとmeta16Sの解析は同じことをすれば良いということです。

このページでは、今回の実験はどの検定法を用いれば良いのか?ということを書いていきたいと思います。検定法を選ぶのに必要な項目を挙げると、

・同一検体を複数の群に分けている→対応あり ・処理は1度のみ→繰り返しなし ・5群→多群間 ・要因:処理法、被検者→2要因

となります。この場合、こちらのサイトを参考にすると

7.2要因で分類される多群の検定(繰り返しのない場合) (=2要因によって分類されたデータがセルごとに一つしかない場合) *バートレット検定で分散の均一性を検定した後に 1)各群データが正規分布していて分散が均一(等しい)とみなせる場合 →繰り返しのない二元配置分散分析 →さらに群間に有意差があれば多重比較へ 2)各群のデータが正規分布でない場合、または分散が均一(等しい)と みなせない場合 →フリードマン検定 →さらに群間に有意差があれば多重比較へ 【説明】*繰り返しのない二元配置分散分析では、各要因の変動が、それぞれ誤 差変動より大きいか比較している。 *フリードマン検定では、3群の比較時には各群のデータ数が4以上、 4群の比較時には3以上が必要。 *また、3、4群の比較時にはフリードマン検定表のχ2 値の有意点が 表示される。計算されたχ2 値が有意点より大きいとき「多群間に有 意差あり」と判定される。

という記載があります。ですので、統計処理の流れとしては、以下の様になるかと思います。

  1. バートレット検定で分散が等しいか調べる。
  2. 分散が等しければ繰り返しのない二元配置分散分析 aov()で検定
  3. 分散が等しくなければFriedman検定 friedman.test()で検定
  4. 多重検定の補正を加える

次のページではバートレット検定に関して書いてみようと思います。