Note of Pediatric Surgery

腸内細菌、R、ときどき小児外科

予測メタゲノム HUMAnN編 ( 3 ) HUMAnNを動かす

さて、準備が整ったのでHUMAnNを動かしてみましょう。結論から言うと、何度もエラーが起きて、なかなか解決できず骨が折れました。どうやらmacでのみいろいろとエラーが起きてしまう仕様の様です。最初に肝を書いておくと、

・読み込むテキストファイルは.txtは使わず、.tsvか.csvを使う ・.tsvファイルの1行目に余計な物を書かない ・1行目は#OTU…で始まる形にする ・glpk-4.6を以前のバージョンに置き換える ・エラーが起きてやり直す場合はOutputフォルダに入ったファイルを全て削除しておく

というのが大事です。この全てのステップを踏んだところで無事に解析が終わりました。 scons: *** [output/04b-hit-keg-mpt-cop-nul-nve-nve-graphlan_tree.txt] Error 1 scons: building terminated because of errors. こんな感じのエラーメッセージが最後に出てこなくなったら完了です!

エラーメッセージの解決にはHUMAnNのGoogle groupsのフォーラムを参考にしました。みんな同じ所でつまずいててちょっと安心です。 https://groups.google.com/forum/#!topic/humann-users/PBBwfyF4uGU https://groups.google.com/forum/#!topic/humann-users/D6nnsXKdbx8

( 1 ) .biomから.tsvを作成する

[splus]

.BiomファイルをTSV formatに変換する

.https://picrust.github.io/picrust/tutorials/humann_tutorial.htmlの記述と違うので注意

biom convert -i metagenome_predictions.biom -o metagenome_predictions.tsv --to-tsv

.できたmetagenome_predictions.tsvをhuman-0.99/input/に入れておく

mv metagenome_predictions.tsv /Applications/Bioinformatics/humann-0.99/input [/splus]

ここで、metagenome_predictions.tsvをテキストエディタで開いて下さい。1行目に # Constructed from biom file という記述があればこれを削除しておいて下さい。

( 2 ) glpkのバージョンを書き換える まず http://ftp.gnu.org/gnu/glpk/glpk-4.43.tar.gz からglpk-4.43.tar.gzをダウンロードしてダブルクリックして解凍し、適当なフォルダに移動させます。

[splus]

.glpkのあるディレクトリに移動

cd /Applications/Bioinformatics/glpk-4.43

.glpk-4.43をインストール

../configure : カレントディレクトリにあるconfigureスクリプトを実行する

.--prefix= : インストール先のトップディレクトリを指定

./configure --prefix=/usr/local sudo make install

..bash_profileに下記の様に追記してPATHを通しておく

export PATH="/Applications/Bioinformatics/glpk-4.43:$PATH"

./humann-0.99/data/MinPath/にあるgplk-4.6を削除

.インストールしたgplk-4.43のディレクトリを/humann-0.99/data/MinPath/にペースト

.glpk-4.43の名前をglpk-4.6に変える

.再度この場所でインストールする

cd /Applications/Bioinformatics/humann-0.99/data/MinPath/glpk-4.6 sudo make install

..bash_profileに下記の様に追記してPATHを通しておく

export PATH="/Applications/Bioinformatics/humann-0.99/data/MinPath/glpk-4.6:$PATH" source /Users/Ryohei/.bash_profile [/splus]

たぶんかなり回りくどいことをしていて、最初のglpk-4.43のインストールは要らないかもしれないのですが、一応、こうやってやって上手くいったのでそのまま書いておきます。修正点などがあれば教えていただけると幸いです。

( 3 ) sconsからHUMAnNを動かす

[splus]

.HUMAnNのディレクトリに移る

cd /Applications/Bioinformatics/humann-0.99 scons [/splus]

するとターミナルにたくさん文字列が出てきます。ファイルの重さにもよりますが、数十分くらいかかるのだと思います。それでは解析に移っていきます。