Note of Pediatric Surgery

腸内細菌、R、ときどき小児外科

予測メタゲノム HUMAnN編 ( 1 ) はじめに

HUMAnNとは、The HMP Unified Metabolic Analysis Networkの略で、メタゲノムデータを使って腸内細菌叢がどの代謝経路を有していて、またその遺伝子をどれくらい持っているのか?ということを明らかにするためのパイプラインです。16S rRNAを用いた菌叢解析では、その名の通りどんな菌の違いがあるのか?というところまでしかわかりませんので、腸内細菌の機能にまで踏み込んでいけます。

通常はメタゲノムデータ、つまり糞便中の全細菌の全DNAの配列を全て読んだ膨大なシーケンスデータを使って解析をしますが、PICRUStを用いれば、16S rRNA解析の結果をゲノムデータベースにマッチングさせて遺伝子を予測することができます。

このエントリではHUMAnNを行うための準備を行います。結構、大変でした。

https://bitbucket.org/biobakery/humann/srchttp://huttenhower.sph.harvard.edu/humann をみると、HUMAnNを走らせるのに必要なことが書いてあります。

・ネットワークへの接続 HUMAnNは解析の間、データやソフトウェアをダウンロードしながら行うようですので、ネットワークへの接続は必須と。 curl 解析の間のファイルのやり取りに必要なアプリ。HTTP(およびその他のプロトコル)リクエストをWebブラウザを使用せずに作成するための軽量なコマンドラインツール とのこと。MacOS Xにはデフォルトでインストールされている。 ・RAMの空き:割と重いです。 ・scons オープンソースのソフトウェアビルドツール。SConsは古典的な make ユーティリティの代替であり、さらにautotoolsの機能とccacheのようなコンパイラキャッシュ機能を統合している。 ( https://ja.wikipedia.org/wiki/SCons ) Pythonで記述された高機能なmakeという風に考えておけば良さそう。 Python:2.7以上 ・blastx 相同性を検索するプログラムBLAST。 ( https://sites.google.com/site/noteofpaediatricsurgery/in-silico/blast ) その中で、入力された核酸配列を6通りのアミノ酸配列に翻訳し、そのアミノ酸配列と相同性を持つものをデータベースから検索する ( http://bi.biopapyrus.net/seq/blast/ ) のが、blastx。

次のエントリでsconsとblastxのインストール方法を書きます。