Note of Pediatric Surgery

腸内細菌、R、ときどき小児外科

R

mothur開発者によるmothurとQIIMEの比較

0. はじめに mothurもQIIMEも16S rRNAアンプリコンシーケンシング解析 ( 俗に言う菌叢解析 ) をするために使用するアプリケーションのうち、最も有名な2大アプリケーションです。 blog.mothur.org この記事はもともと ( よくわからず ) QIIMEを使っていた僕…

Rで全角英数記号を半角にするのに{stringi}が役に立った話

R

はじめに ( 愚痴 ) 仕事がらあまりデータ解析をしない人からExcelファイルをもらうことが多く、自分が扱いやすいデータにするための処理が実は解析の中で一番大変だったりします。もちろんExcelの生データをExcelを使って処理してしまえばそんなに大変ではな…

{dplyr}のパイプの中でNAを0に置換する

R

Rにおいて欠損値NAを0に変換するのは、Rを覚えたての頃につまづくことのうちの1つじゃないかと思います。いろいろ方法はあると思いますが、{dplyr}を使ってパイプの中で処理をする方法はあまり見つからなかったので、まだまだビギナーの自分にとっては結構大…

ggplot2で開始と終了がある期間データを帯グラフで表現する

R

はじめに 今度の学会で外来患者の長期フォローアップをまとめて発表します。そこでggplot2で開始日付 ( 初診日 ) と終了日付 ( 最終受診日 ) のあるデータの期間を、帯グラフで表現したかったのですが、日本語でのまとまった記事がなかったので書いてみまし…

16S rRNA遺伝子解析の限界と予測メタゲノム解析 - Piphillinの導入

16S rRNA遺伝子解析の限界 16S rRNA遺伝子解析 ( 個人的には16S rRNA gene amplicon sequencingが正しい用語だと思っています )の発達と普及によって腸内細菌叢の研究は飛躍的に進み、今まで知りえなかった腸内細菌という臓器に関する新たな知見をたくさん生…

ELISAの測定結果をRで計算する 2. 4パラメーターロジスティック回帰で吸光度から濃度を求める

0. はじめに それでは、4パラメーターロジスティック曲線を描いて、回帰式からELISAの値を算出していきます。前回記事の続きです。 pediatricsurgery.hatenadiary.jp この記事のコンテンツは 必要なパッケージのインストール ELISAデータをGitHubから入手す…

ELISAの測定結果をRで計算する 1. 4パラメーターロジスティック曲線とは

ELISAの測定結果を求める時に、どうやっても検量線のR2が0.9前後になってしまって、なかなかいい値が出なくて困っていた時がありました。そもそもELISAの検量線はどう回帰させれば良いのか、実験を始めた当初はよくわかっていなかったので、同じ様な疑問を持…

メタボローム解析: パッケージroplsのtutorialをやってみた

1. はじめに OPLS-DAを行う際の強力なツールとして、パッケージroplsの使い方をまとめていきます。OPLD-DAだけでなく、PCA、PLS(-DA),OPLSも行うことができ、R2とQ2によるquality metrics、permutation diagnosis、VIP valuesの計算、外れ値を計測するため…

欠損値の種類と補完とRでのワークフロー

1. はじめに 実験データを扱う時に欠損値が出てしまうことはよくあると思います。欠損値を除いて解析をしたりすることも多いと思いますが、どうしても欠損値を含むデータを使用しなければいけないこともあると思います。欠損値を補完する方法はいろいろと開…

多重検定

0. はじめに 今回の記事では多重検定について調べてまとめたことを中心に書いていきます。多重検定については下記の2つのサイトが大変わかりやすく、参考にさせていただきました。 Bonferroni法、Holm法、False Discovery Rate | 大阪大学腎臓内科 DNAマイク…

LEfSeを実際にやってみる

実際にやってみる biobakery / biobakery / wiki / lefse — Bitbucket サンプルファイルをsample input fileからダウンロードします。なぜか名前が129になっているので注意して下さい。このファイルの概要を書いておくと。

LEfSeをインストールする

はじめに LEfSeとは簡単に言うと多重検定を考慮した解析を行ってくれるツールです。bioBakeryから使うこともできますし、webアプリケーションのGalaxyから使うこともできますが、最近、コチラは不安定なことが多いような気がします。 本当は僕もwebアプリケ…

腸内細菌の論文が読める様になりたい臨床医へ ( 2 ) レアファクション解析

はじめに 腸内細菌の論文を読み、多様性の話が出てくる時に避けて通れないのがレアファクション解析 ( Rarefaction解析 )。図表にしれっとグラフが登場するのに、material and methodsをきちんと読まないとあまり詳しく書かれていないレアファクション解析。…

JMPファイルを何とかRに取り込もうとする…も撃沈する

0. はじめに 少し前から大学病院でJMP ( ジャンプ ) という統計ソフトの包括ライセンス契約を結んでいるらしく、JMPを使って解析をしたという話をよく聞くようになった。どうやら初学者にも使いやすくて好評らしい。聞いたことなかったので、なんだその怪し…

コホート内ケースコントロール研究: 2. コントロール群の抽出法

0. はじめに さて、この記事ではRとパッケージ"Epi"を用いて、コホート内ケースコントロール研究の被験者を実際に抽出していきたいと思います。データ・セットはRパッケージ{Epi}の中の"diet"を使用していきます。 コホート内ケースコントロール研究について…

コホート内ケースコントロール研究: 1. コホート内ケースコントロール研究とは?

0. はじめに 現在、私が関わっているプロジェクトでコホート内ケースコントロール研究を行うことになりました。というのも、腸内細菌叢や糞便中代謝物を測定するのには非常にお金がかかるので、集めた全検体を調べると大変なことになります。ですので、前向…

わからない単語を英辞郎で検索するショートカットキーを作成する

はじめに 論文を読んでいてわからない単語が出てくると、みなさんどうしてますか?僕はMacのスクリーンで読むことがほとんどなので、三本指でタップすれば辞書.appが自動的に立ち上がってくれますが、専門用語だと載っていないことも多いです。 僕はアルクの…

多変量解析を導入するにあたって

学会とかで「多変量解析すると〜」などと言うとなんかもの凄い発表の様に聞こえますよね…臨床をやっているときはあまり大きなデータで発表したことなかったのですが ( 小児外科の宿命として多変量解析に耐えられるだけの症例数が集まらないことが多い ) 、臨…

菌叢解析結果の比較 ( 7 ) BH法をRで行う

R !

FDR制御のBH法をRで実際に行っていきます。Benjamini and Hochberg(1995)が提唱した方法で、下記の図が非常にわかりやすかったです。露崎先生のスライドから引用させいただきました。 簡単に説明すると、各群の間でphylum毎に菌叢変動認められるか検定し、得…

菌叢解析結果の比較 ( 6 ) FDR制御

R !

こちらの記事ははてなブログに引越しました。現在、他の記事も順次ブログを移行中です。ご迷惑をおかけしますが、今後も引き続きよろしくお願い致します。下記リンク先からアクセスをお願い致します。 多重検定

菌叢解析結果の比較 ( 5 ) 検定を一括で行い結果をcsvファイルにまとめる

R !

というわけで、以前の記事をまとめるて、if構文で繋げると以下の様になります。 [splus] BTable=NULL ATable=NULL FTable=NULL for ( i in 3:ncol(X)) { BP=bartlett.test(X[,i],X$Test)$p.value if(BP<0.01){ SD<-"" }else if(BP<0.05){ SD<-"*" }else{ SD<…

菌叢解析結果の比較 ( 4 ) フリードマン検定

この記事ではバートレット検定でp<0.05で分散が等しくないと判定したBacteria.__Candidate_division_TM7について行います。検定はフリードマン検定で行い、friedman.test関数を使用します。データセットは以前の記事のものを使用します。 friedman.test(変数…

菌叢解析結果の比較 ( 3 ) 二元配置分散分析

R !

前回の記事で、バートレット検定でphylumごとのrelative abundanceの分散が等しいかどうかを判定しました。p>0.05で分散が等しいと判定したphylumであるBacteria;__Actinobacteriaについて行います。データは引き続き前回のものを使います。Rで二元配置分散…

菌叢解析結果の比較 ( 2 ) バートレット検定

R !

今回はphylumごとのrelative abundanceの分散が各群で等しいのかどうかを判定します。前回の記事でバートレット検定をすれば良いということはわかりました。バートレット検定はこのサイトによると バートレット検定は、多群のデータの等分散性または分散の一…

菌叢解析結果の比較 ( 1 ) 検定法はどれを選ぶか?

R !

次世代シーケンサーで解析したmeta16Sの結果の統計学的処理をどうすればいいのか?ということについてまとめてみました。 5人から糞便サンプルを集めて、A-Eの5通りでDNAの抽出を行い、meta16Sをかけ抽出法の違いで細菌叢に差が出るか検討しました。話を簡便…