Note of Pediatric Surgery

腸内細菌、R、ときどき小児外科

R

興味のある遺伝子を他のどんな種類の細菌が保有しているかBLASTNと{rentrez}を使って調べる

0. はじめに ここでは興味を持った細菌の遺伝子、もしくは遺伝子配列を、どんな種類の他の細菌が持っているのかを知りたい時にやってみたことをまとめておきます。 KEGGとNCBIでシーケンスを取得 BLASTNで検索 Rの{rentrez}で情報を整理 という感じになりま…

{vegan}を使った菌叢解析の階層的クラスター分析とクラスタリング

0. はじめに 菌叢解析をしているとUnifrac distanceなどを計算して、各被験者の菌叢の全体像を被験者間で比較する必要 ( Beta diversity ) があると思います。またその全体像に違いがあった時に同じようなグループをまとめて1つのグループとして扱いたいとき…

mothur開発者によるmothurとQIIMEの比較

0. はじめに mothurもQIIMEも16S rRNAアンプリコンシーケンシング解析 ( 俗に言う菌叢解析 ) をするために使用するアプリケーションのうち、最も有名な2大アプリケーションです。 blog.mothur.org この記事はもともと ( よくわからず ) QIIMEを使っていた僕…

Rで全角英数記号を半角にするのに{stringi}が役に立った話

R

はじめに ( 愚痴 ) 仕事がらあまりデータ解析をしない人からExcelファイルをもらうことが多く、自分が扱いやすいデータにするための処理が実は解析の中で一番大変だったりします。もちろんExcelの生データをExcelを使って処理してしまえばそんなに大変ではな…

{dplyr}のパイプの中でNAを0に置換する

R

Rにおいて欠損値NAを0に変換するのは、Rを覚えたての頃につまづくことのうちの1つじゃないかと思います。いろいろ方法はあると思いますが、{dplyr}を使ってパイプの中で処理をする方法はあまり見つからなかったので、まだまだビギナーの自分にとっては結構大…

ggplot2で開始と終了がある期間データを帯グラフで表現する

R

はじめに 今度の学会で外来患者の長期フォローアップをまとめて発表します。そこでggplot2で開始日付 ( 初診日 ) と終了日付 ( 最終受診日 ) のあるデータの期間を、帯グラフで表現したかったのですが、日本語でのまとまった記事がなかったので書いてみまし…

16S rRNA遺伝子解析の限界と予測メタゲノム解析 - Piphillinの導入

16S rRNA遺伝子解析の限界 16S rRNA遺伝子解析 ( 個人的には16S rRNA gene amplicon sequencingが正しい用語だと思っています )の発達と普及によって腸内細菌叢の研究は飛躍的に進み、今まで知りえなかった腸内細菌という臓器に関する新たな知見をたくさん生…

ELISAの測定結果をRで計算する 2. 4パラメーターロジスティック回帰で吸光度から濃度を求める

0. はじめに それでは、4パラメーターロジスティック曲線を描いて、回帰式からELISAの値を算出していきます。前回記事の続きです。 pediatricsurgery.hatenadiary.jp この記事のコンテンツは 必要なパッケージのインストール ELISAデータをGitHubから入手す…

ELISAの測定結果をRで計算する 1. 4パラメーターロジスティック曲線とは

ELISAの測定結果を求める時に、どうやっても検量線のR2が0.9前後になってしまって、なかなかいい値が出なくて困っていた時がありました。そもそもELISAの検量線はどう回帰させれば良いのか、実験を始めた当初はよくわかっていなかったので、同じ様な疑問を持…

メタボローム解析: パッケージroplsのtutorialをやってみた

1. はじめに OPLS-DAを行う際の強力なツールとして、パッケージroplsの使い方をまとめていきます。OPLD-DAだけでなく、PCA、PLS(-DA),OPLSも行うことができ、R2とQ2によるquality metrics、permutation diagnosis、VIP valuesの計算、外れ値を計測するため…

欠損値の種類と補完とRでのワークフロー

1. はじめに 実験データを扱う時に欠損値が出てしまうことはよくあると思います。欠損値を除いて解析をしたりすることも多いと思いますが、どうしても欠損値を含むデータを使用しなければいけないこともあると思います。欠損値を補完する方法はいろいろと開…

多重検定

0. はじめに 今回の記事では多重検定について調べてまとめたことを中心に書いていきます。多重検定については下記の2つのサイトが大変わかりやすく、参考にさせていただきました。 Bonferroni法、Holm法、False Discovery Rate | 大阪大学腎臓内科 DNAマイク…

LEfSeを実際にやってみる

実際にやってみる biobakery / biobakery / wiki / lefse — Bitbucket サンプルファイルをsample input fileからダウンロードします。なぜか名前が129になっているので注意して下さい。このファイルの概要を書いておくと。

LEfSeをインストールする

はじめに LEfSeとは簡単に言うと多重検定を考慮した解析を行ってくれるツールです。bioBakeryから使うこともできますし、webアプリケーションのGalaxyから使うこともできますが、最近、コチラは不安定なことが多いような気がします。 本当は僕もwebアプリケ…

腸内細菌の論文が読める様になりたい臨床医へ ( 2 ) レアファクション解析

はじめに 腸内細菌の論文を読み、多様性の話が出てくる時に避けて通れないのがレアファクション解析 ( Rarefaction解析 )。図表にしれっとグラフが登場するのに、material and methodsをきちんと読まないとあまり詳しく書かれていないレアファクション解析。…

JMPファイルを何とかRに取り込もうとする…も撃沈する

0. はじめに 少し前から大学病院でJMP ( ジャンプ ) という統計ソフトの包括ライセンス契約を結んでいるらしく、JMPを使って解析をしたという話をよく聞くようになった。どうやら初学者にも使いやすくて好評らしい。聞いたことなかったので、なんだその怪し…

コホート内ケースコントロール研究: 2. コントロール群の抽出法

0. はじめに さて、この記事ではRとパッケージ"Epi"を用いて、コホート内ケースコントロール研究の被験者を実際に抽出していきたいと思います。データ・セットはRパッケージ{Epi}の中の"diet"を使用していきます。 コホート内ケースコントロール研究について…

コホート内ケースコントロール研究: 1. コホート内ケースコントロール研究とは?

0. はじめに 現在、私が関わっているプロジェクトでコホート内ケースコントロール研究を行うことになりました。というのも、腸内細菌叢や糞便中代謝物を測定するのには非常にお金がかかるので、集めた全検体を調べると大変なことになります。ですので、前向…

わからない単語を英辞郎で検索するショートカットキーを作成する

はじめに 論文を読んでいてわからない単語が出てくると、みなさんどうしてますか?僕はMacのスクリーンで読むことがほとんどなので、三本指でタップすれば辞書.appが自動的に立ち上がってくれますが、専門用語だと載っていないことも多いです。 僕はアルクの…

多変量解析を導入するにあたって

学会とかで「多変量解析すると〜」などと言うとなんかもの凄い発表の様に聞こえますよね…臨床をやっているときはあまり大きなデータで発表したことなかったのですが ( 小児外科の宿命として多変量解析に耐えられるだけの症例数が集まらないことが多い ) 、臨…