Note of Pediatric Surgery

腸内細菌、R、ときどき小児外科

R

LIPID MAPSによる脂質の分類の階層テーブルを作成する

はじめに 脂溶性代謝物の解析をしており、いろいろと調べています。脂質の分類には古典的にはBloorの分類というものがあるようですが、この分類には当てはまらない物質も数多く存在するため、あまり厳密ではないようです。 ja.wikipedia.org どうやら、最近…

Rの計算終了時に{mailR}を使って通知を飛ばして生産性を上げる

R

はじめに 時間がかかるスクリプトを走らせてる間、僕はついTwitterを見てしまうのですが、いつも処理が終わったのに気づかず、ダラダラとTwitterを見続けてしまっていました。計算が終わった時点で通知がくればいいなと思って、方法をいろいろ調べてみたので…

{omu}を使用した代謝物データとKEGGの解析

{omu}とは install.packages("omu") library(omu) omuはメタボロミクスデータセットの迅速な解析と直感的なグラフ作成を可能にするRパッケージです。統計解析はもちろんできますが、データセット内の代謝物に代謝物クラス (炭水化物、脂質など) を割り当て、…

学会発表で悩めるMacユーザーに贈る、Windows PCで確実にプレゼンする方法

R

はじめに Macユーザーの皆さんは学会でのプレゼンテーションはどうしていますでしょうか? 1つの解決策としてはWindowsとの共用フォントを使えばいいのだと思いますが、Windowsで最適とされるフォントの組み合わせがMacでうまいこと使えなかったり、そもそも…

Rで細菌に有効な抗菌薬を探せるようにSanfordの表からデータを整形する

0. はじめに 今している仕事で、どの細菌にどの種類の抗菌薬が一般的に推奨されないのか?といったことを客観的に示す必要がありました。SanfordからはTableという形ではデータは手に入るのですが、もちろんそのままでは使えず、これをデータ処理に使えるよ…

Rパッケージのtabulizerをインストールするのにえらく苦労した話

R

0. はじめに とあるテーブルデータを依頼したらPDFファイルで届いたということはよくあることだと思います。PDFをtableファイルに変換する方法はいろいろあると思いますが、手軽なのはアップロードしてくれると.xslxや.csvに変換してくれる、PDFTableでしょ…

2-1. 緑本とggplot2: カウントデータとポワソン分布

0. はじめに 統計モデリングを勉強したくて、Twitterのフォロワーさん方絶賛の久保先生の通称 " みどりぼん " を読んでみました。もちろんそのままでもわかりやすいのですが、データから自分でグラフを作っていくと、より理解が深まると思いました。せっかく…

興味のある遺伝子を他のどんな種類の細菌が保有しているかBLASTNと{rentrez}を使って調べる

0. はじめに ここでは興味を持った細菌の遺伝子、もしくは遺伝子配列を、どんな種類の他の細菌が持っているのかを知りたい時にやってみたことをまとめておきます。 KEGGとNCBIでシーケンスを取得 BLASTNで検索 Rの{rentrez}で情報を整理 という感じになりま…

{vegan}を使った菌叢解析の階層的クラスター分析とクラスタリング

0. はじめに 菌叢解析をしているとUnifrac distanceなどを計算して、各被験者の菌叢の全体像を被験者間で比較する必要 ( Beta diversity ) があると思います。またその全体像に違いがあった時に同じようなグループをまとめて1つのグループとして扱いたいとき…

mothur開発者によるmothurとQIIMEの比較

0. はじめに mothurもQIIMEも16S rRNAアンプリコンシーケンシング解析 ( 俗に言う菌叢解析 ) をするために使用するアプリケーションのうち、最も有名な2大アプリケーションです。 blog.mothur.org この記事はもともと ( よくわからず ) QIIMEを使っていた僕…

Rで全角英数記号を半角にするのに{stringi}が役に立った話

R

はじめに ( 愚痴 ) 仕事がらあまりデータ解析をしない人からExcelファイルをもらうことが多く、自分が扱いやすいデータにするための処理が実は解析の中で一番大変だったりします。もちろんExcelの生データをExcelを使って処理してしまえばそんなに大変ではな…

{dplyr}のパイプの中でNAを0に置換する

R

Rにおいて欠損値NAを0に変換するのは、Rを覚えたての頃につまづくことのうちの1つじゃないかと思います。いろいろ方法はあると思いますが、{dplyr}を使ってパイプの中で処理をする方法はあまり見つからなかったので、まだまだビギナーの自分にとっては結構大…

ggplot2で開始と終了がある期間データを帯グラフで表現する

R

はじめに 今度の学会で外来患者の長期フォローアップをまとめて発表します。そこでggplot2で開始日付 ( 初診日 ) と終了日付 ( 最終受診日 ) のあるデータの期間を、帯グラフで表現したかったのですが、日本語でのまとまった記事がなかったので書いてみまし…

16S rRNA遺伝子解析の限界と予測メタゲノム解析 - Piphillinの導入

16S rRNA遺伝子解析の限界 16S rRNA遺伝子解析 ( 個人的には16S rRNA gene amplicon sequencingが正しい用語だと思っています )の発達と普及によって腸内細菌叢の研究は飛躍的に進み、今まで知りえなかった腸内細菌という臓器に関する新たな知見をたくさん生…

ELISAの測定結果をRで計算する 2. 4パラメーターロジスティック回帰で吸光度から濃度を求める

0. はじめに それでは、4パラメーターロジスティック曲線を描いて、回帰式からELISAの値を算出していきます。前回記事の続きです。 pediatricsurgery.hatenadiary.jp この記事のコンテンツは 必要なパッケージのインストール ELISAデータをGitHubから入手す…

ELISAの測定結果をRで計算する 1. 4パラメーターロジスティック曲線とは

ELISAの測定結果を求める時に、どうやっても検量線のR2が0.9前後になってしまって、なかなかいい値が出なくて困っていた時がありました。そもそもELISAの検量線はどう回帰させれば良いのか、実験を始めた当初はよくわかっていなかったので、同じ様な疑問を持…

メタボローム解析: パッケージroplsのtutorialをやってみた

1. はじめに OPLS-DAを行う際の強力なツールとして、パッケージroplsの使い方をまとめていきます。OPLD-DAだけでなく、PCA、PLS(-DA),OPLSも行うことができ、R2とQ2によるquality metrics、permutation diagnosis、VIP valuesの計算、外れ値を計測するため…

欠損値の種類と補完とRでのワークフロー

1. はじめに 実験データを扱う時に欠損値が出てしまうことはよくあると思います。欠損値を除いて解析をしたりすることも多いと思いますが、どうしても欠損値を含むデータを使用しなければいけないこともあると思います。欠損値を補完する方法はいろいろと開…

多重検定

0. はじめに 今回の記事では多重検定について調べてまとめたことを中心に書いていきます。多重検定については下記の2つのサイトが大変わかりやすく、参考にさせていただきました。 Bonferroni法、Holm法、False Discovery Rate | 大阪大学腎臓内科 DNAマイク…

LEfSeを実際にやってみる

実際にやってみる biobakery / biobakery / wiki / lefse — Bitbucket サンプルファイルをsample input fileからダウンロードします。なぜか名前が129になっているので注意して下さい。このファイルの概要を書いておくと。

LEfSeをインストールする

はじめに LEfSeとは簡単に言うと多重検定を考慮した解析を行ってくれるツールです。bioBakeryから使うこともできますし、webアプリケーションのGalaxyから使うこともできますが、最近、コチラは不安定なことが多いような気がします。 本当は僕もwebアプリケ…

JMPファイルを何とかRに取り込もうとする…も撃沈する

0. はじめに 少し前から大学病院でJMP ( ジャンプ ) という統計ソフトの包括ライセンス契約を結んでいるらしく、JMPを使って解析をしたという話をよく聞くようになった。どうやら初学者にも使いやすくて好評らしい。聞いたことなかったので、なんだその怪し…

コホート内ケースコントロール研究: 2. コントロール群の抽出法

0. はじめに さて、この記事ではRとパッケージ"Epi"を用いて、コホート内ケースコントロール研究の被験者を実際に抽出していきたいと思います。データ・セットはRパッケージ{Epi}の中の"diet"を使用していきます。 コホート内ケースコントロール研究について…

コホート内ケースコントロール研究: 1. コホート内ケースコントロール研究とは?

0. はじめに 現在、私が関わっているプロジェクトでコホート内ケースコントロール研究を行うことになりました。というのも、腸内細菌叢や糞便中代謝物を測定するのには非常にお金がかかるので、集めた全検体を調べると大変なことになります。ですので、前向…

わからない単語を英辞郎で検索するショートカットキーを作成する

はじめに 論文を読んでいてわからない単語が出てくると、みなさんどうしてますか?僕はMacのスクリーンで読むことがほとんどなので、三本指でタップすれば辞書.appが自動的に立ち上がってくれますが、専門用語だと載っていないことも多いです。 僕はアルクの…

多変量解析を導入するにあたって

学会とかで「多変量解析すると〜」などと言うとなんかもの凄い発表の様に聞こえますよね…臨床をやっているときはあまり大きなデータで発表したことなかったのですが ( 小児外科の宿命として多変量解析に耐えられるだけの症例数が集まらないことが多い ) 、臨…