R
はじめに 脂溶性代謝物の解析をしており、いろいろと調べています。脂質の分類には古典的にはBloorの分類というものがあるようですが、この分類には当てはまらない物質も数多く存在するため、あまり厳密ではないようです。 ja.wikipedia.org どうやら、最近…
はじめに 時間がかかるスクリプトを走らせてる間、僕はついTwitterを見てしまうのですが、いつも処理が終わったのに気づかず、ダラダラとTwitterを見続けてしまっていました。計算が終わった時点で通知がくればいいなと思って、方法をいろいろ調べてみたので…
{omu}とは install.packages("omu") library(omu) omuはメタボロミクスデータセットの迅速な解析と直感的なグラフ作成を可能にするRパッケージです。統計解析はもちろんできますが、データセット内の代謝物に代謝物クラス (炭水化物、脂質など) を割り当て、…
はじめに Macユーザーの皆さんは学会でのプレゼンテーションはどうしていますでしょうか? 1つの解決策としてはWindowsとの共用フォントを使えばいいのだと思いますが、Windowsで最適とされるフォントの組み合わせがMacでうまいこと使えなかったり、そもそも…
0. はじめに 今している仕事で、どの細菌にどの種類の抗菌薬が一般的に推奨されないのか?といったことを客観的に示す必要がありました。SanfordからはTableという形ではデータは手に入るのですが、もちろんそのままでは使えず、これをデータ処理に使えるよ…
0. はじめに とあるテーブルデータを依頼したらPDFファイルで届いたということはよくあることだと思います。PDFをtableファイルに変換する方法はいろいろあると思いますが、手軽なのはアップロードしてくれると.xslxや.csvに変換してくれる、PDFTableでしょ…
0. はじめに 統計モデリングを勉強したくて、Twitterのフォロワーさん方絶賛の久保先生の通称 " みどりぼん " を読んでみました。もちろんそのままでもわかりやすいのですが、データから自分でグラフを作っていくと、より理解が深まると思いました。せっかく…
0. はじめに ここでは興味を持った細菌の遺伝子、もしくは遺伝子配列を、どんな種類の他の細菌が持っているのかを知りたい時にやってみたことをまとめておきます。 KEGGとNCBIでシーケンスを取得 BLASTNで検索 Rの{rentrez}で情報を整理 という感じになりま…
0. はじめに 菌叢解析をしているとUnifrac distanceなどを計算して、各被験者の菌叢の全体像を被験者間で比較する必要 ( Beta diversity ) があると思います。またその全体像に違いがあった時に同じようなグループをまとめて1つのグループとして扱いたいとき…
0. はじめに mothurもQIIMEも16S rRNAアンプリコンシーケンシング解析 ( 俗に言う菌叢解析 ) をするために使用するアプリケーションのうち、最も有名な2大アプリケーションです。 blog.mothur.org この記事はもともと ( よくわからず ) QIIMEを使っていた僕…
はじめに ( 愚痴 ) 仕事がらあまりデータ解析をしない人からExcelファイルをもらうことが多く、自分が扱いやすいデータにするための処理が実は解析の中で一番大変だったりします。もちろんExcelの生データをExcelを使って処理してしまえばそんなに大変ではな…
Rにおいて欠損値NAを0に変換するのは、Rを覚えたての頃につまづくことのうちの1つじゃないかと思います。いろいろ方法はあると思いますが、{dplyr}を使ってパイプの中で処理をする方法はあまり見つからなかったので、まだまだビギナーの自分にとっては結構大…
はじめに 今度の学会で外来患者の長期フォローアップをまとめて発表します。そこでggplot2で開始日付 ( 初診日 ) と終了日付 ( 最終受診日 ) のあるデータの期間を、帯グラフで表現したかったのですが、日本語でのまとまった記事がなかったので書いてみまし…
16S rRNA遺伝子解析の限界 16S rRNA遺伝子解析 ( 個人的には16S rRNA gene amplicon sequencingが正しい用語だと思っています )の発達と普及によって腸内細菌叢の研究は飛躍的に進み、今まで知りえなかった腸内細菌という臓器に関する新たな知見をたくさん生…
0. はじめに それでは、4パラメーターロジスティック曲線を描いて、回帰式からELISAの値を算出していきます。前回記事の続きです。 pediatricsurgery.hatenadiary.jp この記事のコンテンツは 必要なパッケージのインストール ELISAデータをGitHubから入手す…
ELISAの測定結果を求める時に、どうやっても検量線のR2が0.9前後になってしまって、なかなかいい値が出なくて困っていた時がありました。そもそもELISAの検量線はどう回帰させれば良いのか、実験を始めた当初はよくわかっていなかったので、同じ様な疑問を持…
1. はじめに OPLS-DAを行う際の強力なツールとして、パッケージroplsの使い方をまとめていきます。OPLD-DAだけでなく、PCA、PLS(-DA),OPLSも行うことができ、R2とQ2によるquality metrics、permutation diagnosis、VIP valuesの計算、外れ値を計測するため…
1. はじめに 実験データを扱う時に欠損値が出てしまうことはよくあると思います。欠損値を除いて解析をしたりすることも多いと思いますが、どうしても欠損値を含むデータを使用しなければいけないこともあると思います。欠損値を補完する方法はいろいろと開…
0. はじめに 今回の記事では多重検定について調べてまとめたことを中心に書いていきます。多重検定については下記の2つのサイトが大変わかりやすく、参考にさせていただきました。 Bonferroni法、Holm法、False Discovery Rate | 大阪大学腎臓内科 DNAマイク…
実際にやってみる biobakery / biobakery / wiki / lefse — Bitbucket サンプルファイルをsample input fileからダウンロードします。なぜか名前が129になっているので注意して下さい。このファイルの概要を書いておくと。
はじめに LEfSeとは簡単に言うと多重検定を考慮した解析を行ってくれるツールです。bioBakeryから使うこともできますし、webアプリケーションのGalaxyから使うこともできますが、最近、コチラは不安定なことが多いような気がします。 本当は僕もwebアプリケ…
0. はじめに 少し前から大学病院でJMP ( ジャンプ ) という統計ソフトの包括ライセンス契約を結んでいるらしく、JMPを使って解析をしたという話をよく聞くようになった。どうやら初学者にも使いやすくて好評らしい。聞いたことなかったので、なんだその怪し…
0. はじめに さて、この記事ではRとパッケージ"Epi"を用いて、コホート内ケースコントロール研究の被験者を実際に抽出していきたいと思います。データ・セットはRパッケージ{Epi}の中の"diet"を使用していきます。 コホート内ケースコントロール研究について…
0. はじめに 現在、私が関わっているプロジェクトでコホート内ケースコントロール研究を行うことになりました。というのも、腸内細菌叢や糞便中代謝物を測定するのには非常にお金がかかるので、集めた全検体を調べると大変なことになります。ですので、前向…
はじめに 論文を読んでいてわからない単語が出てくると、みなさんどうしてますか?僕はMacのスクリーンで読むことがほとんどなので、三本指でタップすれば辞書.appが自動的に立ち上がってくれますが、専門用語だと載っていないことも多いです。 僕はアルクの…
学会とかで「多変量解析すると〜」などと言うとなんかもの凄い発表の様に聞こえますよね…臨床をやっているときはあまり大きなデータで発表したことなかったのですが ( 小児外科の宿命として多変量解析に耐えられるだけの症例数が集まらないことが多い ) 、臨…