BioInformatics

GEOの発現データを使いこなす(2)

Seriesの方を使う例も挙げておく。 Seriesを使いこなす。 論文を書いたときに、マイクロアレイの発現データを寄託しておくよう求められるが、その寄託先の一つがGEOであり、その実験ごとのまとめがSeriesである。 Webブラウザでの作業 GEOの画面でSeriesをク…

GEOの発現データを使いこなす

GEOのデータを使って、特定の条件での特定遺伝子の発現量を求める方法を何人かに聞かれたので、需要があるのかな?と思って、描いておく。 DataSetsを使いこなす DataSetsとは、NCBIによってcurationされたGEOデータのことだそうだ。http://www.ncbi.nlm.nih…

MiRaGEを使ってみる

microRNAにも昨今は手を伸ばし始めたというか、分かんないながらに手探りで進み始めたんだけれど、mRNAの発現データを元に発現亢進しているmicroRNAを予測するMiRaGEというWeb Appがあると聞いたので、試してみることにした。 MiRaGEでググる とりあえず「Mi…

methylation解析をBioConductor上でやりたいのだけれど

とりあえず、wateRmelonとかIMAとかと格闘中。 「デザインがなされていない実験結果だけを渡されても解析なんてできない」とはよく言われることではあるけれど、それ以前の問題で、Illumina 450Kのプローブが2種類あってちゃんと正規化しないといけないこと…

miRNA解析をBioConductor上でやりたいのだけれど

miRNAのマイクロアレイの解析を頼まれて、非常に困った。 library(affy) exp <- exprs(eset <- rma(Data <- ReadAffy())) cl <- c(rep(0,10),rep(1,10)) library(siggenes) summary(sig <- sam(eset, cl, B=1000)) みたいなド定番で何の工夫もないやり方にし…

BioConductor needs fortran library...

先日のBioConductorでlibgfortran周りでエラーが出る件だけれど、http://cran.ism.ac.jp/bin/macosx/tools/ にあるgfortranの.pkgをインストールすればOKだった。 こういうのって分かるように書いといてくれよーって思うけれど、ホントはどこかにちゃんと分…

R-3.0.0 release but ...

R-3.0.0がリリースされてた。新しもの好きなので、早速インストールして、BioConductorもインストールしなおす。 試しに、ちょっとGEOのデータを使ってみるか、、、と、思ったら、さっそくハマった。 preprocessCoreといういつもお世話になっているlibraryが…

GAE/py始めました

やっぱり、社内・学内いろいろな環境のヒトから簡単に使ってもらえるツールといったら、WebAppしかないなと思ったので、とりあえずGAEの勉強を始めてみた。 Pythonの文法はperlに慣れた身にはどうにも馴染みにくいのだけれど、とりあえず、スタートガイドに…

複数のSeriesMatrixファイルをGeoQueryで読む方法が分からない

弊社の社内からftp-proxyを経由してBioConductorのGEOQueryでデータをダウンロードする方法が分からない。そういうワケで、GEOの画面からhttp経由でSeriesMatrixファイルをダウンロードして、そのファイルをgetGEO(file="...")のようにすることが、多々ある…

GGRNAを試す

ある短いオリゴの配列が1000本くらいあって、ソレがどの遺伝子に由来する配列なのかを調べる必要ができた。なんで由来が分からないんだよ!ってのは、まあ事情があるので、しょうがない。 普通に考えるとblast+を使えば良いかと思うんだけれど、フルマッチの…

BioPerlをインストールした

随分前にblast+をインストールしたワケだけれど、blast+をちゃんとbioperlから使えるようにしてなかった。コレを使えるようにするのが、意外に面倒だった。 bioperl-liveとbioperl-runとbioperl-dbをインストールする どうやら、もうCPANのshellで install B…

遺伝子に関連するid

いろいろ種類がありすぎるんじゃぁぁぁぁ。ということで、Ensembl Gene AccessionからEntrez Gene IDを索いた後、そのHGNCのGeneSymbolを得る方法を考え中。ftp://ftp.ncbi.nih.gov/gene/DATA/のgene2ensemblとgene_infoを組み合わせればOKかな?と思いつつ…

Pathway解析

「この間の学会でよく聞いた名前なんだけれど、Pathwayの解析ができるらしいから、ちょっと調べておいて」というオーダーのもと、ちょっと調べてみた。 DAVID Paradigm DAVID 遺伝子のリストなり、Microarrayのプローブ名のリストなりを入力すると、どうやら…

NCBI Blast+

久々にNCBI Blastをlocalに動かせるように環境を作る。以前は、ソースコードからbuildしたりしてたけれど、もう面倒なので、executableをダウンロードしてくる。 ダウンロード % `lynx -dump ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ |…

昨日のBioRubyネタの続き

twitterでBioRubyの中の人( @32nmさん)の助言を受ける。そもそも、methodの追加程度であれば、継承したclassは作らんでも良いらしい。オレってちっともrubyを理解できてないな。 方針 以下のcode( http://gist.github.com/641871 )をna.rbとして保存して、実…

遺伝統計学の勉強

id:ryamada22 さんの遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―を会社で購入してもらった。 これから読む。

Microarrayの解析

とりあえず、NCBI GEOで公開されているMicroarrayのデータを使って、特徴的な遺伝子のリストを得るための、覚え書き。 例題は、GSE16515として公開されている、膵臓癌のデータを使うことにする。 library(GEOquery) gse16515.eset <- getGEO("GSE16515")[[1]…

続・RでAffinity propagation

http://d.hatena.ne.jp/fukuit/20100418/1271556448というのを、数ヶ月前に書いたんだけれど、お恥ずかしいことに、CRANに既にAffnity propagationによるclusteringをするためのパッケージが公開されていた。CRAN - Package apclusterいずれ、CRANで公開でき…

RでAffinity propagation

とりあえず、必要があってRでaffinity propagationを書いてみた。MATLABやCのコードは公開されているけれど、Rのコードは公開されてない。必要なら作るしかない。Rでちゃんと関数を書く方法がよく分からないので、その辺は適当に。まずは、Rでdata.frame間の…

桜散る

東京医科歯科大学の博士課程の二次試験を2月2日に受験した。その結果発表があり、自信満々で掲示板を見に行ったんだけれど、残念ながら不合格だった。 そもそものきっかけ 大学卒業後に配属された部署は、社内むけのアプリケーションを作る部門だった。ソレ…

R(とBioConductor)とGEO

R(とBioConductor)で、GEOにて公開されているマイクロアレイのデータを読み込んでみる企画。 準備 Rを起動して、GEOqueryを使えるようにしておく。 > Sys.setenv("http_proxy"="http://proxy.example.com/") > Sys.setenv("ftp_proxy"="http://proxy.example…

小論文作成の準備に取りかかる

卒業研究の発表会 - fukuitの日記を受けて、一ヶ月以内に小論文を作成する必要がある。Microsoft Wordで書くのは気分が乗らないので、十数年ぶりにTeXで書いてみようと思い立った。 オレが大学の卒業論文を書いた頃には、asciiの日本語Texか?NTTのjTexか?…

卒業研究の発表会

卒業研究の発表会があった。 持ち時間は一人10分。この半年の成果を発表する場ということもあって、みんな時間をオーバー気味。質疑応答の時間がなくなってしまったのが残念。しかし、他の人々の研究の進み具合であったり、オリジナリティであったり、きちん…

Rで引数がvectorの時にdata.frameとして扱う方法

ところで、function()で指定している引数(df)が、data.frameかvectorか?を判別する方法はあるだろうか?nrow(df)が1になった時は、vectorと判断して、各要素間でdist()するようにして、nrow(df)が1でない時は、各行をrbindしてdist()するようにする、、、と…

Rでdata.frame間の距離を測ってmatrixにする

昨日の続き。昨日は、vectorのユークリッド距離を直接計算してたけど、data.frameの各行ごとの距離を測ろうとするとそういうワケにはいかんし。どうすんべ?と思っていたら、dist()という関数があった。何度か、「やっぱりObjective-Cで書いてみようか、C#で…

今日はRに挑戦

昨日の続きである。とりあえず、Rで1次元のベクトルを受け取って、2次元の配列にするには、以下のように書いてみた。 input<-c(-1,0,1,5,6,7) s<-matrix(NA,length(input),length(input)) for(i in 1:length(input)){ for(j in 1:length(input)){ k <- -1*(i…

久々にプログラミング

そろそろ大学の卒業研究もやばいので、ちゃんとプログラムを書いてみることにする。そもそも読みかけてた論文がさっぱり先に進めなくなってたのは、文章で書かれていることがよく分からなかったからなんだけど、著者のサイトとかでサンプルコードが見られる…

CellDesigner 4.0.1

CellDesigner 4.0.1をinstallしてみた。で、起動しようとすると、一瞬Dockにアイコンが現れたと思いきやすぐ終了しちゃう。 CrashLogみたいなのが残っていれば、どうするべきか対応方法も分かるかもしれないんだけど、そういうのも見あたらない。 困ったなぁ…

一橋記念講堂へ

オミックス医療研究会のシンポジウム(http://www.omics.jp/event/2008/transdisease/)を聴講してきた。「オミックス」ってことで、新しいマーカーを見つけたり、新しい治療方法を見つけたりするのが、研究。そして、それを実用化するために臨床で使えるよう…

学会入会

Japanese Society for Bioinformatics - JSBi :: ホームとSIG BIO, IPSJに入会する手続きをした。お金かかるなぁ。 こういう学会に入会する費用は会社では負担してくれない。仕事のために入会するのになぁ。 で、学会の年会とかに参加する時は、会員になると…