PythonでGO Enrichmentの結果を図示する

この記事に関するIssueをGithubで作成する

CellRangerでSTARのパラメータを変更する

更新: 2022-05-20

single cell RNA-seqを知ってる人ならまず知っているであろう、Cell Ranger。使ったことがなかったんですが、ちょっと使ってみようかなと思いました。しかし、これ内部的にはSTARを使ってマッピングするんですが、STARのパラメーターを引数でとれない、という問題（誰も問題にしていない）があります。公式の解答としては、自分でビルドしてね、責任は持たないけど、ってことらしいです。

Rustのデータフレームcrateのpolarsとpandasの比較

更新: 2022-05-20

rustpythonpolars

rustにも実はpandas likeなcrateがあることを知ったのでpandasとの対応関係をまとめてた。最善である保証はありません。

gatk4のRNA-seq bestpractice

更新: 2022-05-20

bioinformaticsgatk

genomic sequenceと少しRNA-seqのパイプラインは違うので、bestpracticeをbashで実行するメモ

GATK4をsplit intervalを使って高速化する

更新: 2022-05-20

bioinformaticsgatk

GATK4は実行に時間がかかるツールですが、マシンパワーさえあればsplit intervalを使って高速化できます。interval listについては日本語文献が見つからなかったのでまとめておきます。

Pythonでupsetplotを使う

更新: 2022-05-20

pythonplot

集合関係の包含関係を示すとき、ベン図より使いやすいことのあるupset plotをPythonで使用するやり方です

Bioinformaticsで使うファイルフォーマットまとめ

更新: 2022-06-12

bioinformatics

バイオインフォマティクスをしていて、障壁になることの1つにファイルフォーマットが多すぎる、という問題があると思います。ツールを動かそうとするとこれとこれとこれが必要となって、どうやってこの形式のファイルを作ればいいんだ？ということはよくあります。備忘録を兼ねて、よく使うフォーマットと関連するツールについてまとめておきます。

PythonでGO Enrichmentの結果を図示する

TL;DR

Dataset

Import & 設定

単純なプロット

Barplot

dotplot

グループごとのdotplot

Similarityを利用したプロット

TODO

Read Next