KEGG XML をパースする R パッケージ

KEGGgraph

KEGGgraph は R / Bioconductor のパッケージで KEGG XML を解析してネットワーク図をプロットする機能を提供している。

library(KEGGgraph)

KEGG XML は KEGG パスウェイのページでダウンロードできる。ここでは Ras signaling pathway の KEGG XML を KEGGgraph パッケージで解析してみる。

code>p <- parseKGML2Graph("hsa04014.xml")
plot(p)

実際にプロットされる画像は以下のようになる。ノード数が多すぎると見づらい。パスウェイを描くとき pathview パッケージを利用すると便利。

KEGGgraphで描いたパスウェイ

ノード数およびエッジ数を見るには parseKGML2Graph の返り値を利用する。

p
## A graphNEL graph with directed edges
## Number of Nodes = 228
## Number of Edges = 1394

ノードおよびエッジの名前はそれぞれ nodes および edges 関数を利用して確認する。

> head(nodes(p))
## [1] "hsa:5594"  "hsa:5595"  "hsa:5604"  "hsa:5605"  "hsa:5894"  "hsa:22800"

head(edges(p))
## $`hsa:5594`
##  [1] "hsa:100137049" "hsa:11145"     "hsa:123745"    "hsa:255189"
##  [5] "hsa:26279"     "hsa:283748"    "hsa:30814"     "hsa:391013"
##  [9] "hsa:50487"     "hsa:51365"     "hsa:5319"      "hsa:5320"
## [13] "hsa:5321"      "hsa:5322"      "hsa:64600"     "hsa:81579"
##  ...
## $`hsa:22800`
##  [1] "hsa:11186" "hsa:83593" "hsa:7074"  "hsa:23533" "hsa:5290"  "hsa:5291"
##  [7] "hsa:5293"  "hsa:5294"  "hsa:5295"  "hsa:5296"  "hsa:8503"  "hsa:4301"
## [13] "hsa:5894"  "hsa:5900"  "hsa:23179" "hsa:5863"  "hsa:51196" "hsa:9610"
## [19] "hsa:10928" "hsa:8315"  "hsa:9771"