search
技术服务021-34781616

热门搜索关键词:转录组基因组甲基化酵母文库蛋白芯片

021-34781616

当前位置凯发k8凯发k8网址官网下载首页 » 新闻资讯 » 技术&解读&应用 » 什么?kegg数据你竟然还不会下载!!

什么?kegg数据你竟然还不会下载!!

返回列表 来源:
扫一扫!扫一扫!
浏览:- 发布日期:2016-12-15 14:35:01【 】

kegg(kyoto encyclopedia of genes and genomes)京都基因和基因组百科全书,是研究pathway代谢通路的最主要数据库,整合了基因组信息、化学信息、系统信息及疾病和健康信息。

之前有文章向大家介绍过kegg数据的分析处理方法,但是很多老师提出疑问!!

讲了这么多,但是kegg数据到底怎么下载???

下载的原始文本并不是我们常用的数据格式,看起来像一堆乱码一样,我该怎么用????

今天小编将手把手一步一步教会你各物种kegg数据的下载,还有下载后原始数据的处理方法,干货请收藏!

1

首先打开kegg官方网站 ,网页中展示出了各个物种的分类、拉丁名称、英文名称等信息。

2

直接网页中搜索(ctrl + f)需要下载的物种英文名称或拉丁名。如果不确定物种名称,网站中提供了详细的分类系统,也可根据前面的物种分类信息进行查找。

本文以拟南芥为例,搜索“arabidopsis thaliana”即可找到。找到后点击物种名称前的3个字母缩写链接(下图红色框中的位置)。

3

进入后的网页中包含了物种的一些基因组信息,点击上方的“brite hierarchy”;

4

进入后再点击“kegg orthology (ko)”;

5

在跳转出的网页中点击“download htext”,弹出下载窗口进行下载,国外网站有时会出现无法下载的情况,多试几次即可;

6

当然,下载好之后还没有结束。下载得到文本文件,可以看到里面的结构层次非常清楚,c开头的就是kegg的pathway的id所在行,d开头的就是属于它的kegg的所有的基因。a,b是kegg的分类,总共是6个大类,42个小类。

我们要进一步把它转成可以直接使用的格式。

7

在shell中输入如下命令(加粗部分为下载的原始文件,请修改成需要的名字):

awk '$1=="c" &&$nf~"path:" || $1=="d"' ath00001.keg| grep -p "path|\tk" | sed's#^c[[:space:]]*

即可直接生成处理好的kegg结果。第一列为拟南芥的基因名称,后面就是该基因的kegg数据,一目了然。

需要说明的是,由于物种的不同,第一列也有可能出现genbank等非基因名称的信息。

以上就是下载kegg数据,并对原始数据格式转换的所有内容,快去试一试吧

下一篇:2016.12.16 每日早知道 上一篇:

推荐阅读

【本文标签】:
【责任编辑】:欧易生物凯发k8官网下载的版权所有:http://www.oebiotech.com转载请注明出处

欧易生物

技术热线:021-34781616 咨询热线:4006-4008-26

上海市闵行区新骏环路138号5幢3层
service@oebiotech.com
欧易生物
欧易生物微信公众号
 网站地图  凯发k8官网下载 copyright © 2016 凯发k8官网下载 保留所有权利