search
技术服务021-34781616

热门搜索关键词:转录组基因组甲基化酵母文库蛋白芯片

021-34781616

当前位置凯发k8凯发k8网址官网下载首页 » 新闻资讯 » 技术&解读&应用 » 手把手教您如何下载高通量数据

手把手教您如何下载高通量数据

返回列表 来源:
扫一扫!扫一扫!
浏览:- 发布日期:2016-09-27 12:41:52【 】

wa~ 这篇文章利用网上下载的数据进行分析,不同于本文作者的研究视角进行重新分析,获得新的数据并辅助其他科研结果,非常nice的文章就出炉,好牛气哦……那如何在网上下载感兴趣数据,欧易生物带您畅游在海量高通量数据中,手把手教您如何寻找并下载合适的高通量数据,下面开始我们的数据搜索之旅

首先我们需要了解高通量数据上传数据库geo(gene expression omnibus,基因表达综合数据库),其是由ncbi建立的公共数据库。该数据库具有很强的灵活性和开放性,用户可提交、存储和检索多种形式的数据:包括基于单通道和多通道的微阵列技术实验测量得到的基因表达谱数据、基因组dna和蛋白质分子数据、以及基于非阵列技术的基因表达序列分析(serialanalysis of gene expression,sage)得到的数据。我们以查询转录组数据为例,为您提供两种从geo数据库中下载数据的途径。

第一种是仅知道研究物种和大概方向,但是没有相关数据的任何信息,需要在数据库中查找获得相关数据,具体方法为:首先,打开ncbi数据库链接http://www.ncbi.nlm.nih.gov,在搜索栏的左侧选择geo datasets,在搜索框中填入需要搜索的内容,例如搜索与水稻抗病相关的数据,输入rice disease,点击search,

搜索结果包含所有相关信息列表,其中大部分是利用表达谱芯片完成实验的数据,

如果只搜索利用转录组完成实验的数据,也可在搜索词后面加上rna-seq字样(rice disease rna-seq)。如果搜索结果只有一条记录,会直接显示该条记录信息,若有很多条记录,会显示相应列表,每条记录都会直接显示文章的相应信息:1)expression profilingby high throughput sequencing,2)9 samples。

例如我们下载上面所列文章的数据,点击标题连接即可看到提交数据的具体信息介绍,可查看实验的具体设计思路与实验细节,例如所用实验平台、如何分组等信息。

将页面下拉,可以看到文章相关的具体样本信息以及分组信息,

点击每个样本链接,将此页面下拉,会看到如下信息,

点击(htp),获得文件夹,继续点击,直到看到如下页面,即可下载数据(转录组原始数据扩展名为.sra),

下载数据后,请牢记每个样本编号对应的文章中样本名字以及分组信息(例如gsm1229035对应的原始数据srr976336,分组为ec1组),便于后期分析。

第二种方法是通过查看相关文章后,发现与自己研究相关,想要下载文章中涉及的转录组数据,具体方法如下:1)文章中一般给出数据相关链接,直接点击链接即可,可直接进入以下页面,搜索自己需要信息即可。

如果文章没有给数据链接,那么会给出数据提交的accession id,例如本文的gse50777,在geo datasets栏中搜索即可,会出现以下信息,

其中第一条记录就是前面我们搜索到的数据,从第三条记录开始就是我们文章每个样本的具体信息,可以直接点击下载。

请注意:由于方法不同,后期对数据提取(二进制提取碱基序列)所用程序有一定差异,所以需对相应文章进行查询(点击最早搜索记录中的pubmed即可),获取转录组测序的方式(是单端se测序还是双端pe测序)。

通过查看文章或者文章附录,我们可发现文章采用的方法(一般文章中都会写,如果没有写,可通过email向作者咨询。近些年使用ilumina hiseq2000或2500进行的转录组测序都是pe方法,只有个别的se方法),如果查询到相关信息,请您务必在下载的数据文件中标注或记录,便于后期的数据提取。

下一篇: 上一篇:教你如何节约科研时间和经费

推荐阅读

【本文标签】:
【责任编辑】:欧易生物凯发k8官网下载的版权所有:http://www.oebiotech.com转载请注明出处

欧易生物

技术热线:021-34781616 咨询热线:4006-4008-26

上海市闵行区新骏环路138号5幢3层
service@oebiotech.com
欧易生物
欧易生物微信公众号
 网站地图  凯发k8官网下载 copyright © 2016 凯发k8官网下载 保留所有权利