GEO 上传数据最新教程


前年写的 上传二代测序数据到 GEO 数据库 教程,现在 GEO 又做了一些更新,这次再补充一些不一样的信息。需要上传数据到 GEO 的,大家可以了解一下。
进入


首先你需要一个 NCBI 账号,没有就用 ORCID 注册一个,什么是 ORCID 你可以看上面的推文。
NCBI 官网点击 submit 进入:

拉到下面 other tools 选择 geo:

选择 Submit high-throughput sequencing 就进入主要提交界面了:

数据类型


首先了解自己的数据属于什么类型,不同的数据需要上传到不同的数据库中,了解 GEO 数据库可以接受什么样的数据很重要。

主要流程

下面这三个文件依然是必要的:

metadat 表格选择


和之前的一个 metadata 不一样,现在多了一个 Download metadata spreadsheet with SRA accessions,这个表格主要针对:如果你已经上传 raw data 到 SRA 数据库时才需要填写这个表格。如果没有填写第一个表格就行。

注意一个测序类型填写一个 metadata 文件,多个测序就相应的填写多个。
Processed data files


Processed data 是一些处理过的数据,比如 tpm/fpkm/counts 等数据,注意不要上传 bam/sam/bed 这些比对数据。

Raw data files


Raw data 就是公司给你的 fastq 文件。如果文件超过 2TB 就需要传到 SRA 数据库了,还有文件名的命名问题。

Data File Compression


关于文件的压缩问题,不要压缩二进制文件(bam/bigwig/bigBed/HDF5)。不要用 zip/tar 压缩。

Single-cell studies


单细胞数据的上传。

文件夹组织


如果一个项目里有多种类型的测序,分别建立文件夹来存放数据。

上传数据


现在 raw data,processed data 和 metadata 需要分开上传。

上传方式还是有多种,选择自己适合的就行:

结尾


路漫漫其修远兮,吾将上下而求索。
欢迎加入生信交流群。加我微信我也拉你进 微信群聊 老俊俊生信交流群 (微信交流群需收取 20 元入群费用,一旦交费,拒不退还!(防止骗子和便于管理)) 。QQ 群可免费加入, 记得进群按格式修改备注哦。

声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/418676.html

(0)
联系我们
联系我们
分享本页
返回顶部