❝
前年写的 上传二代测序数据到 GEO 数据库 教程,现在 GEO 又做了一些更新,这次再补充一些不一样的信息。需要上传数据到 GEO 的,大家可以了解一下。
进入
❝
首先你需要一个 NCBI 账号,没有就用 ORCID 注册一个,什么是 ORCID 你可以看上面的推文。
NCBI 官网点击 submit 进入:
拉到下面 other tools 选择 geo:
选择 Submit high-throughput sequencing 就进入主要提交界面了:
数据类型
❝
首先了解自己的数据属于什么类型,不同的数据需要上传到不同的数据库中,了解 GEO 数据库可以接受什么样的数据很重要。
主要流程
下面这三个文件依然是必要的:
metadat 表格选择
❝
和之前的一个 metadata 不一样,现在多了一个 Download metadata spreadsheet with SRA accessions,这个表格主要针对:如果你已经上传 raw data 到 SRA 数据库时才需要填写这个表格。如果没有填写第一个表格就行。
注意一个测序类型填写一个 metadata 文件,多个测序就相应的填写多个。
Processed data files
❝
Processed data 是一些处理过的数据,比如 tpm/fpkm/counts 等数据,注意不要上传 bam/sam/bed 这些比对数据。
Raw data files
❝
Raw data 就是公司给你的 fastq 文件。如果文件超过 2TB 就需要传到 SRA 数据库了,还有文件名的命名问题。
Data File Compression
❝
关于文件的压缩问题,不要压缩二进制文件(bam/bigwig/bigBed/HDF5)。不要用 zip/tar 压缩。
Single-cell studies
❝
单细胞数据的上传。
文件夹组织
❝
如果一个项目里有多种类型的测序,分别建立文件夹来存放数据。
上传数据
❝
现在 raw data,processed data 和 metadata 需要分开上传。
上传方式还是有多种,选择自己适合的就行:
结尾
❝
路漫漫其修远兮,吾将上下而求索。
欢迎加入生信交流群。加我微信我也拉你进 微信群聊 老俊俊生信交流群 (微信交流群需收取 20 元入群费用,一旦交费,拒不退还!(防止骗子和便于管理)) 。QQ 群可免费加入, 记得进群按格式修改备注哦。
声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/418676.html