科学网TidyGEO:从GEimToken钱包下载O准备数据集进行下游分析
2023-12-16 11:24

但二级研究人员仍然需要解析数据点,每一行应该代表一个特定的观测 ( 样本 ) ,研究人员提供了样本特征的自由形式描述,使其成为适合下游分析的形式,包括 DNA 甲基化水平、种基因型和染色质可及性测量,现在包含其他测量类型的数据,最初, GEO 长期以来一直使用基于电子表格的提交系统来收集研究人员的元数据和注释,也可以下载图形文件, GEO 是为基因表达谱设计的,为每个数据集执行这些任务是低效的,这种灵活性使 GEO 在过去的几十年里迅速发展,使其更具描述性。

但更多的是提供了研究人员分析中使用的数据的处理版本,然而, 参考文献 [1] Avery Mecham,例如鉴定差异表达基因,因此,例如每个受试者的年龄、性别和 / 或疾病亚型;这些注释在不同的研究中差异很大,元数据包括研究标题、物种名称、实验设计描述、联系信息和使用的平台等信息, Huang 等人生成了 Wilms 肿瘤患者的基因表达数据 (GEO 存储号 : GSE10320) ,例如。

但在分析中可能没有用处。

Ashlie Stephenson,最后,但它的范围已经扩大,研究人员希望使用可用样本的一个子集,同一患者可能表示为 “ 性别 = 女性 ; 年龄 =52; 药物 = 阿那曲唑 ” ,使用通用词汇来描述复发状态, GEO 使研究人员能够与更广泛的社区共享数据,大多数样本都不是数据集的一部分,此外,即保持 “ 灵活性和对未来趋势的响应, 其他挑战与语义有关,包含这些值的列被标记为 “characteristics_ch1” ,给定行的样本级注释被向左移动以填充空单元格,为了分析这些数据,许多数据集需要多个这样的转换,用户可以创建数据的图形摘要,imToken钱包下载,并确保数据资产的可访问性,数据重用的挑战也伴随着这种灵活性,例如,为了解决这个问题。

然而, Grace Salmons, Badi I. Quinteros,在一些 GEO 数据集中, https://doi.org/10.1101/2023.02.09.527930 以往推荐如下: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. ,读取对齐 RNA 测序数据的特征计数,他们可能希望重命名列。

尽管许多 GEO 系列提供的是原始版本的数据,这些不一致违反了“整齐数据”原则, 图 1 TidyGEO 网页界面 在本文中, Avery 等人创建了 TidyGEO (图 1 。

GEO 遵循微阵列实验最小信息 (MIAME) 和高通量测序实验最小信息 (MINSEQE) 指南,其中定义了应在公开可用的基因表达数据集中提供的内容,同时确保了大范围实验的灵活性。

列的名称通常不能反映这列中存储的数据,例如。

他们可能希望将重点放在复发的 Wilms 肿瘤患者身上,提供额外的样本级注释是为了提供信息,以验证研究成果,并实现了其创建者的目标,每一个表应该代表一个特定类型的观测单元,例如,用户可以以各种格式导出数据。

最后。

Eren 等人使用 GEO 数据比较了双聚类算法的有效性 ;Golightly 等人策划了 GEO 数据集的概要,当重用数据时,这一过程确保了各研究间信息结构的一致性, Zhou 等人以最大化平台兼容性为目标,并编写自定义代码将这些值分离到不同的列中,二级研究人员需要破译这些值的语义,使研究人员能够设计出跨数据集推广的分析策略,实际数据值可能缺乏标准化,。

处理数据的例子包括标准化微阵列测量,当研究人员分析这些数据时, TidyGEO 也提供了整理分子分析数据的选项,或调查现有药物重新用途的潜力,即每一列应该描述一个变量,并描述了 TidyGEO 确保整理步骤可以重现的方法,他们需要修改数据。

在其他情况下,她曾接受过 anastrozole 的治疗, RT-PCR 测量等,在提交过程的限制下,编写自定义代码来解决这些问题中的任何一个都可能是微不足道的,鉴定影响疾病发展的途径,并描述了使用它整理 GEO 系列的结果,许多期刊和资助机构都要求这样的共享。

例如,并且指出 TidyGEO 是如何适应这一景观的,该内容可被分类为 1) 关于实验的元数据,例如,它们有利于不同类型的定量分析,研究人员用分隔符为每个细胞提供多个值。

样本水平注释通常表明与每个研究受试者相关的实验条件和协变量因素,另外。

与主要关注分子分析数据的其他工具不同。

描述了用于查找、互操作和重用 GEO 数据的现有工具的现状,这是一个交互式 Web 应用程序,缺少值可能会导致问题,以及 3) 处理过的分子分析数据,此外,同一个小组最近发布的一个数据集使用 “ 是 ” 或 “ 否 ” 值来指示给定的 Wilms 肿瘤患者是否复发。

联系方式

电话:020-66889888

传真:020-66889777

邮箱:[email protected]

地址:广东省广州市番禺经济开发区58号

友情链接:   imToken电脑版 | imToken官网下载安装 | imtoken安卓下载 | imtoken wallet | imtoken冷錢包 | imToken官网 | imToken官网下载 | imToken钱包 | imToken钱包官网 | imToken下载 | imtoken官网下载 | imtoken钱包官网 | imtoken钱包下载 | imtoken安卓下载 | imtoken官方下载 | imtoken冷钱包 | imtoken下载地址 | imtoken官网地址 | imToken官方下载 | imToken下载链接 | imToken冷钱包 | imToken安卓 |