有的难度是想象出来的，这样这样再这样不就解决啦！-369IT编程

admin管理员组
文章数量:1034012

有的难度是想象出来的，这样这样再这样不就解决啦！

1.问题数据

学员遇到一个有问题的基因表达芯片数据：

可以看到这个数据有两个问题：数值大小都在0附近，里面还有NA

2.探索原因

在GSE页面上点进去一个样本去看，可以看到这些值的说明，是标准化之后的数据。

标准化是不可逆的，不能用于做差异分析。

3.解决问题

拿到这样的数据，要么放弃，要么处理原始数据。

我的学生选择的是处理原始数据，可是呢，这个bgx数据格式我们没教欸！

4.所以什么是bgx呢？

只要略略搜索就可以知道，它是一种探针注释存储的格式。

/

到这里其实就可以打住了，因为我们并不需要使用这个探针注释。虽然这个GPL确实没有对应的注释R包，但从GSE页面上点击GPL编号进去，可以看到是有探针注释的。

（截图的时候没看到，其实后面还有一列叫symbol的，还是用symbol吧）

所以我们其实根本不需要bgx格式。但你却因为不会处理bgx，而止步不前咯。这不就是想象出来的难度嘛。

读取一下看看也行吧，中国人讲究一个来都来了。

代码语言：javascript代码运行次数：0运行复制

#BiocManager::install("illuminaio")
library(illuminaio)
bgx = readBGX("GPL6883_HumanRef-8_V3_0_R0_11282963_A.bgx")

其中probes点开就是:

没啥用处。和GPL页面的表格一样，还少了探针ID列呢。

5.真诚是永远的必杀技

我就给你直接分析完得了呗！省的后面又有啥不会。

原始数据有两个，除了bgx，另一个txt文件就是表达矩阵了，这个表格长得还挺贴心的

1.表达矩阵

代码语言：javascript代码运行次数：0运行复制

exp = read.delim("GSE16561_RAW.txt",row.names = 1,check.names = F)
range(exp)

代码语言：javascript代码运行次数：0运行复制

## [1]   111.8617 72479.9900

代码语言：javascript代码运行次数：0运行复制

exp = log2(exp+1)
exp[1:4,1:4]

代码语言：javascript代码运行次数：0运行复制

##              3100083_Stroke 3100191_Stroke 3100068_Stroke 3100060_Stroke
## ILMN_1809034       7.884799       7.483076       7.673048       7.674788
## ILMN_1660305       8.195663       7.840273       7.607785       7.997668
## ILMN_1762337       7.490086       7.403282       7.185134       7.302428
## ILMN_2055271       7.689259       7.683558       7.448607       7.903191

代码语言：javascript代码运行次数：0运行复制

boxplot(exp)

还挺不齐的，给他拉齐一下：

代码语言：javascript代码运行次数：0运行复制

exp = limma::normalizeBetweenArrays(exp)
boxplot(exp)

2.临床信息

geo_download可以下载series.matrix.gz文件，解析里面的表达矩阵和分组信息以及GPL编号。虽然这个数据表达矩阵有问题，但临床信息表格没问题，转录组数据的临床信息也可以这样子读取。

GPL编号我们不需要了，直接下载他的探针注释文件，提取对应的列即可。

代码语言：javascript代码运行次数：0运行复制

library(tinyarray)

代码语言：javascript代码运行次数：0运行复制

pd = geo_download("GSE16561")$pd

代码语言：javascript代码运行次数：0运行复制

## Warning in geo_download("GSE16561"): NA or NAN values detected

可以看到，title列和txt里的表达矩阵列名是一致的。

代码语言：javascript代码运行次数：0运行复制

identical(colnames(exp),pd$title)

代码语言：javascript代码运行次数：0运行复制

## [1] TRUE

3.分组信息

同一个分组对应同一个关键词，levels 设置对照组在前。

代码语言：javascript代码运行次数：0运行复制

Group = factor(pd$description,levels = c("Control","Stroke"))
table(Group)

代码语言：javascript代码运行次数：0运行复制

## Group
## Control  Stroke 
##      24      39

4.探针注释

代码语言：javascript代码运行次数：0运行复制

a = data.table::fread("GPL6883-11606.txt")
colnames(a)

代码语言：javascript代码运行次数：0运行复制

##  [1] "ID"                    "Species"               "Source"               
##  [4] "Search_Key"            "Transcript"            "ILMN_Gene"            
##  [7] "Source_Reference_ID"   "RefSeq_ID"             "Entrez_Gene_ID"       
## [10] "GI"                    "Accession"             "Symbol"               
## [13] "Protein_Product"       "Array_Address_Id"      "Probe_Type"           
## [16] "Probe_Start"           "SEQUENCE"              "Chromosome"           
## [19] "Probe_Chr_Orientation" "Probe_Coordinates"     "Cytoband"             
## [22] "Definition"            "Ontology_Component"    "Ontology_Process"     
## [25] "Ontology_Function"     "Synonyms"              "GB_ACC"

代码语言：javascript代码运行次数：0运行复制

ids = a[,c("ID","Symbol")]
colnames(ids) =c("probe_id","symbol")

5.差异分析

代码语言：javascript代码运行次数：0运行复制

dcp = get_deg_all(exp,Group,ids,entriz = F,logFC_cutoff = 0.585,cluster_cols = F)
dcp$plots

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2025-03-27，如有侵权请联系 cloudcommunity@tencent 删除表格数据搜索芯片存储

有的难度是想象出来的，这样这样再这样不就解决啦！

1.问题数据

学员遇到一个有问题的基因表达芯片数据：

可以看到这个数据有两个问题：数值大小都在0附近，里面还有NA

2.探索原因

在GSE页面上点进去一个样本去看，可以看到这些值的说明，是标准化之后的数据。

标准化是不可逆的，不能用于做差异分析。

3.解决问题

拿到这样的数据，要么放弃，要么处理原始数据。

我的学生选择的是处理原始数据，可是呢，这个bgx数据格式我们没教欸！

4.所以什么是bgx呢？

只要略略搜索就可以知道，它是一种探针注释存储的格式。

/

（截图的时候没看到，其实后面还有一列叫symbol的，还是用symbol吧）

所以我们其实根本不需要bgx格式。但你却因为不会处理bgx，而止步不前咯。这不就是想象出来的难度嘛。

读取一下看看也行吧，中国人讲究一个来都来了。

代码语言：javascript代码运行次数：0运行复制

#BiocManager::install("illuminaio")
library(illuminaio)
bgx = readBGX("GPL6883_HumanRef-8_V3_0_R0_11282963_A.bgx")

其中probes点开就是:

没啥用处。和GPL页面的表格一样，还少了探针ID列呢。

5.真诚是永远的必杀技

我就给你直接分析完得了呗！省的后面又有啥不会。

原始数据有两个，除了bgx，另一个txt文件就是表达矩阵了，这个表格长得还挺贴心的

1.表达矩阵

代码语言：javascript代码运行次数：0运行复制

exp = read.delim("GSE16561_RAW.txt",row.names = 1,check.names = F)
range(exp)

代码语言：javascript代码运行次数：0运行复制

## [1]   111.8617 72479.9900

代码语言：javascript代码运行次数：0运行复制

exp = log2(exp+1)
exp[1:4,1:4]

代码语言：javascript代码运行次数：0运行复制

##              3100083_Stroke 3100191_Stroke 3100068_Stroke 3100060_Stroke
## ILMN_1809034       7.884799       7.483076       7.673048       7.674788
## ILMN_1660305       8.195663       7.840273       7.607785       7.997668
## ILMN_1762337       7.490086       7.403282       7.185134       7.302428
## ILMN_2055271       7.689259       7.683558       7.448607       7.903191

代码语言：javascript代码运行次数：0运行复制

boxplot(exp)

还挺不齐的，给他拉齐一下：

代码语言：javascript代码运行次数：0运行复制

exp = limma::normalizeBetweenArrays(exp)
boxplot(exp)

2.临床信息

GPL编号我们不需要了，直接下载他的探针注释文件，提取对应的列即可。

代码语言：javascript代码运行次数：0运行复制

library(tinyarray)

代码语言：javascript代码运行次数：0运行复制

pd = geo_download("GSE16561")$pd

代码语言：javascript代码运行次数：0运行复制

## Warning in geo_download("GSE16561"): NA or NAN values detected

可以看到，title列和txt里的表达矩阵列名是一致的。

代码语言：javascript代码运行次数：0运行复制

identical(colnames(exp),pd$title)

代码语言：javascript代码运行次数：0运行复制

## [1] TRUE

3.分组信息

同一个分组对应同一个关键词，levels 设置对照组在前。

代码语言：javascript代码运行次数：0运行复制

Group = factor(pd$description,levels = c("Control","Stroke"))
table(Group)

代码语言：javascript代码运行次数：0运行复制

## Group
## Control  Stroke 
##      24      39

4.探针注释

代码语言：javascript代码运行次数：0运行复制

a = data.table::fread("GPL6883-11606.txt")
colnames(a)

代码语言：javascript代码运行次数：0运行复制

##  [1] "ID"                    "Species"               "Source"               
##  [4] "Search_Key"            "Transcript"            "ILMN_Gene"            
##  [7] "Source_Reference_ID"   "RefSeq_ID"             "Entrez_Gene_ID"       
## [10] "GI"                    "Accession"             "Symbol"               
## [13] "Protein_Product"       "Array_Address_Id"      "Probe_Type"           
## [16] "Probe_Start"           "SEQUENCE"              "Chromosome"           
## [19] "Probe_Chr_Orientation" "Probe_Coordinates"     "Cytoband"             
## [22] "Definition"            "Ontology_Component"    "Ontology_Process"     
## [25] "Ontology_Function"     "Synonyms"              "GB_ACC"

代码语言：javascript代码运行次数：0运行复制

ids = a[,c("ID","Symbol")]
colnames(ids) =c("probe_id","symbol")

5.差异分析

代码语言：javascript代码运行次数：0运行复制

dcp = get_deg_all(exp,Group,ids,entriz = F,logFC_cutoff = 0.585,cluster_cols = F)
dcp$plots

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2025-03-27，如有侵权请联系 cloudcommunity@tencent 删除表格数据搜索芯片存储

本文标签：有的难度是想象出来的，这样这样再这样不就解决啦！

版权声明：本文标题：有的难度是想象出来的，这样这样再这样不就解决啦！内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1748106722a2254268.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

有的难度是想象出来的，这样这样再这样不就解决啦！

有的难度是想象出来的，这样这样再这样不就解决啦！

2.探索原因

3.解决问题

4.所以什么是bgx呢？

5.真诚是永远的必杀技

1.表达矩阵

2.临床信息

3.分组信息

4.探针注释

5.差异分析

有的难度是想象出来的，这样这样再这样不就解决啦！

2.探索原因

3.解决问题

4.所以什么是bgx呢？

5.真诚是永远的必杀技

1.表达矩阵

2.临床信息

3.分组信息

4.探针注释

5.差异分析

更多相关文章

有的难度是想象出来的，这样这样再这样不就解决啦！

发表评论

推荐文章

chroma 1.0.5 来了！新增图像嵌入支持、日志优化，开发者必看更新

linux（ubuntu）和windows双系统，windows花屏解决办法详解

现有 Flutter 项目支持鸿蒙

Ingress,你这个老6

Python向IP地址发送字符串

热门文章

CANoe UDS DTC测试

[word] word光标定不到第一行怎么办 #微信#经验分享#媒体

MindIE Torch快速上手

用户行为分析正在被保险行业广泛采纳

Git的下载和安装（Windows）

chromedriver下载和使用教程

当AI学会自己捉“虫”：模型自我优化框架大揭秘

存储监控新维度：WeOps实现主流存储全覆盖+个性拓展自由

TiDB 可观测性解读（二）丨算子执行信息性能诊断案例分享（下）

接口状态自由定制！Apipost、 Apifox和Postman：谁在拖垮你的开发效率？

最新文章

213.HarmonyOS NEXT系列教程之 CustomDrawTabbarComponent组件功能解析

214.HarmonyOS NEXT系列教程之 自定义TabBar组件系列总结与最佳实践

215.HarmonyOS NEXT系列教程之 CircleClass基础类与圆形效果实现原理解析

216.HarmonyOS NEXT系列教程之 TabBar凸起效果与图片偏移实现解析

217.HarmonyOS NEXT系列教程之 TabBar工具函数与Canvas绘制实现解析

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

214.HarmonyOS NEXT系列教程之自定义TabBar组件系列总结与最佳实践

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow