小弟是小白,用R语言的edgeR包分析了从TCGA数据库里面下载的一个肿瘤的count数据,通过edgeR分析确定了一个logFC=3点多,p<0.001的上调差异表达基因,然后呢想把它拿出来继续研究,于是把它单独拎出来,还是用前面的TCGA的数据,用这个基因在500多个癌症样本和40多个正常样本中的表达进行比较,做了一个小提琴图,出现问题了,发现做出小提琴图来以后这个基因在癌症组和正常组里面的表达没有差异,p=0.58。各位大佬,为什么会出现这种情况,是数据分析有错,还是因为edgeR和小提琴图的Wilcox检验的算法不同造成的?这样到底算它是不是差异基因啊?
还有就是我用TCGA数据里40多个正常样本,找到他们配对的癌症样本,对这个基因的表达在这两组进行配对t检验,发现是有意义的上调。
还有就是我用TCGA数据里40多个正常样本,找到他们配对的癌症样本,对这个基因的表达在这两组进行配对t检验,发现是有意义的上调。