自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 什么是富集气泡图?手把手教你看懂富集气泡图

气泡图共有四个维度来描述数据,x轴,y轴,点大小,点颜色。富集气泡图就是把富集结果的ratio,Term名称,富集条目个数,富集度或PValue,分别映射到气泡图的四个维度上。图形解释:1. 横坐标:Ratio。表示前景基因集中富集条目相关基因数量与背景基因集中富集条目相关基因数量的比值。2. 纵坐标: Term。显示富集条目的名称或描述,每一行代表一个富集条目。通常条目按照富集程度排序,方便观察哪些富集项更为显著。

2025-06-30 09:48:50 591

原创 什么是富集分析?手把手教你理解富集分析

富集分析是生物医学研究中,对差异基因进行功能解读的关键手段。它通过将差异分析得到的基因,与已知的生物学功能和通路信息进行比对,找出这些基因在哪些生物学过程、细胞组分或分子功能中显著聚集 ,从而揭示基因与生命活动、疾病发生发展的关联。这一分析基于众多专业数据库,其中 GO 数据库从分子功能、细胞组分、生物过程三个层面描述基因功能;KEGG 数据库聚焦代谢通路和信号转导通路;此外还有 Reactome 等提供更丰富视角。

2025-06-16 11:31:49 896

原创 什么是核密度图?手把手教你看懂核密度图

核密度图(Kernel Density Plot)用于展示数据分布。曲线下面积为1核密度图本质上频率分布直方图的拟合曲线,通过更为平滑直观的方式来展示数据的分布。如A图所示。它通过对每个数据点周围的区域应用“核函数”进行平滑,以此来创建一个概率密度的估计。这样做可以更清晰地显示数据的分布形态,避免直方图那种因为分箱而产生的“断裂”感。图形解释横坐标:表示数据的值,通常是观测数据的具体数值(例如,年龄,基因表达量等)。为了观测清楚,很多情况下会做log转换。纵坐标:表示在该值上对应的概率密度。

2025-05-26 10:39:43 776

原创 什么是PCA分析?手把手教你理解PCA

PCA(principal component analysis)中文称作主成分分析。是一种降维方法。在生物学数据中,每个样本都有成千上万个基因的测量指标,每个基因就是一个特征(也可称为维度),因此该数据就有成千上万个特征/维度。我们肉眼无法对那么高维度的数据进行直观的观察,挑选几个最重要的维度可以直观地考察样本之间最重要的区别,这几个最重要的维度就是“主成分”。

2025-05-20 09:21:37 738 1

原创 什么是ROC曲线?手把手教你看懂ROC曲线

概念:ROC曲线用于评估二分类模型性能。它通过展示模型在不同阈值下的表现,帮助我们了解模型的效果。ROC曲线是通过绘制假阳性率和真阳性率的关系图,来反映不同阈值下分类器的表现。

2025-05-14 09:14:44 1347

原创 什么是相关性图?手把手教你看懂相关性图

概念:相关性是指两个变量之间的关系或相互影响程度。若两组的值一起增大,我们称之为正相关,若一组的值增大时,另一组的值减小,我们称之为负相关。其值介于-1与1之间,即越接近1,越正相关;越接近-1,越负相关。图形解释:右上区域为气泡图,气泡越大越相关。颜色越红越正相关,颜色越蓝越负相关。气泡上的*号是显著性标签,* (p < 0.05),** (p < 0.01),*** (p < 0.001)表示显著差异。左下角的区域是直接通过数字来表示相关性的大小。

2025-04-18 16:22:05 758

原创 什么是小提琴图?手把手教你看懂小提琴图

小提琴图,外层为核密度图,内层为箱线图。形似小提琴,故名小提琴图。是一种用来显示数据分布情况的统计图表。外层核密度图:它用来显示数据的密度分布,像是一个平滑的直方图,能帮助我们看出数据的分布情况。轮廓宽的地方说明这个数值范围内的数据比较多,窄的地方则表示数据比较少。内层箱线图:它展示了一组数据的五个统计特征:下限、第一四分位数(Q1)、中位数、第三四分位数(Q3)和上限。外面的黑点显示离群值的存在和分布情况。四分位数。

2025-03-21 08:50:34 1322

原创 什么是韦恩图?一文看遍所有种类的韦恩图

简单来说,用重叠圆圈表示不同集合的交集/并集。韦恩图(Venn Diagram)是一种用于展示集合之间关系的图形工具。它通过重叠的圆形来表示不同集合及其交集。每个圆代表一个集合,圆与圆之间的重叠部分则表示这些集合的交集。在组学中的应用场景:韦恩图常用于展示组内或组间的交集、并集情况,帮助分析和比较数据之间的相似性与差异性。通常,韦恩图展示2至4个集合最为合适,以确保图形简洁、易于理解。有没有发现一个问题,当集合个数超过4个时,已经很难看清集合的交并集关系。此时传统的韦恩图已经不适合了,那么该怎么办呢?

2025-03-06 16:15:05 2883

原创 什么是差异分析?手把手教你理解差异分析

差异分析就是,判断哪些基因在两组数据间存在显著差异。如图就是一份差异分析后的结果。从这份结果中,我们可以直观地看到各个基因的FC值、P值和FDR值。什么是FC?翻译成中文是差异倍数(Fold Change),也被称作Ratio。

2025-02-24 15:31:37 3134

原创 什么是箱线图?手把手教你看懂箱线图

箱线图(Box plot)是一种用来显示数据分布情况的统计图表。它展示了一组数据的五个统计特征:下限、第一四分位数(Q1)、中位数、第三四分位数(Q3)和上限。外面的黑点显示离群值的存在和分布情况。四分位数(quartile)是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。四分位数也被称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括 25%的数据,处在各分位点的数值就是四分位数。

2025-02-15 14:20:33 1367

原创 什么是热图?手把手教你看懂热图

如图,就是一副组学研究中热图的常用绘制模式,每个小方格表示每个基因在不同样本中的定量值,其颜色表示该基因表达量大小,红色为高表达,蓝色为低表达。行名称:通常为样本名称。列名称:通常为基因名称。图例信息:左侧图例表示热图表达量的颜色说明,右侧图例展示分组信息。热图绘制过程中通常会进行Z-score归一化处理,因此图例数据显示为0左右对称分布,这表示已进行Z-score标准化。列聚类:如果不进行聚类,列的排序将保持原始数据的顺序。通过聚类可以判断不同组别的样本是否被正确分组。

2025-02-07 15:44:53 5584

原创 单蛋白可视化的七个常见工具

单蛋白的可视化展示了蛋白质的氨基酸变异,翻译后修饰等信息,对于正确了解和推断蛋白的功能和变化有重要作用。

2025-01-07 11:23:54 1157

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除