|
不同于主成分分析( PCA)法,Partial Least Squares Discrimination Analysis,(PLS-DA)或 Orthogonal PLS-DA,(OPLS-DA)是一种有监督的判别分析统计方法。该方法运用PLS-DA建立代谢物表达量与样品类别之间的关系模型,来实现对样品类别的预测。分别建立两两分组比较的PLS-DA模型(图1)或OPLS-DA模型(图2),模型得到的参数评价会以表格形式提供。其中R^2X和R^2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,理论上R^2、Q^2数值越接近1说明模型越好,越低说明模型的拟合准确性越差,通常情况下,R^2、Q^2高于0.5 (50%)较好,高于0.4即可接受,且两者差值不应过大。临床样本由于个体差异大,不可控,尤其大样本时,R^2、Q^2大小为0.2左右亦可。图3则是对PLS-DA模型(c)的检验,直线的斜率大,Q^2的截距为X,说明PLS-DA模型没有过拟合。同时通过计算变量投影重要度( Variable importance for the Projection, VIP)来衡量各代谢物的表达模式对各组样本分类判别的影响强度和解释能力, 从而辅助标志代谢物的筛选(通常以 VIP值 > 1.0 作为筛选标准)(图4)。
注:红框所圈的点为VIP>1的代谢产物
How to order?