当前位置:首页 >> 基础医学 >>

SIMCA-P


SIMCA-P,SIMCA-P+指南
11.0 版本 Umetrics AB

1992-2005 Umetrics AB
本篇文章诣在告诉本软件使用者一些该软件的注意事项,并且该文件并不 能作为 Umetrics AB 公司承担义务的一部分。该软件中的信息(包括所包含的 所有数据库) 均需要得到已公布或未公布的许可协议方可使用,并且必须在获得 许可协议的前提下方可以使用或拷贝, 在未得到已公布或未公布的许可协议下擅 自的进行软件的拷贝是一种违法行为,在未得到 Umetrics AB 公司书面许可的前 提下,该产品的任何部分不可以再次安装或以任何形式、任何传播方式(包括电 子传播方式、机械传播方式)进行软件的传播。 SIMCA 是 Umetrics 公司的注册商标, Windows 是 Microsoft 公司的注册商 标。 包括以下商品:SIMCA-P,SIMCA-P+ 编辑日期:2005 年 5 月 16 日

SIMCA 软件的启动
基本操作规程
基础信息
SIMCA-P 软件是以工程(projects)的形式来进行数据的建模处理。一个工 程就是一个包含着主要的数据集(dataset)分析结果(没有模型数量的限制) 的集合。 你可以通过输入数据(主要是数据集)来进行一个新的工程的建立。当你选 择活动模型类型(Active Model Type)并列举一个新的工作集或一个已经存在 的工作集时,SIMCA-P 软件将自主建立不合适的模型。 在一个工程建立的最初, 系统默认的工作集包含所有的数据,包含所有的居 中变量及方差的变化范围,并将其视作变量 X,并且模型是变量 X 的重要组成部 分。 一个工程窗口可以显示每一个模型的分析结果, 每一行数据及时对一个模型 的分析结果进行总结。 活动模型 (即所需要进行建模处理的模型) , 也可以在灰色区域 (status bar) 左边的显示框中显示,即在命令菜单的下方。 如果你想打开一个模型, 在工程窗口中双击该模型,将打开一个包含模型结 果所有信息(一行一个分类)的模型窗口。 另外一种激活模型的方法 (如果部分模型已经提供) 是从显示框中 (左上方) 选中该模型的名字。

数据分析流程
1、数据的预处理及数据的选择(数据集和工作集菜单) 2、数据集菜单将允许你进行数据的拟合、修改,产生新的变量,并且将对 原数据进行筛选及压缩。系统默认的工作集一旦被打开,里面将包含所 有作为自变量 X 及其方差范围的数据集。 新的工作集也将包含这些内容。 工作集菜单允许你对最初的工作集进行修改。 3、指定模型,并对模型进行拟合(分析菜单) 。 4、对结果进行核实并执行诊断(分析菜单) 。

5、使用模型进行预测(预测菜单) 。

基本数据的录入及新工程的建立
文档:新文档
从文档或数据库中选择所需要录入的数据。 SIMCA-P 软件可以录入以下格式的文档数据: DIF:数据互换模式(许多应用程序可以输出 DIF 格式的数据文档) 。 TXT:标准被限定的 text 文档(一行一个数据) TXT:任意形式的 text 文档(有无数据头均可) MAT:Matlab 4.0 版本文档(二进制) XLS:EXCEL 文档的所有形式 LOTUS 123:*.wkl 格式的文档 JCAMP-DX:*.jcm,*.dx,*.jdx 格式的文档 ANDI:色谱工作站 AIA 格式文档 NSAS:数据文档 GRAM:Galactic *.spc 格式文档 其他格式(参考第四章) :包括旧版 SIMCA-P 数据文档。

文档资源的选择
资源目录:包含数据文档的目录 名称:将资源文档,例如:ENVIRO.DIF 双击该资源文档的名称。 目标目录:该目录用于储存工程,例如:C/SIMDATA/ENVIRO 如果你愿意,你可以修改工程目录(目标目录)的位置。SIMCA-P 软件默认 资源目录作为目标目录。

文档内容的表示 为自变量和观察对象指定主要的和尽可能多的次要的检识符。

第二数据集

可能一会你还会录入一些额外的数据(第二数据集)以用于预测。你可以在 菜单 File/Import Secondary Dataset 中完成该操作。

显示 按照你习惯的方式进行软件显示格局的建立并保持工程水平选项及基本信 息的选项处于醒目位置。

数据的预处理(数据集菜单)
从数据集中进行变量及观测值的绘图 将你想要进行绘图的变量或观测值进行标记,右键点击标记的项目上,然后 选择想绘制的图像类型。 将所有的 X 的观测值绘制一个线形图,只需要右键点击这个数据集并选择 Plot/Xobs. 可以按如下步骤使用数据集菜单对一个 SIMCA-P 数据集进行观察或修改: Quick Info 将数据集中显示的变量或观测值按时间或频数的相互作用形式进行绘图。 Trimming/Winsorizing 单个或所有的变量 Edit dataset 基本的编辑命令。 Generate new variables 产生一个同已存在变量或模型结果中所获取变量组成相同的变量。 数据集。 使用以下命令进行数据光谱滤波: Orthogonal Signal Correction (OSC) Multiple Scatter Correction (MSC) Standard Normal Variates (SNV) 1st and 2nd Derivatives Wavelet transform and compression PLS wavelet transform of time series

Decimation of time series

数据的准备(工作集菜单)
在工程开始之初, 系统默认的工作集是包括在录入过程中定义为 X 自变量和 Y 自变量的所有的数据集以及计算出的方差值。关联的模型(不合适的)在 活动区域显示。 当你已经准备好了一个包含数据集所有基本数据的 PLS 模型 (系统默认) ,或者 PC 的 X 模型或 Y 模型。如果这正是所想要进行运算的, 你可以直接进入分析菜单。 如果想要获得一个包含被排除的变量或转化之后的变量或不同水平的变量 的模型,这就需要首先对工作集进行修正。 当你指定一个工作集 (选择 starting Workset New or As Model) 时, SIMCA-P 系统将自动产生一个不合适的模型。 工作集 新工作集 使用在录入数据过程中被定义为 X 和 Y 的所有基本原始数据集。 新模型 使用一个已经被选择的模型的工作集作为起始点。 按照如下步骤进行工作集的修改: 观测值 对观测值进行筛选(排除/留下),或者将它们分成不同的类别以进行分类。 变量 对 X/Y 变量进行定义、转换、计算等运算。 转换 转换变量值。 延迟 建立延迟变量(仅 SIMCA-P 有该项功能) 变量/变量组 选择变量,并指定类型。 选择所需的变量作为 X 变量、Y 变量或排除,对 X 变量、Y 变量或者需排除

的变量进行标记并且点击“Set”按钮。 扩展 通过进行加和、平方、立方运算对 X 自变量容量进行扩展。 运算标准 选择一个基本的运算标准(UV=??10 页)

选项 指定模型水平的选项。

处理模型(分析菜单)
选择模型类型 如果你的所有自变量均定义为 X 自变量,那么软件将默认将模型定义为 PCX 模型;或者你在录入数据的过程中将自变量均定义为 X 自变量和 Y 自变量, 那么系统将默认将模型定义为 PLS 模型。当工作集规范允许你进行修改时, 你可以对模型的类型进行修改,你可以将模型的类型修改成以下种类: PCX 仅含有 X 变量的 PC 模型。 PCY 仅含有 Y 变量的 PC 模型。 PC All 既含有 X 变量,又含有 Y 变量的 PC 模型。 PC Class 当你的观测值分成了多个数据类时,你所选择的一个数据类的 PC。 PLS 含有 X 变量和 Y 变量的偏最小二乘法回归数据处理。 PLS Class 当你的观测值分成了多个数据类时, 对所选择的一个数据类进行偏最小二乘 法回归处理。 PLSDA

当你的观测值分成了多个数据类时, 进行区别性的偏最小二乘法数据回归处 理。

模型拟合
自动拟合 由软件自动进行模型数据的拟合。 二主要分类 直接对两个主要分类进行数据处理,通常可用于对数据进行快速描述。 单一分类 每次仅对一个分类进行数据处理,这样无论该分类是否具有显著性意义,均 可以使每一个分类均进行数据处理运算。 移除分类 将最末分类移除。 自动拟合数据类模型 自动拟合或者将所有指定数据类模型中所有分类进行数据处理。 指定水平模型 指定一个模型作为基础水平或者最高水平标准。

拟合复查(分析菜单)
数据拟合结束后,所有的谱图及数据表均会在模型描述中体现出来。

拟合概要
1. 模型复查。 2. X 变量、Y 变量复查,将所有的变量进行累积拟合(PLS 中仅对 Y 变量进 行拟合) 。 3. X 变量、Y 变量排序:通过分类对一个变量进行拟合。 4. 分类的贡献值:模型中一个分类对拟合结果的贡献程度。 5. 主成分:t1 vs t2,t1 vs u1,等。 6. 荷载系数:p1 vs p2,w*c1 vs W*c2,等。 7. 系数(PLS) 8. 对工程影响最大的变量(PLS)

9. DMod(X 变量或 Y 变量)与模型(X 变量或 Y 变量)之间的距离。 10. 观测值 vs 预测值(PLS) 。 11. 剩余图像:正态图(选择 Y 自变量) 12. 观测值风险 注意: 在分析菜单中, 系统默认的所有图像及数据表为最后一个分类的相关 数据。如果你想选择不同的分类进行显示或选择一个不同的变量进行显示, 点击鼠标的右键并选择相关选项。 选择一个新的模型类型 在模型拟合完成后,你可以选择一个新的模型类型。SIMCA-P 软件将会分局 你所选择的模型类型生成一个新的未拟合的模型。例如,如果你已经将你的 工作集定义为 X 变量和 Y 变量,你可以先进行 PCY 拟合,然后将模型的类型 改为 PLS,并且可以获得一个和原数据一样的 PLS 拟合模型(另一个模型) 。

预测值(预测菜单)
建立预测数据集 使用预测菜单/Specify Prediction set 命令从主要数据集或任何一个次要 数据集建立一个预测数据集。 你可以将预测数据集作为一个电子数据报表或 图形或数据表结果来显示。 当你没有指定一个预测数据集时, 系统默认的预测数据集为首要数据集中的 所有数据。 你可以通过首要数据集中或者任何一个你所录入的次要数据集中的观测值 建立一个预测数据集。当你在电子数据报表中建立预测数据集时,你还可以 通过键盘向预测数据集中录入数据。 预测值显示 所有的预测值结果(主成分、Y 值等) ,均是以图形或数据表的形式进行显 示。

图形、数据表
在这个菜单下,你可以找到常规的图形和数据表程序。通过这个菜单你几乎

可以对任何数据和分析得出的结果进行绘图或制作数据表。 这个菜单可以为你提供: 散点图 (scatter) 、 线形图 (line) 、 柱形图 (column) 、 3D 散点图(3d scatter) 、柱状图(histogram) 、等值图(contour) 、3 维 等值图(response surface) 、正态概率图(normal probability plots) 、 小波处理图 (wavelets plots) 、 控制图 (control charts) 和 batch control charts。 注意: 点击鼠标右键可以显示一个活动的图形或数据表。你可以通过图形获 得数据表,也可以通过数据表得到图形。

SIMCA-P 分析流程图
1、建立工 程,导入数 据,指定行 列标识。 2、数据显 示,了解数 据信息,做 预处理。 3、建立工作集, 选择数据,定义变 量类型。

4、拟合模型,选 择拟合模型。

5、图示结果。

6、识别特异 点、检测特 异点、建立 新工作集。

7、深入分析 无特异点, 深入挖掘信 息。

8、预测分析 指定预测数 据集,进行 拟合分析。

批次工程(SIMCA-P+ 10)
基本信息
一个 SIMCA-P 的批次工程是由两个或两个以上相互关联的工程所组成的。 在工程批次的变换过程中,工程水平的观测值包括每个批次的观测值及变 量值均被衡量,并且批次的水平有已完成批次所决定。批次水平工程的变 量是主成分,或者每个时间点观测值水平的最初的变量具有重要意义。批 次可能会被划分为数个阶段。 观测值水平工程 依照批次信息,你首先录入观测值水平信息并建立一个观测值水平工程。 在这些信息中,你必须有一个批次的标示符,指出起始批次和终止批次。 如果存在批次阶段,进而存在阶段标示符。你可能还要有一个用于指出批 次或阶段变化进展及终点的变量,这个变量可以是时间或者成熟度。在不 同的批次阶段你可以拥有不同的成熟度变量。 当批次被划分为阶段时,SIMCA-P 软件将秘密的产生一个未拟合的批次模 型,即以时间或成熟度作为每一个阶段 Y 变量的 PLS 数据类模型。软件默 认一个阶段中的所有变量均为方差值。 对于每一个模型,模型的结果在工程窗口中以线形图的形式表现。 当批次值出现阶段值时, PLS 批次数据类模型将被聚类并以 MBxx 进行命名, xx 是一串连续的数字。 你可以在控制图中显示数据分析结果,要么作为主成分点、DModX、预测时 间值或成熟度值,或者作为个别变量。 次要数据集可以录入新的批次,这些可以通过相同的方法在控制图中得到 展现。 批次水平工程 批次水平工程是以完成批次的主成分点或起始变量为基础,从观测值水平 工程中获得的。 批次水平工程师 SIMCA-P 软件的一个常规工程,当批次最初条件及质量变

量存在时,软件将自动将其加入到批次水平数据集中。你可以将系统默认 的模型类型(PCA)改变成只要是工作集说明允许条件下任何你所想到的类 型。

分析周期
观测值水平工程 13、预处理并选择数据(数据集和工作集菜单) 6、数据集菜单允许你 trim/Winsorize 你的数据,产生新的变量并且进行 数 据 的 光 谱 滤 波 ( spectral filtering ) 或 者 小 波 压 缩 ( wavelet compression) 。模型由软件默认的工作集发展而来,系统默认的工作集 由 PLS 批次数据类模型组成。 7、对观测值水平模型进行拟合(分析菜单) 。 8、对结果和诊断操作进行复核(分析菜单) 。 9、批次控制图用于批次值的设置(分析菜单) 。 10、录入一个具有新批次的次要数据集并且使用该模型在控制图中显示这 个新的批次(预测菜单/Batch Control Chart) 。 批次水平工程 11、建立一个批次水平工程(文件菜单/Create Batch Level project) 。 12、对批次水平工程进行数据拟合。 13、使用主成分图(score plots) 、载荷图(loading plots) 、DModX、贡 献值图(contribution plots)等进行结果阐述。 14、预测并阐述新的批次数据处理结果。

介绍
基本信息
这篇引文仅仅是 SIMCA-P 软件的一个大致介绍。建议使用者阅读相关章节 (包括模型的建立、 数据的录入、 PC 和 PLS 模型建立、 数据处理结果的阅读) , 从而获得一个更加详细的该软件的使用说明,同时为了使使用者更好的使用 该软件,建议使用者使用 USER’S GUIDE 和 ON-LINE HELP 系统。 在这篇引文中为使用者列举了以下 5 个时例。 第一个例子是关于食品数据的模型处理。 第二个例子是从一个矿物整理车间所选取的一个真实数据处理过程。 第三个例子是分析化学中经常遇到的多变量校准的数据处理。 第四个例子是解释分级模型建立。 第五个例子是说明光谱滤波的使用。 第六个和第七个例子是展示如何进行有阶段和没有阶段批次型数据的模型 处理。 作为一篇指南, 在这儿给使用者提供的仅仅是 SIMCA-P 软件的一些主要的常 用功能和图表。我们建议你继续使用你自己的数据,参照这篇指南获得相应 的数据分析结果。帮助系统包含和指南相同的信息,只是排版的方式不同。

图形与数据表
你可以使用大量的图形和数据表来展示 SIMCA-P 软件处理结果。 分析菜单和预测菜单中的结果均是通过图形和数据表的形式进行展示。 通过 图表菜单, 你可以根据每一个模型中的数据和计算值进行图形及数据表的绘 制。你甚至可以将不同模型中的矢量进行绘图。 所有的矢量数据均可以进行 Auto 、 Cross Correlation plot 和 Power Spectrum 处理。 数据集中,你可以通过 trimming and winsorizing 操作对数据进行预处理。 显示变量图(Quick info plot)均提供全部的显示数据表(spreadsheet)。

食品
数据
数据的收集通常是以表格的形式来进行开展的,但是如果不能获取有用的 信息,数据表格是一点用处都没有的。图解可以使数据表格中的数据更好 的表达。下面的例子将阐明工程的要素。这个例子中的数据来自欧洲多个 国家不同的食物消费情况。 变量 所选择的变量反映了国家之间不同的传统和文化。 观测值 选取了 16 个欧洲国家。 数据表 见 EXCEL FOOD。

目的
这项研究的目的是为了调查工业化国家之间的食品消费的差异与文化和传 统之间的联系,并且因此发现这些国家之间的相似处和不同处。因此这些 数据收集了 20 个变量和 16 个国家。 这些数据显示了这 20 种食品在日常家 居生活中的储备的百分比。 分析概要 SIMCA-P 分析的步骤如下: ·录入数据集 ·数据准备(工作集菜单) 。 ·PC 模型拟合、拟合过程复核(分析菜单) 。 ·结果说明(分析菜单) 。

工程定义
启动 SIMCA-P 软件并建立一个新的工程,点击 FILE/NEW。

选择数据类型(XLS)或 ALL Supported Files(系统默认),并找到所需的

数据集(FOODS.XLS) 。数据可以从你的硬盘或者网络驱动中被录入,数据 可以以不同的格式被录入,所以选择最合适的格式或者 ALL Supported Files 格式。在这个例子中所选的数据是通过 EXCEL 所建立的一个 XLS 格 式文档。 如果你的数据在一张软盘上,我们建议你首先将数据拷贝到硬盘上。 如果你想关闭正打开的工程,点击 Close Current Project. 注意: 所需录入的数据集可以被放置在一个可以获得的目录内的任何地方。 无需将它放置在你所定义的目的目录中。 当你点击 Open,SIMCA-P 软件将打开 Import Wizard 界面。

SIMCA-P 软件已经识别出这个例子具有观测值的数量和名称以及变量的名 称,并将它们使用不同颜色进行了正确的标记。

当你点击“Next”后,工程说明界面将打开。你可以修改工程的名称和储 存目录。 勾选“Use workset Wizard”项,并点击“Finish”

Workset Wizard
“Workset wizard”界面打开后,将引导使用者进行工作集的建立和模型 的拟合。

选择变量界面, 可以获得哪些变量是 X 变量,哪些变量是 Y 变量以及哪些变量需 要被排除。 如果你对变量进行了标记并点击了“转换(Transform) ” ,软件将进行检查并提 供相应的转换公式(Log 转换) 。 本例中,所有的变量均为 X 变量且无需进行转换,点击“Next”

在这个界面中,你可以选择你所需要的观测值(排除你不需要的观测值)或将观 测值分为数据类。数据类设置通过观测值的 ID(使用一个选择的任何一个观测 值 ID)自动进行数据类的设置。 本例通过使用主成分分析(PCA)得到一个数据表的综述,所有的观测值均被包 含在内并未进行数据类的指定。点击“ Next ”打开一个简要说明界面,点击 “Finish”进行模型的拟合。

分析
简要的模型拟合图形以 R2X(cum)形式和 Q2(cum)形式进行展示。 双击“model summary line” ,简要的拟合模型就以 R2X(cum)和累积 R2X(cum) 、 Q2 和 Q2(cum)及固有值的形式进行展示。食物的变量按照预期计划的已经被三 个新变量相互关联并进行了平行的简化,分数说明解释说明 65%的变化。

主成分和荷载值
主成分 选择“Analysis/Scores/Scatter Polt”选项或快捷键 进行 t1 vs. t2 主成

分图形的展示(系统默认) 。在“Label Types”界面,一定要选择第二检识符 “Onam” 。

椭圆区域代表 95%的置信区间。 主成分 t1 和 t2(代表着分类 1 和分类 2 的矢量)是通过对最初所有变量进行线 性回顾拟合所得到的两个新变量,以提供一个更佳的概况信息。 最初变量的权重(weight)称作荷载值(p1 和 p2) ,见下文。 主成分图展示出三组国家类型。一组是斯堪的纳维亚人国家(北面) ,第二组是 欧洲南部的国家,第三组是分布更加广泛的欧洲中部国家。 通过变量值对不同的观测值(国家)进行着色,点击右键,打开“properties” 窗口,依次选择“color” “by categories” ,并且在“variable”下拉菜单下选 择变量(本例中选择蒜头 garlic) 。在“split range”窗口,输入 4。

如果想要按照需要进行“split range”的修改,点击右侧的文本框。

南北方的欧洲国家蒜头的食用量存在着明显的区别。 荷载值 选择“Analysis/Loading/Scatter Plot”来显示荷载值 p1 vs. p2。 荷载值是结合了 X 变量主成分(t)的 X 变量的权重值。这个图形体现了哪些变 量描述国家之间的相似处和不同处。

斯堪的纳维亚人国家主要吃脆面包(crisp bread) 、冻鱼(frozen fish)和蔬 菜 (vegetables) , 而南方的欧洲国家主要吃蒜头 (garlic) 和橄榄油 (olive oil) , 中部的欧洲国家(尤其是法国)消费大量的酸奶酪(yogurt) 。 第三分类 主成分图(t1 vs. t3)和荷载图(p1 vs. p3) 。第三分类解释数据中 13.8%的 变化, 并且主要体现英国和爱尔兰两国茶叶 (tea) 、 果酱 (jam) 、 罐头汤 (canned soup)的高消费情况。

小结 总而言之, 一个拥有三个主要的潜在变量数据的三分类模型描述了所要调查的欧 洲国家之前主要的食品消费的差异。 这个例子展示了通过一个简单的 PC 模型拟合可以得到了原始数据表的一个概要 信息。使用者应该使用自己的数据信息进行更多的尝试。

LKAB 车间矿物分类
介绍
下面的例子来源于瑞典的一个矿物分类车间。是由 LKAB 公司调研工程师 Kent Tano 负责这项调查。 在这个过程中, 原铁矿将通过多项研磨措施分为优质材料(<100mm,50%Fe) 。 研磨结束后, 这些材料将通过磁性分离器经多个步骤进行分类并集中。分离 流程被分为多条平行的流水线, 并且这里还有着反馈系统, 以获得高含量铁。 被集中的材料将被分为两个部分,一个部分(PAR)用于送往进行浮动处理, 另一个部分(FAR,优质)以铁矿石形式进行出售。所有的这些产品均需要 含有很高的铁含量。 十二项工序因素被指定。 这些因素里,有三个重要因素被用于建立统计学设 计(RSM) 。每个实验的结果均由 6 个反应变量进行衡量,每个设计点均收集 了许多观测值。 这个工序配备了一个带有 SuperView 900 数据处理系统的 ABB Master 系统。 从 ABB 系统中将数据先转移至个人电脑中, 并使用 SIMCA-P 软件进行模型数 据处理。 建立的模型再转移回 SuperView 系统中并对工序进行在线监测(预 测值、主成分和荷载图) 。这项调查开展于 1992 年。该工序的多变量在线控 制方法至今仍在使用,并能取得十分好的产品质量结果。

数据描述
以下是变量和观测值的描述。

变量
18 个变量的信息均被收集。 工序变量(X)

Explanation 1 2 3 4 5 6 7 8 9 10 11 12 Total load Load of grinder 30 Load of grinder 40 PARmull Velocity of separator 1 Velocity of separator 2 Effect grinder 30 Effect grinder 40 Ore waste Load of separator 3 Waste from grinding Total waste

Abbr. TON IN KR30 IN KR40 IN PARM HS 1 HS 2 PKR 30 PKR 40 GBA TON S3 KRAV F TOTAVF

RSM Design

Design Design

因变量(Y) Explanation 13 14 15 16 17 18 Abbr.

Amount of concentrate type 1 PAR Amount of concentrate type 2 FAR Distribution of type 1 and 2 r-Fe FAR Iron (Fe) in FAR Phosphor (P) in FAR Iron (Fe) in raw ore %Fe FAR %P FAR %Fe malm

观测值
一个包含 231 个观测值的小集合用于模型的建立。 每一个观测值均有一个和数据 采集时间相关的名称。

数据表
收集的数据见表 1(略) 。 这项研究的目的是为了调查工序变量与描述最终产品质量的 6 个输出变量之间

的联系。

离线分析
因变量概述
一个因变量 PC 模型的建立是为了了解: ·因变量之间及因变量与观测值之间存在何种联系。 ·观测值之间的相似处和不同处及是否有异常值。 ·变量的阐述能力。

工序条件与因变量之间的联系
·了解并阐述工序变量与因变量之间的联系。 ·预测新的工序条件的输出值。

SIMCA-P 操作步骤
·工程定义:录入最初的数据集 ·数据准备(工作集菜单) 。 指定哪些变量是是 X 变量(自变量)和哪些变量是 Y 变量(因变量) 。 扩展 X 变量范围 (通过对三个设计变量进行平方和 “cross terms” 运算) 。 ·模型拟合,首先进行 PC-Y 模型拟合,再进行 PLS 模型拟合,并对拟合过 程进行复核(分析菜单) 。 ·精化模型(通过移除异常值) (工作集菜单) 。 ·使用 PLS 模型进行预测(预测菜单) 。

工程建立
启动 SIMCA-P 软件,并通过点击“FILE/NEW”录入数据。

找到数据集(SOVR.XLS) 如果你有 SIMCA-P+软件,选择“radio button”去建立一个正态 SIMCA-P 工程并

点击“Next” 。

点击“commands”键,建立变量索引来产生变量数字,并将他们用第二 ID 进行 标记。

对柱形数据(变量)PAR 进行标记,直至最后一个数据,使用箭头指示变量中的 一个, 然后从下拉菜单中将它们选择作为 Y 变量。这个选择作为系统默认的工作 集。 点击“Next” 。

“Import wizard”菜单打开。在工程说明界面中,你可以改变工程的名称和保 存目录的位置。 确认勾选“use workset wizard”并点击“Finish”键, “workset wizard”界 面打开。

数据准备
工作集向导 SINCA-P 默认的工作集由前一个数据集的所有的观测值和所有的变量组成,以录 入数据过程中指定的 X 变量和 Y 变量及方差进行衡量。

点击“Use Advanced Mode”和“Expand”键进行 X 变量的扩展(平方及 cross terms) 。

因统计设计支持一个完整的二次模型,因此 TON IN、HS 1 和 HS 2 这三个变量均 进行了转化。我们将通过对这三个变量值进行平方及“cross terms”运算来扩 展 X 变量的内容。 标记 TON IN、HS 1、HS 2 这三个变量,点击“Sq & Cross”键,这三个变量的” 平方”及“cross terms”转化值均在“expand”栏中列出。 点击“OK”离开工作集菜单。

数据分析
通过对 Y 变量进行 PC 模型拟合处理(PCY) ,首先得到一个因变量(Y 变量)的 概述。

Y 变量 PC 模型拟合 当你退出工作集菜单后,一个未拟合的模型(M1)以 PLS 模型的形式被建立(系 统默认的工作集包含 X 变量和 Y 变量) 。点击“Analysis/Active Model Type” 选择“PCY” 。模型的类型即改变为 PC-Y。点击“Analysis/2 First Components” 来进行 2 个分类的 Y 变量 PC 模型拟合操作。

模型概述图打开。

点击“model summary”行,打开一个带有拟合模型概述的表格。这个表格显示 有 R2X(每个分类所说明数据变化的部分) 、累积 R2X(cum)以及固有值和 Q2、 Q2(cum) 。6 个 Y 变量均被相互关联,并使用两个新变量进行概述,即主成分 t1 和 t2,说明 70.9%的数据变化。

主成分和荷载值

主成分
选择“Analysis/Scores/Line Plot”打开一个通过线将点与点相连的主成分图 t1 vs.t2 图。在“Label Types”菜单中标记“Use identifier Obs ID” 。

主成分 t1 和 t2 是根据六个因变量的线性组合计算而来的并用于对 Y 变量进行概 述。 主成分图显示不同组别的观测值集合。每个组代表一种实验设计调整。这些调整 (设计点)程序均需运行一段时间以达到稳定状态。程序数据的测量(主成分图 中的观测值)每分钟进行记录。未出现显著的异常值。

荷载值
选择“Analysis/Loading/Scatter Plot”来显示荷载值 p1 vs. p2。 在“Lable Type”菜单中点击“Use Identifier/Var ID(Primary)”并点击“Save AS Default”,从而可以一直显示变量名称。

荷载值是包含了主成分 t 的变量的权重值。荷载值 p(被选择的 PC 分类)代表 了变量对该分类的贡献值,并显示出变量之间的关联结构(本例中为 Y 变量) 。

在这个图中我们可以看出 PAR、FAR、%P FAR 之间存在正相关性,并与%Fe FAR 之间的负相关性。r FAR 支配第二分类,与 PAR 呈负相关并与第二分类中的其他 变量仅存在一点相关性。%Fe Malm 与前两个分类中的所有变量均没有相关性。 点击“Analysis/Next Component”,运算出第三个分类。显示荷载值 p1 vs. p3。 第三个分类(说明 22%数据的变化)由%Fe Malm 支配。在第三个分类中%Fe Malm 变量与%Fe FAR、r FAR 和 FAR 三个变量存在较弱的正相关性,与其他的变量几 乎没有相关性。

因变量简要概述
为探测到异常值。所有的因变量均参加到模型处理过程中,并且彼此之间存在着 相关性,除了%Fe Malm(与其他三个变量仅存在一点相关性) 。

PLS 模型
主要目的是建立一个自变量 X 对输出因变量 Y 影响的预测模型。 实验设计以三个程序变量说明对因变量 Y 变化的重要影响。 新模型类型 点击“Analysis/Active Model type”选择“PLS” 。 另一个未拟合的模型 M2 被建立,并且你以完成 PLS 模型拟合前的准备工作。

自动拟合 点击“Analysis/Autofit”或点击快捷键 合。 模型概述图中显示有:R2Y(cum) ,模型每次进行分类后对所有因变量 Y 变化进 行说明部分; Q2 (cum) , 可以通过模型的交叉验证进行预测因变量 Y 变化的部分。 R2Y(cum)和 Q2(cum)接近 1.0 说明模型建立完美。 ,进行具有交叉验证的 PLS 模型拟

双击“模型概述”来打开一个包含每一种分类的模型数据表。 目前这个模型建立十分好,可以说明 80%Y 变量的变化并拥有 76%的预测能力 (Q2) 。 X/Y 概述 点击“ Analysis/Summary/X/Y Overview/Plot ” ,显示每一个变量的累积 R2Y 和 Q2Y 值。除了%Fe FAR 和%P FAR,所有的变量均有个不错的 R2 和 Q2 值。

主成分 t1 vs. t2 点击“Scores/Scatter plot/t1 vs. t2” 。使用 观测值 208 在第一分类中位置较远。 键标识远离中心的观测值。

主成分 t1 vs. u1 点击右键,在“properties”菜单中选择“t1 vs u1” ,并在“Label Types”菜 单中标记“ObsID(Primary)” 。排除观察值 208,可以得到一个很好的 X 自变量 (t1)和 Y 自变量(ul)关系。

贡献图 为了了解在第一个主成分(t1)中为什么观测值 208 远离其他的观测值,在“t1 vs. u1”图中双击“观测值 208” 。

贡献图显示了不同之处。衡量的单位:该模型中所有时间段,异常观察值 208 和正常(平均)观察值均以 w1*(在分类 1 中 X 变量的重要性)作为权重。

原始铁矿(TON IN) 、研磨负载(load on grinder)及其他变量均远远小于平均 值。检查数据发现,异常观察值 208 的 TON IN 和研磨负载变量为 0,明显导致 在 14:27 分出现一次程序紊乱(一个异常值) 。 模型精制 我们将移除观测值 208,留下一些观测值作为试验集(test set) ,并重新进行 PLS 模型的拟合。 使用“interactive tool box”移除观测值 208 在主成分图 t1 vs. u1 中,标记观测值 208,并点击红色箭头 。SIMCA-P

软件将把观测值 208 从工作集中移除并提示是否需要建立一个新的未拟合模型 M3。点击“Yes” 。

含有 M3 模型工作集的工作集界面打开,观测值 208 已经被排除。当你打开 “Dockable”窗口时,观测值 208 被标记“排除” 。

移动一些观测值作为试验集 在工作集窗口的 “Observation” 项下中, 按住 “Ctrl” 键并标记观测值 140-146、 173-179、350-379、551-555,然后点击右侧的“Exclude” 。 被删除的观测值任然标记在图中。

自动拟合
点击“Analysis/Autofit”或快捷键,对 PLS 模型进行重新拟合。 因模型被拟合,概述及模型概述图均被升级。注意 R2Y(cum)和 Q2(cum)值均 得到了提高。

X/Y 概述

点击“Analysis/Summary/X/Y Overview/Plot”来显示每一个因变量的累积 R2Y 和 Q2Y 值。 ·PAR、FAR 和%FE 的因变量均被很好的说明(90%或更佳)且其他的因变量 也得到了较好的说明。

t1 vs. t2 主成分图
点击“Analysis/Scores/Scatter t1 vs. t2”并显示 t1 vs. t2 图。我们将看 到观测值被分为多个组群,每个组代表一个实验设计的调整。

t1 vs. u1 主成分图 点击“Properties” ,将主成分改为“t1 vs. u1”

我们现在即可以得到一个很好的没有异常值的 t1 和 u1 的关系信息。

荷载值 w*c1 vs. w*c2
w*’s 是从主成分 t 中获得的联合了原始 X 变量(并不是用于和 w 对比的残留变 量)的权重。在第一次分类中,w*等同于 w。w*’s 与 X 变量与 Y 主成分 u 相关性 有关。具有较大值的 w*(正值或负值)均会与 u(Y 变量)产生较大的相关。 c’s 是用于从主成分 u 中结合 Y’s(线性)的权重。c’s 表达 Y’s 和 t’s(X 变量主成分)之间的联系。

在前两个分类中,PAR 和 PAR 均与其他的荷载变量表现出正相关,与 r PAR、%Fe FaR 和%Fe Malm 表现出负相关。除了 HS 2 外,该模型基本呈线性关系并且它的 平方形式支配着第二分类。

剩余变量的正态概率图
点击“Analysis/Residuals/Normal Probability Plot”,显示剩余变量的正态 概率图。

从图中看出,剩余变量基本呈现正态分布并没有异常值。点击右键,在 “Properties”界面中将不同的 Y 变量进行替换或改变选项。

参数

点击“Analysis/Coefficients/Plot”显示 PAR 的 PLS 回归参数(衡量单位和数 据)和置信区间(系统默认是 95%) 。支配因素是具有正效应的 TON IN,KR30 in, KR40 in 和 Ton S3。使用“Property”界面改变因变量或分类。

变量重要性
点击“Analysis/Variable Importance” 。这个图将显示模型中因素的重要性, 以它们和 Y 值(所有因变量)的相关性和 X 自变量的近似值。

至模型距离(Distance to the Model)
点击“Analysis/Distance to the Model/X Block” ,显示在 X 变量空间内的至 模型距离(观测值与超平面(hyper-plane)之间的距离) 。 这些距离均处于标准化的单元且与“row residual standard deviation”相同。

观测值风险
点击“Analysis/Observation Risk” 。

这个图显示了每一个 Y 变量和 Y’s 的观测值的风险值。 对具有巨大观测值风险的观测值 349 使用“图形伸缩(zoomer)”,可以得到以 下图形。

Y Far 的观测值 349 在未包含训练集(training set)时比包含观测值在内的模 型具有一个更大的 Y 残差;因此说明它的预测不准确,存在风险。 以下的数据表显示观测值 349 在和不在模型中 Y(Far)的残差。

预测
我们可以使用模型对试验集观测值的输出值进行预测。 点击“Prediction/Specify Prediction set/Specify” 。从预测集(Prediction set)中移除所有的观测值。在左边的窗口中选择“Workset Complement”,点击 “Select All”并使用箭头将所有的观测值移入左边的窗口中。 对观测值 208 进行标记,并点击“Remove”将其移出预测集。点击“Apply”并 关闭该对话框。

点击“ Predictions/Y Predicted/Scatter plot ” 。 PAR 的观测值与预测指表 (Observed vs. Predicted)即表示出来。

对于 PAR 和 FAR(从“properties”菜单中选取)变量,我们可以得到一个很好 的预测值,其他的因变量可以得到一个较好的预测值。 见图 DModX(预测菜单项下)

小结

这个例子显示出: 在数统设计中可以给出高质量数据的主要工艺变量可用于建立 很好的预测工艺模型。 通过多变量分析,我们可以将这些信息以数据的形式进行 输出和展示。

NIR
介绍
下面的这个例子来源于瑞典的一个关于泥炭的研究项目。 泥炭是由微生物对植物 进行缓慢厌氧分解而得来的。瑞典的泥炭(主要指北半球)主要是由泥炭藓和苔 草属的草类所组成的。两大类的植物中又存在着许多的种系,由于地点、气候等 因素的影响,还有一些其他的植物参与到泥炭的形成过程。 在这个项目中, 使用了许多不同种类的化学分析方法来获得关于泥炭材料的具体 信息, 并且还对不同品种泥炭之间的区别进行了调查。化学分析法采用传统的分 析方法(GC、HPLC 等) ,这些方法通常较为艰难且消耗时间。为了加快样本的分 析速度,近红外光谱(NIR)和许多多变量标定方法得到了引进。这个平台最后 发现运行的十分好, 在标定阶段后,样本的分析时间由原来的数星期变成了数分 钟。 在这篇引文中,我们选择了一个代表瑞典传统泥潭变化的样本的子集。

数据
变量 变量 1-19 代表了近红外光谱仪的光谱数据, 在本次项目中使用的是 19 个管道过 滤器的仪器。光谱数据均以 Log(吸光度)的形式进行记录,然后通过 MSC 程序 进行正确的分散。 变量 20-46 代表来了不同的化学分析结果, 这些结果可与近红外光谱数据进行校 对。 Var.No. Type 1-19 20 21 22 23 24 X Y Y Y Y Y Name NIR Rhamnos Fucos Arabinos Xylos Mannos Explanation Log Absorbance Mono saccharide Mono saccharide Mono saccharide Mono saccharide Mono saccharide

25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46

Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y

Galaktos Glukos Klason 1 Bitumen Aspargin Threonin Serin Glutamin Prolin Glycin Alanin Valin Methionin Isoleucin Ieucin Tyrosin Fenylalanin Histidin Lysin Aginin Glucose-amin Galactos-amin

Mono saccharide Mono saccharide Klason Lignine Bitumen Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino acid Amino sugar Amino sugar

变量 27(Klason)是克拉松木素(水解后产物) 。变量 28 是沥青,代表着丙酮 中可溶性碳水化合物。 观测值 从大量的泥炭样本中选出了能代表瑞典泥炭主要变化的 41 个样本。 这些样本 (观 测值)的名称均使用 20 个字母进行编码。名称中的每一个位置均包含着特定的 信息。在图形中通常使用两个字母的字串(位置 6、位置 7) 。位置 6 的字母代表 着腐败的程度,L(低) ,M(中) ,H(高) 。位置 7 代表着泥炭的种类。S(泥炭

藓) ,C(苔草) 。

目的
这个项目的目的是建立数据处理模型并直接由样本 NIR 谱图信息预测出泥炭样 本的不同组成。41 个泥潭样本(主要是泥炭藓和苔草)均进行了 NIR 谱图测试。 红外谱图通过一个单设仪器以 19 个波长(19 个过滤器)的形式被记录下来,并 在分析前得到了正确的分布。 为了达到这个目的, 我们需要建立一个关于 X 变量 (NIR 谱图信息) 和 Y 变量 (传 统方法所分析处泥炭的组成成分)的 PLS 模型。

离线分析
·建立一个关于 X 变量和 Y 变量的 PLS 模型是为了了解和阐述光谱图(X 变 量)和泥炭组成(Y 变量)之间的联系。 · 为每一种类型的泥炭 (泥炭藓型和苔草型) 建立独立的 PLS 模型, 以便于: 1)提高标定的精密度。 2)可以用于分类和预测泥炭的类型。 SIMCA-P 软件按以下步骤进行操作 ·工程定义:录入最初的数据集。 ·数据准备(工作集) a) 指定哪些变量作为自变量(X)及哪些变量作为因变量(Y) 。 b) 变量转换 因变量是泥炭化学组成的集合,且这些变量无线性关系,因此需要进 行 Log 数据转换。 (logY+0.1)0.1 是为了确保在转换前所有的值均为 正数。 c) 按照泥炭的类型(泥炭藓型和苔草型)将观测值分为 2 个数据类。 ·模型拟合,所有的数据均进行 PLS 拟合(分析菜单) ·为每一个泥炭类型(泥炭藓型和苔草型)建立一个 PLS 模型。 ·使用 PLS 模型进行预测和分类(预测菜单) 。

工程建立
打开一个新的工程。数据集的名称为 NIRKHAM.XLS。启动 SIMCA-P 软件并通过 “FILE/NEW”建议一个新的工程。如果你有 SINCA-P+,选择正常 SIMCA-P 工程, “Import Wizard”界面打开。

前两列是观测值的编号和名称,第一行是变量的名称。 对第一行数据进行标记,在“Variable IDs”框中点击“Secondary” ,建立一个 变量索引。 对“Ramos”至最后的变量进行标记,并通过组合框选择“Y 变量” 。

SIMCA-P 软件将这些变量定义为 Y 变量。 点击“Next”打开“工程指定”界面。你可以修改工程保存位置或工程的名称。 点击“Finish” ,数据集 Nirkham 已经被录入完成。

数据准备
默认工作集 SIMCA-P 的默认工作集由原始数据集中所有观测值及变量所组成,当你选择 “Workset/New”时,工作集启动。 变量转换 点击“Workset/New”并选择“Transform tab” 。 对所有的 Y 变量进行标记,选择 Log(C1=1,C2=0.1) ,并点击“Set” 。

观测值数据类分组 选择“Observation”框并显示所有的第二 ID。 右键点击“Primary ID,s”并选择“Observation”栏。

为了将观测值分为两个数据类,泥炭藓和苔草均点击“From Obs”选择“Obs Sec ID” 。

“Start position”中输入“7” , “length”中输入“1” 。

苔草被设置为数据类 1,泥炭藓被设置为数据类 2。 观测值 21(既不是苔草型又不是泥炭藓型)被设置为数据类 3。对它进行标记, 并设置“无数据类(no class) ” 点击 OK,并退出工作集窗口。

分析
当你退出工作集窗口后,一个未拟合的 PLS 模型(M1)已经被建立(系统默认的 工作集中包含 X 变量和 Y 变量以及数据类) 。在分析过程中模型的类型变为 PLS, 此时你已经准备好进行 PLS 模型的拟合。 所有样本的 PLS 模型

自动拟合
将模型的类型转变为 PLS 后,点击“Analysis/Autofit” 。当模型拟合完成后, 模型的概述图也将被更新。该图以组分的形式显示 R2Y 和 Q2Y 的累积值。R2Y 代 表着模型拟合后 Y 变量(因变量)的变化,Q2Y 代表着通过模型可以被预测的 Y 变量的变化。R2Y 和 Q2Y 值接近 1.0 说明建立了一个很好的模型。

双击“Model Summary”来显示相关的数据表。

由于高度准确的数据信息,多变量标定的近红外光谱往往可以指示出很多成分。 目前这个模型非常的不错并且它可以解释 88.2%的 Y 变量的变化,并拥有 73.9% 的预测能力(Q2) 。

总结:X/Y 概述
点击“Analysis/Summary/X/Y Overview/Plot”并显示每一个变量的 R2Y 和 Q2Y

的累积值。使用“Propertise”界面选择变量标签,并点击“Save as default Options”使每个变量一直有变量的名称,除了沥青外所有的变量均有一个很好 的 R2 和 Q2 值。

t1 vs. t2 主成分图
点击“Analysis/Scores/t1 vs t2 plot” 。使用“Marker”对异常观测值进行标 记,并使用“label button”键对它进行标记。 观测值 32 离第二主成分非常远, 提示就近红外光谱而言, 样品 32 存在不同之处。

观测值 32 和观测值 39 的谱图比较
将两个观测值均进行标记,点击右键并选择“Plot Xobs”来显示这两个观测值 的谱图。

主成分 t1 vs u1
通过数据的一些扩展,我们已经得到 X 自变量(t1)和 Y 自变量(u1)之间存在 密切的联系。

为了显示信息标签,在“properties”选择“Obs Sec ID” , “Start”框中输入 “6” , “length”框中输入“2” 。

主成分 u1 vs. u2
Y 区域(传统的化学分析)的样品工程未显示观测值 32 为异常值。较之具有较 大测量误差(3-50%)的传统分析方法,近红外光谱可以探测到十分细微的化学 成分(ppm)的变化,近红外光谱可以对样品进行更好的控制。

贡献值图
为了了解样品 32 为什么和其他值不同,在 t1 vs. t2 主成分图中双击观测值 32。

贡献值图中显示出了不同之处,对于模型中的所有时段中,异常观测值 32 和正 常观测值(或平均值)以 w*1w*2(X 自变量在主成分 1、2 中的重要性)进行权重 赋值。 在图形中,我们看出一些红外变量的标准偏差接近 8,提示样品中出现了污染, 我们将移除样品 32。

荷载值 w*c1 vs. w*c2
w*是结合了最初 X 变量(并不是与 w 比较后的残差)和主成分 t 中的变量。在第 一个主成分中,w*等同于 w。w*代表着 X 变量和主成分 u 中 Y 变量之间的联系。 具有较大值的 X 变量(正值或负值)代表着与 u(Y 变量)之间存在着很大的联 系。 c,s 是用于从主成分 u 中结合 Y 变量(线性) 。c,s 用于描述 Y 变量和 t(X 变量) 之间的联系。

该图显示出不同的化学成分与近红外谱图中不同部分的相关性。 图中展现出的荷 载值,每次一个组分,可能可以提供更多的信息。

荷载值:w*c1 柱形图
点击“Analysis/Loading/Column plot w*c1” ,该图显示近红外谱图中不同部分

的重要性,在第一主成分中将解释泥炭组分的变化。

移除样品 32 打开主成分图(t1 vs. t2) ,标记观测值 32 并点击红色箭头来讲样品从工作集 中移除。SIMCA-P 软件将把该样品从工作集中移除并建立一个新的未拟合的 PLS 模型。

泥炭藓和苔草独立的 PLS 模型 自动拟合数据类模型 。

点击快捷键对两个数据类进行模型自动拟合。 泥炭藓模型,数据类 2 注意数据类 2 中的模型, 泥炭藓中仅有一个没有显著意义的作为第二主成分的成 分。当我们移除第二主成分和第三主成分后,我们发现它有意义。我们继续移除 成分直至无意义。该模型具有 7 个显著性成分。

目前这个模型拟合的很好,其可以解释 86%Y 变量的变化并具有 41%的预测能力 (Q2) 。

总结:X/Y 概述 点击“Analysis/Summary/X/Y Overview/Plot”显示每一个因变量的 R2Y 和 Q2Y 的累积值。所有的因变量均具有很好的 R2 和较好的 Q2 值。

主成分图 t1 vs. u1 和 t1 vs. t2
这些图中均没有显示出任何异常值。 数据类 1 模型(苔草型) 具有 7 个成分的该模型并不像预测时的那么好,尽管它可以解释 Y 变量 84.4%的 变化,但是它仅有 12.6%的预测能力(Q2) 。

这主要归咎于苔草型泥炭中的碳水化合物没有泥炭藓型泥炭中丰富, 并且其化学 成分的变化十分的少。

主成分图 t1 vs. u1 和 t1 vs. t2
这些图中均没有显示出任何异常值。

预测
我们现在已经拥有两个很好的可用于描述近泥炭红外谱图和化学组成的模型, 并 且他们可以用于泥炭的分类(泥炭藓型或苔草型) 。 在这篇引文中我们并没有新的泥炭样品。 但是我们将使用数据集并通过这两个模 型对每一个样品进行分类。首先我们将移除样品 32. 建立一个预测集 系统默认的预测集是之前所有的数据集。 Cooman,s 图 从预测集中移除样品 32(Prediction/Specify Prediction/ Remove observation 32 from prediction set) ,并显示 Cooman,s 图。 该图显示模型中所有的观测值距离 M2 和 M3 模型之间的距离,并表现出泥炭藓 型和苔草型泥炭之间存在一个非常好的分界线。

样品 21 得到了正确的分类,其既不是泥炭藓型泥炭也不是苔草型泥炭。 总结 作为一篇引文,这些仅提供了 SIMCA-P 软件主要基本功能和图形的简要介绍。 我们建议你使用你自己的数据进行继续分析,并通过使用指南获得更多的信息。 帮助系统中将会提供和使用指南中相同的信息,但是排版的方式不同。 图形和数据表 你可以将 SIMCA-P 软件的结果以大量的图形或数据表的形式进行展示。 通过“Analysis 和 Prediction”菜单,拟合模型的结果将以图形和数据表的形式 进行展现。通过“Plot/List”菜单,你可以得到原始数据和通过每个模型所计算 出的值。你甚至可以将不同模型之间的参数适量进行绘图。

等级模型
介绍
这个例子将阐述多变量等级模型(PCA 和 PLS)的使用,即通过使用一个很小 的处理后数据集。 数据处理的详细内容因为所有权的原因未展示, 但是在以下的篇幅中展示了一个 概述。

数据
在这个工艺过程中, 原材料被结合并得到了一个由 8 个 y 变量来进行性质衡量的 产品。这些变量中的两个, y6=不纯程度, y8=产量(最重要的因素) 。 “进料” 由录入的 7 个 X 变量 (x1-x7) , 并且 18 个工艺的中间过程变量, 如反应 (x8-x15) 和纯化(x16-x25)均被提供。 这些数据每小时采集一次, 并且 92 个观测值组成。这些数据在观测值 79 之前都 得到了正常的记录, 但是在观测值 79 之后失去了控制,并在观测值 92 时停止数 据采集。

目的
为了了解这两个最重要的 y 变量(y6=不纯度,y8=产量)与工艺过程中的三个 步骤:进料(x1-x7) 、反应(x8-x15)和纯化及建立(x16-x25)之间的关系。 我们将按照以下步骤进行数据分析,使用观测值 1-79 建立一个训练集。 15、PLS model of X=feed(x1-x7) with y6 and y8(Block 1). 16、PLS model of X=reactor(x8-x15) with y6 and y8(Block 2). 17、PLS model of X=purification(x16-x25) with y6 and y8(Block 3). 18、PCA model of less important y(y1 to y7 not including y6)(Block 4). 19、Top level hierarchical model (最高等级模型) with scores of block 1-3 as X and scores of block 4 plus y6 and y8 as Y.

模型变量组 1-4 建立的目的是为了对工艺中的步骤进行概述(以数值的形式) , 然后用于最高等级模型中作为 X 变量。

分析概述
SIMCA-P 软件按以下步骤进行分析: ·通过录入数据集建立工程。 ·为 X 变量组 1-3(观测值 1-79)建立和拟合三个 PLS 模型,并将它们标记为 基础等级。 ·为变量组 4 建立和拟合一个 PC 模型,并将它标记为基础等级。 ·建立和拟合最高等级模型。 ·解释等级模型。 ·使用测试集(观测值 80-92)对等级模型进行验证。

工程建立
启动一个新的工程,数据集的名称为“procla.dif” 。 运行 SIMCA-P 软件并建立一个新的工程(FILE/NEW) 。 如果你有 SIMCA-P+,一定要选择建立一个正常的 SIMCA-P 工程。

按住“CTRL”键,标记 Y6+和 Y8+,点击“X variables”并选择“Y variables” , 将这两个变量标记为 Y 变量。

点击“Command/Create Index/Variable” ,建立一个新的变量索引。 点击“Next” 。现在你可以修改工程的名称和保存路径。点击“Finish” ,该工程 已经录入完成。

进料总结
工作集 选择“Work/New” ,在变量窗口中,使 x1 至 x7 变量作为 X 变量,y6 和 y8 变量 作为 Y 变量, 移除其他的所有变量。 右键点击变量的名称并对变量的 “secondary ID”进行标记,从而显示变量的数目。

在“Observation”窗口中,将观测值 80 以后的所有观测值移除,作为测试集。 点击“OK” ,退出工作集。 分析 自动拟合模型,模型窗口将打开,并按照模型拟合的类型进行信息的更新。一个 组分具有显著性意义。 “ Take 3 more component as the objective here is to summarize the X block (feed)” 。 双击“model title”并将该模型命名为“Feed” 。 双击“Summary line”来显示该模型的详细信息。

该模型可以解释 65%的 X 变量,因此模型 M1 对“进料(Feed) ”进行了很好的 总结。

主成分 t1 vs. t2
点击快捷键 显示主成分 t1 vs. t2。

观测值 1 是一个异常值,双击观测值 1,使用“Contribution tool”SIMCA-P 软件 将显示贡献值图。

将光标一致“x6in” ,显示数据集中“x6in”的值(-4.54) 。 “x6in”的趋势图(双击)中清楚的显示出在观测值 1 中存在一个异常值。 我们将使用“interactive marker”和“红色箭头”移除观测值 1,并对模型进行重 新拟合。

移除观测值 1 后对模型进行拟合

模型 M2 与模型 M1 十分的相似(确定有 4 个组分)并解释“feed”变量 64%的 变化。

荷载值 p1
荷载值 p1 是结合了原始的 X 变量和主成分 t1 中 X 变量的一个权重矢量。第一 个“dimension”解释了 32%的 X 变量(feed 变量) 。你可以将 t1 作为一个新的 变量,其用于对“feed”进行总结并可以解释 32%的“feed”变量的变化。点击 “Analysis/Loading/Column plot and p1”来显示 p1。

在“the frist dimension”中,除了 x4 和 x5 左右的“feed”变量均被 t1 进行了很 好的总结。

“反应(reactor) ”总结
工作集
准备一个以“反应(reactor) ”变量作为 X 变量(变量 16-23) 、y6+和 y8+作为 Y 变量的工作集。仅选择观测值 2-79。使用菜单“Workset/New as model M2” ,然 后在“Variable”窗口中选择变量。观测值 2-79 将被包含在内。 工作集应该看上去如下图所示:

点击“OK” ,退出工作集。

分析
点击“Auto fit”并添加两个额外的组分。

拥有 4 个组分的模型 M2 可以对 “reactor” 变量进行很好的解释, 其可以解释 76% 的 X 变量的变化。将该模型命名为“reactor” 。

主成分 t1 vs. t2
该图显示未出现明显的异常值。

荷载值 p1 vs. p3(最重要的 2 个组分)

“纯化(purification) ”总结

工作集
准备一个以“purification”变量为 X 变量(变量 24-33) 、以 y6+和 y8+作为 Y 变 量的工作集。仅选择观测值 2-79。 按模型 2 中操作,使用菜单“Workset/New” ,然后在“Variable”窗口中选择变 量。观测值将被校对。 工作集将如下图所示:

点击“OK”退出工作集,并对模型进行自动拟合。 该模型中有 4 个具有显著性意义的组分,可解释 65%的 X 变量。

第三个组分解释最多的 X 变量。点击“Analysis/Loading/Column”并选择 p3。

“less important Y 变量”总结

工作集
在“Workset/New”菜单中,选择“Variable”窗口,选取变量 8-12 和变量 14 作 为 X 变量。 仅选择观测值 2-79。工作集将如下图所示:

退出工作集窗口,并对 PC 模型进行自动拟合。 SIMCA-P 软件将提取 0 个组分,因为每一个组分具有显著性意义。添加三个组 分。

“等级模型”准备
右键点击模型 M2,选择“Hierarchical base model/Scores” 。 模型 M2 的主成分以一个新变量的形式被添加入工作集中。

对模型 3-5 进行相同的操作。这些模型均标记为 B。

高等级模型工作集
在“Workset/New” ,通过“selection All and Exclude”启动“Variable”窗口。 模型 2、模型 3 和模型 4 中的所有主成分作为 X 变量。 y6+、y8+和模型 M5 中的所有主成分作为 Y 变量。 选择观测值 2-79,点击“New/As model M2” 。

(继续,将上方的串口下拉)

退出工作集。

分析
自动拟合模型。 模型中具有 4 个可以解释 53%Y 变量的具有显著性意义的组分

在“Summary/ X/Y Overview”窗口中,显示 2 个最主要的变量 y6+和 y8+均得到

了很好的解释和预测。

高等级模型的主成分图(t1 vs. t2)

该图由 M6 模型 (副产品) 中的 y6+变量的值控制。 点击 “Plot Setting/Plot area from the pop up”菜单来显示图例。该过程以右侧具有较高数值的 y6+开始,逐渐下移 至具有较低值的左侧,然后经处理后得到一个更小的 y6+值(左上角) 。该过程 然后变得不稳定并逐渐返回右侧。

w*c 图

重要的 y 变量(y6+,副产品)在图形的右侧。与 y6+变量正相关的有“feed”的 第一个组分、 “reactor”和“purification”的第二组分。 我们还可以看出 y6+与模型 M5(less important Y 变量的总结)的第一个组分呈 负相关。 Y8+(产量)与“purification”的第一组份呈负相关。 通过使用“ contribution tool ” ,双击任何一个主成分变量点, “ corresponding loading”窗口将打开。该图将显示在那个主成分中重要的原始值。 例如 M3 模型 t2 与 y6+呈正相关。在 M3 模型第二组分的荷载值中,我们看到 变量 2、3、8 与 y6+呈正相关,变量 1、4、7 与 y6+呈负相关。

在“zoom out picture”中可以为我们提供一张放大图。在 wc 图形中我们可以了 解两个重要的 y 变量与工艺中的不同部分 (feed,reactor,purification) 之间的联系。 在荷载值图(Loading plot)中,我们了解到 feed、reactor、purification 中的哪一 个变量起支配作用及它与 y 变量之间的关系。 点击其他的主成分变量显示它们的荷载值。

参数(Coefficients)
点击“Analysis/Coefficients” 。

对于变量 y6+, 其支配变量为 M2 模型 (feed) 中的 t1 (第一组分) , M3 模型 (reactor) 中的 t2 和 t4(第二组分和第四组分) 。使用“contribution tool”并双击这些变量 中的任何一个打开参数荷载值图(corresponding loading plot) 。 例如:双击 M3 模型(reactor)中的 t4。

这儿我们又一次可以看出变量 3 的重要性(与 y6+呈正相关) 。

变量重要性(VIP)

对于所有的 y 变量而言, 最重要的变量是 “reactor” 中的 t1 和 t2 以及 “purification” 中的 t1 和 t2.你可以使用“contribution tool”来显示“参数荷载值(corresponding loading) ” 。

观测 vs. 预测

观测值 41 是一个异常值,并有一个极大的残差。 使用“contribution tool” ,双击观测值 41。

“purification”中的 t4 是犯罪变量。双击它,显示原始变量的贡献值。该图指出 是“purification”中的变量 6,由于它实在太小了。

数据集中的该变量的时间系列图(双击它)显示一个关于观测值 41 的异常值。

预测
确定模型 M6 (高等级) 是一个动态模型 (active model) 。 点击 “Predictions/Specify Pridictions set/Specify”来指定预测集,并移除观测值 1(异常值) 。记住观测值 2-79 组成了训练集。他们仍然在图形组成中任然被包含在内。

DModXPS

从观测值 80 开始,伴随着 DModXPS 迅速增加,工艺开始变得不稳定。 观测值 91(高 DModXPS)的贡献值图显示 feed(t2、t3 和 t4)是问题所在。

使用“contribution tool” ,双击“feed” ,所有的 3 个组分均指向变量 6。

趋势图证实了该变量存在问题。

主成分 tPS1 vs. tPS2(colored by test set and training set )

该模型是建立在观测值 1-79 的正常操作基础之上。 从观测值 80 开始的预测主成 分,使用红色进行标记,清晰的显示出此时工艺已经失控。

积累和图表(Cusum Chart)
点击“Predicitions/Control charts/Cusum”并选择“subgroup 1” 。

观测值 76 附近的贡献值图显示“feed”和“purifications”与出现的问题有关。

双击“feed”和“purification”显示“犯罪变量(culprit variables) ”

结论
多变量等级分析法极大的提高了我们了解复杂问题的能力。 逐步放大的能力使我们可以首先了解一个工艺中不同阶段组分之间的复杂关系, 然后对单独组分进行放大来分解不同阶段工艺变量中的详细信息。

红外滤波、压缩(包括 OPLS)
介绍
这个例子将阐述红外滤波和多变量标定微波压缩的使用。 最近增加的 OPLS 处理 法(正交 OPLS)也得到了证明。 该例中的数据集由瑞士的 Akzo Nobel 和 Omskolasvik 收集。他们纤维素衍生工 艺的原材料以纤维素薄板的形式运往工厂。这些薄板在进入衍生工艺之前,这些 薄板的质量由它们粘度系数的测量值进行控制。 在 NIR Spectra (近红外光谱) 数据集中, 180 个纤维素薄板在经过研磨后被收集。 因此近红外光谱数据均是纤维素原材料以粉末的形式进行测量所得到的。160 个 样品的光谱应用于标定模型的计算。选择出 20 个光谱用于模型的验证。

数据
数据有以下组分组成: X: “VIS-NIR(可见—近红外) ”区域 1201 个波长。 Y:纤维素粉末的粘度系数。

目的
该研究的目的是为了建立一个良好的含有 160 个样品的标定模型,并使用 20 个 样品用于该模型的验证。 我们将使用“orthogonal signal correction(OSC,正交信号修正)”方法来提升标定 模型,并且我们将通过“orthogonal wavelet(正交微波) ”对 X 变量的母集进行 压缩,从而提高运算的效率和速度。 经过 OSC 和微波压缩后得到的模型结果将于该模型的原始数据结果进行比较。 最后 OPLS 将运行相同的数据。

分析概述

·建立一个 NIR 光谱变量与最初粘度系数数据相关的 PLS 模型。 ·使用测试集对标定模型进行复核及验证。 ·对 X 变量母集进行 OSC 和“微波压缩”处理。 ·以 OSC 和“微波压缩”处理后的数据建立一个 PLS 模型。 · 对该模型进行复核及验证, 并将该模型结果与由原始数据组成的标定模型结果 进行比较。 ·最后,OPLS 开始运行,并将得出的结果与之前的分析结果进行比较。

SIMCA-P 软件按以下步骤进行运算:
·工程定义:录入原始的数据集。 ·数据准备(工作集菜单) a) 指定哪些变量是 X 变量,哪些变量是 Y 变量。 b) 移除 20 个指定的样本作为测试集。 ·对标定模型进行拟合,并对拟合进行复核(分析菜单) 。 ·使用测试集对模型进行验证(预测菜单) 。 ·在“微波压缩”后,使用红外滤波和 OSC(数据集菜单) 。 ·数据准备(工作集菜单) ·以红外滤波数据拟合一个 PLS 模型(分析菜单) 。 ·使用测试集对上述模型进行验证并比较结果(预测菜单) 。 ·返回至第一个工程(原始数据) ,并选择 OPLS(Analysis/Change model type) , 对模型进行自动拟合、预测(使用相同的预测集) ,并进行比较。

工程建立
使用“Malyx.mat”数据集启动一个新的工程。 启动“SIMCA-P”软件并定义一个新的工程名称(PILE:NEW) 。 该数据是一个“Matlab 数据” ,注意这没有变量的名称、观测值的数目和名称。

“ import wizard ”界面打开,如果你使用 SIMCA-P+ 软件,一定要选择标准 SIMCA-P 工程。 将第一列数据作为 Y 变量:在第一列的顶端框中,点击“↓”箭头,并从下拉 菜单中国选择 Y 变量(粘度系数) 。

点击“Next”来打开工程定义界面。你可以修改工程的名称及保存路径。点击

“finish” ,数据集“Malyx” (我们将其命名为 Malyx)就录入完成。

光谱绘图
数据集打开并激活后,点击右键并选择“Plot Xobs”来对光谱进行绘图。

所有的光谱均进行了绘图:

数据准备
工作集
SIMCA-P 软件默认的工作集由包含所有变量的原始数据集中的所有观测值组 成,使用方差进行“scale”并按照录入时的设定进行 X 变量和 Y 变量的定义。 当你选择“Workset/New”时,你启动了一个新的工作集。 Workset/New 工作集窗口打开,显示变量的名称、X 变量组或 Y 变量、scaling(系统默认是 UV)以及观测值的数目。

将 X 变量的 scaling 改变为 CTR(centered only)
点击“Scale”,对变量 2 至 1202 进行标记,选择“in Base Ctr”并点击“Set” 。X 变量仅被集中了,并没有被“scale” 。

移除作为训练集的观测值
点击“Observation”并对以下的 20 个观测值进行标记:4-5,18-20,30-34,100-104 以及 130-134,并点击“Exclude” 。

所有的这些观测值均从训练集中被移除。 点击“OK”并退出工作集菜单。

分析
当你推出工作集窗口时,一个未拟合的 PLS 模型(M1)已经被建立(系统默认 的是一个含有 X 变量和 Y 变量的工作集) 。你已准备好进行 PLS 模型的拟合。

PLS 模型
自动拟合
点击“Analysis/Autofit” ,或使用快捷键。 当模型拟合完成后,模型概述图也更新完成。

在模型概述栏(model summary line)中双击“project”窗口来显示组分的具体信 息。

2 R2 Y (cum) 值为 0.756, 其代表着被 7 个组分所能解释的 Y 变量的比例, Q( cum)

值为 0.686, 其代表着通过正交验证可以通过这个模型进行预测的 Y 变量的比例。

R2Y(cum)和 Q2(cum)接近 1 代表着模型建立非常好。对于一个标定模型而 言,模型 M1 是一个比较差的模型。

主成分 t1 vs. u1
点击“Scores : t1 vs. u1”来显示“t1 vs. u1”图。在样品 162—165 中,t1 和 u1 之间未存在很好的相关性。

对选择的观测值的红外数据进行绘图
按住“CTRL”键并对观测值 168 的左下及观测值 27 的右上进行标记,然后点击 右键并选择“Plot Xobs”来对红外数据进行绘图。

对图形进行放大,我们可以清晰的看见在两组光谱图中存在着“分隔” 。

荷载值
点击“Loading/Line plot” 。

移除 w*c1 系列,在“Item”的下拉菜单中选择 w*及“Comp”下拉菜单中选择 “*”并点击“Add Series” ,然后点击“OK” 。

组分 1 至组分 3 捕获了将近 60%的 Y 变量。其他的变量捕获量很少。打开 “properties”界面,对系列 4 至系列 7 进行标记,并点击“Remove”和“Apply” 来显示前三个荷载值。

200,400,700-800 及 900 左右的区域捕获了大部分的信息。 Distance to Model(Dmodx)

多个样品的“distance to the model”大于临界距离,意味着数据的不均一性。

观测值 vs. 预测值
对于 t1 vs. u1 图中的样品而言,预测值十分的粗劣。它们可以通过标记来进行标 识,然后点击“selected item”的快捷键并选择标签作为原始观测值标签。

放大这些点可以显示它们的标签

验证模型 1
点击“Predictions/Specify Prediction set/Complement Workset” 。 预测界面打开,点击“Predictions/Y Predicted/Scatter plot” 。

“The prediction are reasonable with an RMSEP of 110 compared to the training set RMSEE of 140” 。

正交信号验证和微波压缩
拟合较差的模型意味着 X 变量与 Y 变量之间的相关性较差。w*2 和 w*3 的相似 度值(荷载图的上方)也给予了确证。 我们将对于 X 变量(近红外数据)应用正交信号验证方法(OSC)来移除与 Y 变量无关的 X 变量,并且我们将对 X 变量使用微波压缩方法进一步提高运算的 速度和效率。

点击“Dataset/Specctral Filters/Combination/OSC-Wavelet”

第一个变量标记为 Y 变量,移除以下测试集中的观测值: 4-5,18-20,30-34,100-104,130-134,然后点击“Next” 。 SIMCA 软件将启动 OSC 并提取出一个组分,点击“Next”提取第二个组分(通 常情况下建议使用双组份) 。 两个组分之间的角度呈 90 °意味着正交性,并且在第二组分之后的“ the remaining Sum of Squares”值为 13%。 因此,87%的 X 变量与 X 变量无关,并已从 X 变量母集中移除。 点击“Next”运行“微波压缩” 。

“微波”窗口打开。选择“Daubachies 1.0 wavelet” ,选择“Variance ”作为压缩 模型,并选择 DWT(Discrete Wavelet Transform,分散微波转换) (近红外信号 平滑且对于低频信号建议使用 DWT) 。点击“Next” 。 微波转换开始运行,并且 SIMCA 软件显示一个关于变异百分比的图形(该图由 最大的系数解释) 。

我们将选择在数据框中保持 50 (输入 50) , 这 50 个参数将解释 99.93%的 X 变量 母集的变化。点击“Next” 。 SIMCA 软件将根据 OSC 和微波压缩数据建立一个新的工程。 你可以改变这个工 程的默认名称及保存路径。 测试集(移除观测值)均自动进行了信号验证和微波压缩,并被制作成了一个预 测集。你可以修改预测集的默认名称并点击“Finish” 。

你已经转换得到了一个新的工程。

信号校正和压缩后数据的模型
预处理工程总结
点击“Dataset/Filter Summary”来显示工程已经完成的预处理的总结。

更改系统默认的“Scaling”
点击“Workset/Edit model 1” ,选择“Scale 框”并对 1-50 所有的 X 变量进行标 记,并将“Scaling”改变为“Ctr” ,然后退出工作集窗口。 PLS 模型拟合 点击“Analysis/Autofit”

第一个组分解释非常少的变化, 第二个组分具有极显著意义。两个组分一共可以 解释 94%的 Y 变量,正交验证值为 93%。这是一个非常好的模型。

主成分 t2 vs.u2 显示 t1 vs. u2(t1 vs. u2,之前仅解释 11%) 。现在具有很好的相关性。

荷载图 w*2

该图已经被系统默认重建(from the wavelet domain to the original domain) 。该图 和原始数据模型一样,再一次显示了 400、700-800、以及 900 波长附近的谱图信 息。 观测值 vs.预测值

观测值 vs.预测值图质量较之之前未过滤数据的模型图已经得到了很大的提高。

验证模型 2
点 击 “ Prediction/Specify Prediction set/Dataset ” 并 选 择 你 的 预 测 集 。 点 击 “Predictions/Y Predicted/Scatter” 。

经过 OSC 处理后,测试集的预测值得到了很大的提高。 “RMSEP”值现在为 87。

OSC-Wavelet 结论
这个例子阐述了当信号中包含大量的与 Y 变量无关的系统变化(如基线漂移) , 正交信号校正(OSC)在一些时候可以极大的提高标定模型的质量。微波压缩将 1201 个观测值有效的压缩成 50 个观测值,并仅有非常少的信息丢失。

OPLS(Orthogonal PLS,正交 PLS 模型)
返回最初的工程 (Malyx) , 点击 “Analysis/Change Model Type” , 然后选择 “OPLS” 。

较之 PLS 的 7 个组分,OPLS 自动拟合后得到了 8 个组分。

返 回 最 初 的 PLS 模 型 并 添 加 一 个 组 分 (Analysis/next component 或

corresponding 快捷键)。注意现在 PLS 模型和 OPLS 模型均具有相同的 R2Y 和 R2X 值,但是 OPLS 模型体现出一个更高的 Q2(cum)值。 现在的模型窗口(下方)展示出: 第一行数据作为与 Y 变量相关的信号组分,并且 以下的均为 Y 变量的正交组分。所有组分之后的底部一行数据显示该模型的总 结。

主成分 u1 vs.t1 现在的 t/u 图形看上去要明显好于 PLS 模型中的 t/u 图,因为 OPLS 已经将所有 Y 变量相关的变异值均移至第一个组分中。

荷载值,w1 第一个组分的 PLS 权重现在看起来像与 Y 变量相关的谱图组分。这是 OPLS 的最 大的优点之一,即它可以使荷载值具有解释能力。

预测值 预测集仍然保持着原来的状态除非你对预测集进行了修改。在这种情况下,将预 测集重新保存为之前的状态,然后继续。 在“Prediction/Ypred/scatter plot”中,将显示下图。

RMSEP(prediction SD)值现在为 111.3,与原始的 PLS 模型的数值完全一样。 现在显示的通常是 OPLS 数据。

结论
OSC、Wavelets 和 OPLS 除了在 P 常规的 LS 模型处理中的用途外,它们还有一些 额外的特点。OPLS 可以使 PLS 模型更加容易解释——仅需一个组分和一个解释 性的荷载值图。Wavelets 可以在丢失极少量信息的前提下将光谱数据进行压缩; 并且有些时候(尤其在和 OSC 联用时) ,其甚至可以稍微提高预测值质量。

分批模型处理
介绍
下 面 的 这 个例 子 取 材于 J.MacGregor and P.Nomikos, “ Multivariates SPC Charts for Monitoring Batch Processes ” ,Technometrics Vol.37

No.1(1995)41-57. 一个批次的持续时间为 2 小时。在这段时间中,每隔 1.2 分钟就对 10 个变量进 行测量, 并一共进行了 100 次测量。 每批次测量结束时, 一个质量变量将被测量。 所有的数据由 55 个批次搜集而来。 40-42 批次和 50-55 批次拥有一个指定限定值意外的质量变量。38、45、46 和 49 批次的质量变量均在临界值附近。

变量
以下的 10 个变量均在各批次的处理过程中的相同的空间间隔进行测量。 x1-x3:反应器中的温度。 x6 和 x7:冷热介质中的温度。 x4、x8 和 x9:压力变化值。 x5 和 x10:材料流入反应器中的流速。

目的
20.建立一个良好批次演变过程的模型(等级模型) ,并使用它对在演变过程中的 新的批次进行监测,以尽早的检测出演变过程中可能出现的问题。 21.建立一个以所有批次的等级模型主成分为基础的模型,并使用这个模型来将 新的批次进行优劣的划分。

分析概述
我们将使用 18 个优秀批次(1800 个观测值)来建立“优秀批次”的模型。这将

由一个关于 10 个测量变量的 Y 变量(相对批次时间)的 PLS 模型的拟合完成。 这个观察等级模型(the observation level model)将用于对新批次的演变过 程进行监测,30-33 批次(优秀批次)和 49-55 批次(差批次) 。 我们将建立一个所有批次的 PCA 模型, 并使用一个未展开的观测值等级的主成分 作为 X 变量。

SIMCA-P 的分析步骤如下:
·建立观测值等级模型,录入 18 个优秀批次的原始数据集。 ·观测值等级模型拟合,一个以相对批次时间为 Y 变量,以 10 个测量变量为 X 变量的 PLS 模型(分析菜单) 。 ·显示训练集的控制图表(Analysis/Batch/Control Charts menu) 。 ·使用新的批次信息录入第二数据集。 ·对新批次的演变进行检测( Prediction/Batch/Control Charts menu )并使 用贡献值图来解释所见到的问题。 ·建一个所有批次的工程并将其数据进行 PCA 拟合。 ·使用“distance to the model(DmodX)”来进行新批次优劣的划分并使用贡献 值图表进行结果的阐述。

建立观测值等级模型工程
启动一个新的工程。数据集名称为 NOM 18a.xls。 启动 SIMCA-P 软件并建立一个新的工程(FILE/NEW) 。

“import wizard”界面打开。 选择 选择“SIMCA-P Batch project”并点击“Next”

第二列以包含批次标识的观测值名称进行命名。 批次标识和阶段标识均可以定位于表格中的任何一个变量(列) 。 对第二列进行标记并从组合框(最上面的一列)中选择批次标识。 在这个例子中,你无需对阶段标识进行定义,因为批次处理只有一个阶段。

下列窗口打开:

点击“OK”和“Next” 。

批次界面(Batch page)显示了数据集中批次的信息(每一个批次中观测值的数 值) 。 “Conditional delete”键让你可以删除比选择个数少批次中的观测值。

在这个例子中我们无需使用“Conditional delete” 。 点击“Next”来显示工程指定界面然后点击“Finish” 。

以下的信息将被显示:

点击“OK” 。

分析
工作集 M1 已经将所有的 10 个测量变量指定为 X 变量并自动生成了指定为 Y 变量 的变量$Time(相对批次时间) ,并且所有的变量均被计算并“centered to unit

variance(UV)” 。你已经准备好进行 PLS 批次模型的拟合。 点击“Autofit” 。

SPMCA-P 软件仅使用 2 个组分就可以解释 85%的 X 变量,并且第三个组分解释少 于 7%。 模型创口将对每个组分的模型拟合进行总结。 我们得到了一个包含两组分的优秀 的模型,其可以解释 87%的 X 变量和 98%的 Y 变量。

t1 的主成分线性图
点击“Scores/Line Plot/t1”来显示第一个总结变量 t1,总结了所有的 10 个 变量。

所有的 18 个批次均在 2 个标准偏差界限内。

荷载值 p1
点击“Analysis/Loadings/Column/p1”

用于总结 X 变量的批次和荷载值 p1 均是阐述原始 X 变量对 t1 重要性的权重。 我们可以看到所有的变量均参与了 t1 的建立。其中前三个变量有正权重值,剩 下的有负权重值。

批次控制图表(训练集)
Analysis/Batch/Control Chart/Scores
批次控制图表中显示优秀批次中 t1 和 t2 如何随时间发生变化。 一个新的优秀批 次 应 该 以 相 同 的 方 式 进 行 演 变 并 且 它 的 轨 迹 应 该 在 控 制 限 定 值 ( control limits)之内。

使用旁边的箭头来讲堆积显示的批次一个个的前移或后移。你还可以使用 “property bar” 。 Properties page 使用上方的箭头显示控制图表 t2

选择“Remove the average and normalize the values”来从“the Limits and Averages ”窗口中显示控制图表。

点击“Apply” 。

该图以“normalized units”的形式进行显示。

Batch Control Charts DModX, Variables, Hotelling T2 and Observed vs. predicted
图中的“the distance to the model(DmodX)” “Hotelling T2”和“Observed vs. Predicted time”和它们的控制限定值均为新的批次重要的监视值。 需要的时候可以显示单变量批次控制图表。

新批次的的检测
使用新批次信息录入第二数据集
使用菜单“FILE/Import Secondary dataset” ,并录入“Alpred.xls”作为第二 数据集。

将第二列作为“Batch ID” 。

使用新批次信息建立一个预测集

点击“Prediction/Specify Predictionset/Dataset/Alpred”来选择“alpred” 预测集。

新批次的控制图表
Predictions/Batch Control Charts/Scores

点击“Predictions/Batch/Control charts/Scores” ,在控制图表中显示新的批 次(包含源于训练集的控制限定值) 。使用“properties”界面将批次 50-55 包 含在内。 使用“Component”窗口显示控制图表 t2。

在所有的这些控制图表中,批次 50-55 在第一个时间阶段(0-15)中均超出控制 限定值。批次 50-55 在 t1 中也超出了控制限定值,即聚合过程的最后一个时间 段(90-100) 。

贡献值图
使用“Contribution tool” ,双击 t1 控制图表中的一个异常批次,例如批次 50。

在贡献值图表中清晰的显示出变量 V-4(压力)远低于平均值。

批次 49 的控制图表和贡献值图

批次 49 在时间阶段 55-60 处略微超出控制限定值。 时间点 59 附近的贡献值图中显示变量 V-10 略微低于优秀批次平均值。

Prediction/Batch Control Charts/DModX

批次 50-55 在时间阶段 0-20 明显超出了控制限定值。

贡献值图
在那个时间阶段的这些批次的任何一个的贡献值图再次显示变量 V4(压力)低 于优秀批次压力值。

变量 4(压力)的控制图表中,双击,清晰地显示出这 5 个批次的压力问题。

建立批次等级工程模型
选择菜单 FILE/Batch/Create batch level project,对主成分进行标记,并勾 选“Bring secondary dataset” 。 在批次等级工程中, 每一行具有一个来源于一个批次的数据并由未展开的主成分 组成(阐述每个批次的演变) 。 该例中没有起始条件。

分析:自动拟合
点击“Analysis/Autofit”进行 PC 模型的拟合。SIMCA 软件提取出 4 个组分。

分析:主成分
点击“Analysis/Scores/t1 vs. t2”

18 个优秀批次在区域中散布开,并没有异常值。

Analysis/Batch Control Charts/Batch Variable Importance

该图 (通过将批次等级模型中的主成分进行整合,并使用源于观测值等级模型的 w*作为权重) 显示了在整个批次模型中被测量变量所有的重要性。在这儿我们可 以看到所有的 10 个变量均很重要(通过 10 个变量高度相关而得到的) 。

新批次质量的预测
在菜单“Predictions/Specify Predictionset/Dataset”中选择“alpred”数 据集作为预测集。 它包含的数据包括批次 1,批次 30-33,批次 49-55,每个批次一个观测值,并 且观测值等级的预测分数作为 X 变量。

预测:T Predicited

我们清楚的看到批次 50-55(除了批次 52)均在“Hotelling T2”椭圆范围之外, 并且在“second dimension”中均为异常值。

预测:批次 51 的贡献值
使用“Contribution tool”双击批次 51.

双击 t2-M1:4,主成分变量将被解析为相关的原始变量,并显示变量 4(压力) 是问题变量。

预测:Distance to the Model(DmodX)

批次 50-55 的 DmodX 均高于控制限定值,并且批次 49 也高于控制限定值。这样 可以让我们清晰的了解到这些批次与优秀批次之间存在着很大的差异。

预测:Contribution/Distance to the model
使用“Contribution tool”并双击批次 50。

双击主成分 t2-M1:3, 主成分变量将被解析为相关的原始变量,并显示变量 4(压 力)为问题变量。

结论
对代表着优秀批次的数据集的演变进行模型的建立, 将使我们可以建立一个用于 检测新批次的控制图表。 我们将探测到差批次演变过程中存在的问题,并了解为 什么这些批次在控制限定值之外。 所有批次的模型使我们可以将新批次进行优劣的划分并了解为什么这些批次有 一个较差的质量。

Modelling of a Batch Digester 介绍
以下的例子来源于一个分批消解器(batch digester) 。 分批消解器应用于纸浆和造纸工业,目的是将木屑制成纸浆。 分批处理过程具有 5 个阶段:制屑、酸化、煮浆、逆吹、blow。 在制屑阶段,木屑被填入消解器并进行蒸气处理。 在酸化阶段,木屑被酸液浸润。 然后它们将在煮浆阶段在高温和高压的条件下进行煮浆。这是最关键的阶段,因 为脱木质化将在这一阶段发生。 在 “blow” 阶段, 压力将被释放并因此回归到正常的大气压强, 温度也同样下降。 最终,在吹干阶段,纸浆将从消解器中倒处。 每一个批次处理过程所需的时间在 8 至 10 小时之间,在目前的数据集中显示平 均时间为 9.4 小时左右。 27 个变量(包括采样时间)在批次演变过程中每隔两分钟进行一次测量。不同 的变量在不同的阶段有着特殊的意义。 数据的采集建立在 52 个批次的基础上。这些批次中,30 个优秀批次被用来建立 训练集模型。

数据
变量
以下的变量在以下的阶段具有着重要的意义。 制屑和酸化阶段: 木屑的状态(2 个变量) 通风的状态(2 个变量) 水蒸气的状态 1(2 个变量) 水蒸气的状态 2(2 个变量) 温度 4

压力 2 煮浆阶段: 压力 1 水蒸气 温度 1 温度 2 温度 3 温度 4 温度 5 压力 2 温度 6 泵 逆吹阶段: 压力 1 温度 2 温度 3 温度 4 温度 5 减压阀 风速 1 风速 2 压力 3 压力 4 稀释状态(2 个变量) 稀释速度

目的
22、建立一个优秀批次的演变模型(观测值等级模型) ,并使用这个模型对其他 在演变过程的的批次进行监测,以尽早的探测出存在的问题。

23、 以观测值等级模型的主成分为基础建立一个所有批次的模型,并使用这个模 型对其他批次的优劣进行区分。

分析概述
我们将使用 30 个优秀批次来建立“优秀批次”演变过程的模型。 在分析过程中,我们将“制屑” “酸化”两个阶段合并(它们单独分析没有意义) , 并删除了“blow”阶段,因为它对纸浆的质量没有任何影响。 我们将对与 Y 变量(相关批次时间)的三个阶段(制浆+酸化、煮浆、逆吹)的 测量变量进行三次不同的 PLS 模型的拟。 观测值等级模型将用于对其他批次的加工过程进行检测, 在本例中指为训练集以 外的批次。 我们将建立一个优秀批次的 PCA 模型,并以为展开的观测值等级的主成分作为 X 变量。

SIMCA-P 分析步骤如下:
·建立观测值等级工程,使用 52 个批次的信息录入原始的数据集,将制屑阶段 和酸化阶段合并,并删除“blow”阶段。 ·在工作集菜单中,选择 30 个指定的优秀批次并选择每个阶段中的相关变量。 ·对观测值等级模型进行拟合,每个阶段进行一次 PLS 拟合,其中 Y=相对批次 时间,X=每个阶段中的相关变量。(Analysis menu) · 说明煮浆阶段的主成分, 并显示训练集的控制图表。 (Analysis/Batch/Control Charts menu) ·选择工作集(训练集)的补充集并将其保存为第二数据集。 ( Menu Prediction/Prediction Set) · 对训练集以外的批次的加工过程进行检测 (Prediction/Batch/Control Charts menu) ,并使用贡献值图来解释一些批次中所存在的问题。 ·建立所有批次工程,并对其数据进行 PCA 模型拟合。 (Menu File/Create Batch Level Project) ·使用 DmodX 来对预测集中批次的优劣进行划分,并使用贡献值图来解释结果。 (Menu Prediction)

观测值等级工程的建立
启动一个新的工程(Menu File/New) 。现在的数据集为 DIGESTER.DIF。 启动 SIMCA-P 软件并建立一个新的工程(FILE/NEW)

“Impore wizard”界面打开: 选择 SIMCA-P Batch project 项,并点击“Next” 。

第二列以观测值名称命名(包含批次和阶段标示符) 。 批次标示符和阶段标识符可以定位于数据表中相同的变量(列)或独立的变量。

对 第 二 列 进 行 标 记 并 从 下 拉 菜 单 中 ( 最 上 方 一 列 ) 选 择 “ Batch/Phase identifiers” 。

下列窗口将打开:

批次标示符是从 1 至 52 的连续数字,并且阶段是“chip,acid,cook,blbk,and blow” ,点击“OK” 。 批次和阶段的 ID 至现在就在两个不同的变量中显示。

对最后一列的采样时间进行标记并从下拉菜单中选择“ Y Variable(Time or Maturity)”并点击“Next” 。 阶段界面显示数据集中阶段的列表 (包括每个阶段中观测值的个数和批次个数) 。 在每个阶段的下拉菜单里是变量的列表。 使用 CTRL 键对“chip”和“acid”阶段进行标记,并点击“Merge” 。标记“Blow” 阶段,并点击“Delete” 。

我们现在有 3 个阶段被保留下来, 即 “chip+acid” “cook” “blbk” , 点击 “Next” 。 批次界面中将所有批次及它们观测值的数目均列出。 每个批次的下拉菜单中包含

批次中的阶段。在我们的例子中,所有的批次包含所有的阶段。

“Conditional delete”允许你删除批次、阶段或一个选定的阶段(该阶段的观 测值数目较选定数目少) 。

在本例中我们没有使用“Conditional Delete” 。 点击“Next”显示工程指定界面然后点击“Finish” 。

以下的信息将显示并且新的变量$Time 已经建立。

指定工作集

MB1 是一个“umbrella model” ,其由 3 个未拟合的模型准备而成(每个阶段一 个模型,且模型中以测量的变量作为 X 变量,以相对取样时间作为 Y 变量) 。所 有的变量均以方差(unit variance UV)进行计算。 我们需要编辑 MB1,使仅和每个阶段相关的变量被包含在内,并选择 30 个优秀 批次。 点击“Workset/Edit MB1”并选择“Variables Tab” 。 选择所有的前 6 个变量,并点击“Configure Phases”键。

并将它们分配至第一阶段。 继续并按照变量部分做指定的内容将变量依次分配到指定的阶段中。 变量界面需 如下图所示:

注意:Y 变量(采样时间)将自动进行替换,每隔阶段从时间点 0 开始并通过标 准化(Normalize)获得更好的排列。 采样时间标准化可以达到线性时间分布的目的。 点击“batch”界面选择 30 个优秀批次:1、4、6-13、16、18、21、23、25、29、 31、32、34、36-38、40、42、43、46-49、51。 完成以上操作,首先点击“Select All and Exclude” 。这将移除所有的批次。 然后使用“CTRL”键,对 30 个优秀批次进行标记并点击“Include” 。

点击“OK” ,退出工作集。

分析 拟合所有数据类模型
点击“Analysia/Autofit All Class Models” , “Specify Autofit”窗口打开, 点击“OK” 。

3 个数据类模型均被拟合,并且他们都可以解释 80%以上的 X 变量。 我们将检测“cook”阶段,因为它是最重要的。

t1、t2、t3 主成分主成分线性图
双击“cook”模型来检查它的组分。

前三个组分是最重要的,它们可解释 68%的 X 变量;t1 解释 47%,t2 解释 13%, t3 解释 7%。 点击“Scores/Line Plot/t1”来显示变量 t1 的概述,总结 cook 阶段的所有的 变量。

所有的 30 个批次均在 t1 的 3 个“sigma limit”范围内。 选择 t2(从 properties 窗口中的 component combo 框中)。 所有的 30 个批次均在 t2 的 3 个“sigma limit”范围内。 选择 t3。 主成分 t3 显示了更多的变化, 因为所有的批次均在一些时间点超出了 3 个 “sigma limit”范围。

荷载值 p1,p2,p3
使用我们感兴趣的批次对 X 变量进行概述,荷载值 p1,p2,p3 是结合了 t1,t2,t3 的原始 X 变量的权重。 为了解释前三个主成分 t1,t2,t3(新变量,对所有的 X 变量进行总结) ,我们看 荷载值 p1,p2,p3。 点击“Analysis/Loading/Column plot/p1” ,然后 p2,p3。

我们可以看到 t1 主要有前 5 个温度和压力 1 组成。

第二主成分 t2 主要是压力 1,水蒸气和温度 1。

主成分 3 还是由压力(1 和 2) 、水蒸气、温度 1 和温度 6 支配。

批次控制图表(训练集)

Analysis/Batch/Control Charts/Scores
训练集中的所有的批次均以相同的时间点定位在相同的长度范围内。 因此我们可 以在每一个时间点计算 t1 的平均值及它的标准差。 t1 的批次控制图表显示温度在 cook 阶段的加工过程中是如何变化的。 绿线是从所有优秀批次中计算出的 t1 的平均值。 红线是从 3 个“sigma limit” ,从 t1 的方差计算而来。 绿线代表了理想优秀批次的指纹路径。 所有新的优秀批次均应该符合这条路径并 在红色控制线的范围内。

个别的批次可以包含在这个控制图表中——系统默认包含第一个训练集。 通过使 用“properties”界面(点击右键)可以将更多的批次包含在展示的批次束中。 使用旁边的箭头可以将展示的批次束中的一个批次迁移或后移。你还可以使用 “properties”界面来选择需要展示的批次。

Properties 界面
右键点击图形,从“pop-up”菜单中打开“properties”界面。

将所有你想要展示的批次进行标记,并将其移至选择窗口(selected window) 中。 在这个条件下,所有优秀批次的图形均在红色控制限定值范围内。

为 了 在 标 准 化 单 元 内展 示 控 制 图 表 , 通 过“ Limits and Averages ” 窗 口 ( “Properties ”窗口下方) ,选择“ Remove the average and Normalize the values” ,然后点击“Apply” 。

现在这个图将在标准化单元中展示。

在“Component”框中,选择“the 2nd component from the combo box”来展示 t2 的控制图表。

注意:这个图并不是在标准化单元中展示。

Batch Control Chart DModX,Hotelling T 2 and Observed vs. predicted

带有控制限定值的 DModX,Hotelling T2 和 Observed vs. predicted 图形也是新 批次重要的检测图表。 需要时,通过选择“Variable Plot”来显示单变量批次控制图表。

新批次的检测
建立预测集:工作集的补集
使用菜单“Prediction/Specify prediction set/Specify”

从预测集(右侧的窗口)中移除所有的批次,选择左边窗口的所有批次(训练集 的补集) ,将它们移至右边的窗口中,并点击“OK” 。 在“Prediction”菜单中,将它们保存为第二数据集,并将其命名为“Pred 1” 并点击“OK” 。

预测集的批次控制图表
对于 cook 阶段,选择“ Prediction/Batch Control Chart/Scores ”并使用 “Properties”界面将所有的批次包含在内。

在 t1 的控制图表中(带有均值和 3 sigma) ,我们可以看出批次 28 远离控制限 定值。

OOC plot

右键点击控制图表 这个图显示出每一个批次中远离控制限定值的区域占在控制限定值内总区域百 分比。 因此批次 28 有 40%的区域在控制区域之外。

组贡献值图(Group Contribution plot)

展示批次 28,对“3 sigma”区域外的时间点进行标记,并点击“action plot” 。

贡献值图显示出压力 1 在这些时间点中比平均值低 6 个标准差,并且温度 2-5 在这些时间点中也比平均值低。

变量控制图表
双击“压力 1” ,来显示该变量的控制图表。

Prediction/Batch Control Charts/DModx

批次 28 在时间段 1-2 小时里明显超出了控制限定值。

贡献值图
在那个时间段里的批次 28 的贡献值图显示出压力 2 和温度 6(与压力 2 相关) 是问题原因所在。

双击“压力 2”来显示控制图表。

建立批次等级工程模型
选择菜单“File/Batch/Create batch level project”,对主成分进行标记,勾 选“Bring secondary dataset”and 并选择“ Pred1” 。点击“Next” ,选择批 次等级的名称并点击“OK” 。 在批次等级工程中, 每一行均含有来自一个批次的信息并且由观测值等级模型中 未展开的主成分构成(用于描述每一个批次的加工过程)的。 本例中没有起始条件。

分析:自动拟合
点击“Analysis/Autofit”来进行 PC 模型的拟合。SIMCA 软件将提取出 5 个组 分。

分析:主成分
点击“Analysis/Scores/t1 vs. t2”

批次 6 略微位于 Hotelling T2 置信区间之外。 使用“Contributiom Tool” ,点击“批次 6”获得贡献值图。

贡献值图按不同的阶段进行着色, 并且显示出 cook 阶段的 t1 值在 5.2 小时低于 平均值 6.5 个标准差。使用“Contribution tool”双击该点来将这个贡献值分 解为原始的变量。

5.2 小时左右的温度 2 明显低于当时优秀批次的平均值。 展示“温度 2”的控制图表,双击“温度 2” ,我们可以看出在 5.36 小时的温度 2 为 114.9 度并且略微低于控制限定值。在这个时间点优秀批次温度 2 的平均温 度为 141 度。

Analysis/Batch Variable Importance
考虑到不同的阶段具有不同的变量, 必须有一个可以独立的展示每一个阶段批次 变量重要性的变量。 选择 cook 阶段,因为它是最重要的。

该图 (通过结合批次等级模型中的主成分的重要性,并以源于批次等级模型中的 p 值作为权重)展示了在 cook 阶段中,全部等级模型中所有测量变量的重要性。 在这里我们看出温度、压力 1 和水蒸气起主要作用。

预测集批次质量的预测
在菜单“Prediction/Specify” ,选择“训练集”和“Pred 1 中的预测集批次” 。

预测:T 预测

选择 t1 vs. t3。批次 28 和 26 均在“Hotelling T2”椭圆范围之外。

预测:批次 28 的贡献值主成分
使用“Contributio tool” ,双击批次 28。

是什么导致批次 28 为异常值?原因很明显在 cook 阶段。 双击具有较大标准差的 一个主成分点,例如 1.1 小时的 t1,将该贡献值分解为原始变量。

被分解的贡献值图显示压力 1 明显小于平均值。 压力 1 的控制图表证实了上述说法,并指出了批次 28 的问题所在。

预测:Distance to the Model(DModX)

批次 28、26、33、50 和 52 具有最大的 DModX 值。

贡献值图
使用“contribution tool”双击批次 33,来显示贡献值图。

问题看上去是在 cook 阶段 t2 的 0.4 小时左右(该阶段的起始)以及 chip+acid 阶段。 双击 chip+acid 阶段中较大的值,我们看到问题与水蒸气的状态有关。

Cook 阶段分解后的较大 t2 贡献值显示压力 1 和水蒸气低于平均值,可能由于水 蒸气状态问题所导致的。

批次 33 的压力 1 和水蒸气的控制图表证明了上述观点。

结论

建立一个较为优秀批次加工过程的模型, 使我们可以建立控制图表来对新批次加 工过程中的质量进行监测。 我们探测出劣质批次加工过程中存在的问题,并了解 为什么这些批次位于控制限定值之外。 整个批次的模型使我们可以对新批次的优劣进行划分, 并了解为什么这些批次具 有一个较差的质量。


相关文章:
simca-p简易图解教程
Simca-p 简易图解教程 1.simca-p 软件下载,下载地址如下: http://www.umetrics.com/default.asp/pagename/downloads_software/c/1 选第一个 SIMCA-P+ 12.0...
Simca-p截图教程
Simca-p截图教程_计算机软件及应用_IT/计算机_专业资料。Simca-p截图教程,教你一步一步做PCA和PLS-DA3-MCDP.M2 (PCA-X) t[Comp. 1]/t[Comp. 2] Colore...
SIMCA-P使用说明——第二例
Table 1 中显示的是 231 次平行观察实验的结果 第 27 页为表 1 第 28 页目的 本次调查的目的是研究 12 个自变量和 6 个因变量之间的关系 在 SIMCAP ...
simca-p破解方法
simca-p破解方法_医药卫生_专业资料 暂无评价|0人阅读|0次下载|举报文档simca-p破解方法_医药卫生_专业资料。 文档贡献者 yuzhixueand 贡献于2012-09-23 ...
Simca-P 11.5中文翻译——食品例子
本数据选择了 20 个自变量,16 个国家 介绍 开始 simca-P,创建一个新的项目从 FILE/NEW 开始 第 15 页 选择数据格式为 XPS 或者所有可支持的数据格式,找到你...
代谢组学数据挖掘及分析操作SOP-
(注:不是所有 在圈外的点都应该剔除,选择性剔除较远点后,有的较近的点会自然落在圈内) ; 2) Simca-p 比较适合两组间的比较,所以组数不要太多,且分的...
(真正的好东西)偏最小二乘回归=多元线性回归分析+典型...
SIMCA-P 软件中,指定 ( PRESS h / SS h?1 ) ≤ 0.95 2 即 PRESS h ≤ 0.95 SS h ?1 时 , 增加成分 t h 就是有益的 ; 或者反过来说 , 当...
图像识别技术综述
着重介绍 K-L 变换在实际中的应用算法 SIMCASIMCA(Soft Independentt ...P f ? p ? E 其中 错误!未找到引用源。为光谱矩阵, 错误!未找到引用源。...
大蒜辣素提取物及其降解产物的HPLC-MSMS研究
SIMCA-P_11.5_指南(中文... 208页 免费大​蒜​辣​素​提​取​物​及​其​降​解​产​物​的​H​P​L​C​-​M...
更多相关标签: