首页> 中国专利> 用于产生质量控制材料的统计上有效的检验均值和范围的系统和方法

用于产生质量控制材料的统计上有效的检验均值和范围的系统和方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种针对质量控制材料建立统计上有效的检验均值和范围的方法，用于对医疗测试器械进行合格性评定，该方法利用对新批次的质量控制材料进行的测试以建立检验均值，并且使用来自历史测试结果的数据库的数据以建立检验范围。系统可以根据先前批次的数据对测试结果的变异性进行估计，然后计算检验范围的限制，以使得预期对新批次的质量控制材料进行的新的测试将以指定概率落入该范围内。由于历史数据被用来估计测试的变异性，因此与仅基于对新批次的材料的测试来建立均值和范围相比，可以急剧减少指定统计上有效的均值和范围所需要的新的测试的数目。

著录项

公开/公告号CN103548014A

专利类型发明专利
公开/公告日2014-01-29

原文格式PDF
申请/专利权人伯乐实验室有限公司;
展开▼

申请/专利号CN201280024091.1
发明设计人拉克希米·口出普迪;柯蒂斯·帕尔文;约翰·云德特-帕切科;
展开▼

申请日2012-03-27
分类号G06F17/18;G06F19/00;
代理机构北京集佳知识产权代理有限公司;
代理人杜诚
地址美国加利福尼亚州
入库时间 2024-02-19 22:31:42

法律信息

法律状态公告日

法律状态信息

法律状态
2017-01-18

授权

授权
2014-03-12

实质审查的生效 IPC(主分类):G06F17/18 申请日:20120327

实质审查的生效
2014-01-29

公开

公开

说明书

相关申请的交叉引用

本专利合作条约申请要求2011年3月29日提交的、名称为“System and Method for Producing Statistically Valid Assay Means and Ranges for Quality Control Materials（用于产生质量控制材料的统计上有效的检验均值和范围的系统和方法）”的美国专利申请第13/074,649号的优先权，其全部内容通过引用合并到本文中用于所有目的。

背景技术

某些医疗测试已经变得高度自动化。例如现在可以通过自动化测试器械以高达每小时几千次测试的速率进行常见测试，如测量患者的胆固醇水平或血糖、测试在受体（subject）的血液或尿液中的药物的存在、或测量患者的血液化学的其它方面。在典型的测试中，诸如一定量的患者的血液的样本与试剂进行反应，并且对得到的产物进行研究以确定样本中的特定分析物的存在或量。试剂可以被具体设计成用于特定测试的执行。

因为可以基于测试结果做出重要的医疗决定，所以非常期望周期性地评定测试器械的合格性，以便对器械正常工作保持信心，或试图检测何时器械无法正常工作。事实上，美国政府条例要求这种周期性的验证。按照条例，在进行患者测试的任一天内，必须每天至少一次地评定每个测试器械的合格性。

合格性评定（qualification）可包括测试具有已知特性的样本、以及检查器械是否产生与已知特性一致的测试结果。如果器械产生与已知特性一致的测试结果，则可以认为器械正常工作，并且如果器械不产生与已知特性一致的测试结果，则器械的工作会被质疑。

因此，器械合格性评定需要具有已知特性的测试样本现成可用（ready availability）。用于器械合格性评定的这些测试样本可以被称作“质量控制材料”。因为单个测试器械能够进行大量不同测试，包括使用不同试剂对分析物的测试，并且因为来自不同制造方的测试器械可能有区别地进行测试，所以必须现成可用的质量控制材料的数量非常庞大，以在每种器械能够进行的每个测试的执行中评定每种器械的合格性。对于至少某些测试，例如测试人体组织或不稳定的分析物中的不常见状况的测试，保持具有已知特性的实际生物样本的保存会是不切实际的，因此质量控制材料可以模拟实际生物样本的行为。优选地使质量控制材料稳定，使得它们可以长期储存。例如，某些质量控制材料在制造时被冻干，并且被再造进行使用。

由于在制造质量控制材料的过程中的自然变异性，因此每个新批次（lot）的特定质量控制材料在其制造时被表征，从而确定测试结果值的范围，当使用正常工作的测试仪器对质量控制材料进行测试时预期来自该批次的样本测试的结果以指定概率落入该范围内。通常也公布均值。公布被认为是检验均值和范围的这些均值和范围，用于在其器械的评定合格性中测试实验室的使用。可以针对测试器械型号和质量控制材料或测试方法和质量控制材料的每种可能的组合，公布均值和范围。

美国食品与药品管理局的最近指导要求所公布的质量控制材料的检验均值和范围在统计上有效。

发明内容

根据一个方面，一种针对特定批次的质量控制材料建立统计上有效的检验均值和检验范围的方法包括：对来自特定批次的质量控制材料的多个样本进行测试并且获得每个样本的测试结果，并且计算测试结果的均值。也对均值的估计的不确定性进行计算。该方法还包括访问根据对先前批次的质量控制材料进行的测试而获得的历史测试结果的数据库，并且至少部分地根据历史测试结果计算变异性估计，所述变异性估计是根据对至少一个先前批次的质量控制材料进行的测试而获得的测试结果的变异性的估计。指定目标概率，其中新批次的质量控制材料的样本进行的新的合格性评定的测试结果将会以该目标概率落入检验范围内。该方法还包括：至少部分地基于均值、均值的估计的不确定性以及变异性估计来计算测试结果值的范围，其中预期来自所述特定批次的质量控制材料的样本的合格性评定测试的结果以所述目标概率落入所述测试结果值的范围内。该方法还可以包括：对来自特定批次的质量控制材料的样本进行测试以获得测试结果。该方法还可以包括输出该范围。在某些实施例中，计算变异性估计包括：至少部分地根据所述历史测试结果来计算所述均值的不确定性的估计；至少部分地根据所述历史测试结果来计算仪器内的变异性估计，所述仪器内的变异性估计是对至少一个先前批次的质量控制材料使用单个测试仪器获得的测试结果的变异性的估计；以及至少部分地根据所述历史测试结果来计算仪器间的变异性估计，所述仪器间的变异性估计是对至少一个先前批次的质量控制材料使用不同的测试仪器获得的测试结果的变异性的估计；并且至少部分地基于所述均值和所述变异性估计计算所述范围包括：至少部分地基于所述均值、所述均值的不确定性的估计、所述仪器内的变异性估计以及所述仪器间的变异性估计，计算所述范围。在某些实施例中，该方法还包括：针对由于估计所述均值的不确定性引起的所述检验范围的百分比，设置上限；以及至少部分地基于所述仪器内的变异性估计和所述仪器间的变异性估计来建立采样计划，以实现这样的检验范围：该检验范围具有由于估计所述均值的不确定性而引起的其宽度的百分比，所述百分比处于所述上限处或低于所述上限。在某些实施例中，所述仪器内的变异性估计是根据方差的平均值导出的，每个方差是来自多个仪器中的一个相应仪器的测试结果的方差。在某些实施例中，所述仪器间的变异性估计是根据平均值的方差导出的，每个平均值是来自多个仪器中的一个相应仪器的平均测试结果。在某些实施例中，所述均值的不确定性的估计是所述均值的标准误差，并且至少部分地基于从所述历史测试结果的数据库导出的变异性的估计来计算所述均值的标准误差。在某些实施例中，至少部分地根据所述历史测试结果来计算所述变异性估计包括：把所述测试结果的均值和变异性之间的观察到的关系考虑进来。在某些实施例中，至少部分地根据所述历史测试结果来计算所述变异性估计包括：使用所述历史测试结果来进行回归，以表征所述均值和所述变异性的至少一个分量之间的关系；以及基于所述均值和所述关系来调整所述变异性估计。在某些实施例中，至少部分地根据所述历史测试结果来计算所述变异性估计包括：识别下述具体的先前批次的质量控制材料：其均值测试结果与根据所述特定批次的质量控制材料的所述测试结果计算的所述均值相称（comparable）；计算从所述具体的先前批次的质量控制材料的测试获得的测试结果的变异性；以及将与根据所述具体的先前批次的质量控制材料计算的测试结果的变异性相等的变异性估计分派给所述特定批次的质量控制材料。在某些实施例中，计算所述变异性估计包括：至少部分地根据所述历史测试结果来计算所述均值的不确定性的估计；至少部分地根据所述历史测试结果来计算实验室内的变异性估计，所述实验室内的变异性估计是对于在至少一个先前批次的质量控制材料在单个实验室内获得的测试结果的变异性的估计；以及至少部分地根据所述历史测试结果来计算实验室间的变异性估计，所述实验室间的变异性估计是对于至少一个先前批次的质量控制材料从不同实验室获得的测试结果的变异性的估计；并且至少部分地基于所述均值和所述变异性估计来计算所述范围包括至少部分地基于所述均值、所述均值的不确定性的估计、所述实验室内的变异性估计以及所述实验室间的变异性估计来计算所述范围。方法还可以包括不予考虑在所述历史测试结果的数据库中发现的异常测试结果。

根据另一个方面，一种建立用于将检验均值和范围分派给特定批次的质量控制材料的采样计划的方法包括：针对由于估计所述均值的不确定性而引起的所述检验范围的百分比，设置上限；以及访问根据对先前批次的质量控制材料进行的测试而获得的历史测试结果的数据库。至少部分地根据所述历史测试结果来计算仪器内的变异性估计，所述仪器内的变异性估计是对至少一个先前批次的质量控制材料使用单个测试仪器获得的测试结果的变异性的估计。至少部分地根据所述历史测试结果来计算仪器间的变异性估计算，所述仪器间的变异性估计是对至少一个先前批次的质量控制材料使用不同测试仪器获得的测试结果的变异性的估计。该方法还包括至少部分地根据所述仪器内的变异性估计和所述仪器间的变异性估计来建立采样计划，以实现这样的检验范围：该检验范围具有由于估计所述均值的不确定性而引起的宽度的百分比，所述百分比处于所述上限处或低于所述上限。

根据另一个方面，一种针对特定批次的质量控制材料建立统计上有效的检验均值和检验范围的系统包括：处理器；数据库，保存根据对先前批次的质量控制材料进行的测试而获得的历史测试结果；以及能够由所述处理器读取的存储器。存储器保存处理器指令，所述处理器指令在由所述处理器执行时使得所述系统：获得多个测试结果，所述测试结果得自对来自所述特定批次的质量控制材料的多个样本进行的测试；计算所述测试结果的均值；访问根据对先前批次的质量控制材料进行的测试而获得的历史测试结果的数据库。该指令还使得系统：至少部分地根据所述历史测试结果来计算变异性估计，所述变异性估计是根据对至少一个先前批次的质量控制材料进行的测试而获得的测试结果的变异性的估计；接收目标概率的指定，其中对新批次的质量控制材料的样本进行的新的合格性评定测试结果将以所述目标概率落入所述检验范围内。该指令还使得系统：至少部分地基于所述均值和所述变异性估计，计算测试结果值的范围，其中预期来自所述特定批次的质量控制材料的样本的合格性评定测试的结果以所述目标概率落入所述测试结果值的范围内。在某些实施例中，指令在由所述处理器执行以计算所述变异性估计时，还使得所述处理器：至少部分地根据所述历史测试结果来计算所述均值的不确定性的估计；至少部分地根据所述历史测试结果来计算仪器内的变异性估计，所述仪器内的变异性估计是对至少一个先前批次的质量控制材料使用单个测试仪器获得的测试结果的变异性的估计；以及至少部分地根据所述历史测试结果来计算仪器间的变异性估计，所述仪器间的变异性估计是对至少一个先前批次的质量控制材料使用不同测试仪器获得的测试结果的变异性的估计。

根据另一个方面，一种用于针对特定批次的质量控制材料建立统计上有效的检验均值和检验范围的检验均值和范围分派系统包括：数据库，保存根据对先前批次的质量控制材料进行的测试而获得的历史测试结果；以及均值确定模块，接收根据对来自新批次的质量控制材料的多个样本进行的测试而获得的多个测试结果，并且计算所述测试结果的均值。该系统还包括：变异性估计模块，至少部分地根据所述历史测试结果来计算变异性估计，所述变异性估计是根据对至少一个先前批次的质量控制材料进行的测试而获得的测试结果的变异性的估计；以及范围建立模块，至少部分地基于所述均值和所述变异性估计来建立测试结果值的范围，其中预期来自所述新批次的质量控制材料的样本的合格性评定测试的结果以目标概率落入所述测试结果值的范围内。在某些实施例中，所述变异性估计包括仪器内的变异性估计，所述仪器内的变异性估计是对至少一个先前批次的质量控制材料使用单个测试仪器获得的测试结果的变异性的估计；以及所述变异性估计包括仪器间的变异性估计，所述仪器间的变异性估计是对至少一个先前批次的质量控制材料使用不同测试仪器获得的测试结果的变异性的估计；以及所述系统还包括采样计划建立模块，所述采样计划建立模块至少部分地基于所述仪器内的变异性估计和所述仪器间的变异性估计来建立采样计划。在某些实施例中，所述采样计划建立模块接收针对由于估计所述均值的不确定性而引起的检验范围的百分比的上限指定，并且至少部分地基于所述仪器内的变异性估计、所述仪器间的变异性估计以及针对由于估计所述均值的不确定性而引起的检验范围的百分比的上限来建立所述采样计划。所述范围建立模块可以把历史测试结果的所述均值和变异性之间的观察到的关系考虑进来。在某些实施例中，所述变异性估计包括所述均值的不确定性的估计；所述变异性估计包括仪器内的变异性估计，所述仪器内的变异性估计是对至少一个先前批次的质量控制材料使用单个测试仪器获得的测试结果的变异性的估计；所述变异性估计包括仪器间的变异性估计，所述仪器间的变异性估计是对至少一个先前批次的质量控制材料使用不同测试仪器获得的测试结果的变异性的估计；以及所述范围建立模块至少部分地基于所述均值、所述均值的不确定性的估计、所述仪器内的变异性估计以及所述仪器间的变异性估计来建立所述范围。

附图说明

图1以流程图的形式示出了根据本发明的实施例的用于对于特定批次的质量控制材料建立统计上有效的检验均值和检验范围的方法的步骤的概况。

图2示出了根据本发明的实施例在检验均值和范围的分派中涉及的各种系统的交互的简化框图。

图3示出了根据本发明的实施例的系统。

图4更详细地示出了根据本发明的实施例在检验均值和范围的分派中涉及的数据流。

图5是示出了可以实现本发明的实施例的示例性计算机系统的框图。

具体实施方式

下面的表1是可由质量控制材料的制造方公布的、检验均值和范围的示例性表的摘录。

表1.示例检验均值和范围

表1的第一部分是根据在特定测试仪器上进行的特定测试来组织的。在表1的“仪器”部分中，有八组给定的均值和范围——针对质量控制材料中的两种不同浓度的分析物（级别1和级别2）、在两种不同型号的测试器械（品牌A型号X和品牌B型号Y）上进行的两种测试（葡萄糖和胆固醇）。例如，品牌B型号Y测试器械的所有者可以参考该表的第三行以确定预期测试结果落入的范围，用于使用产生该表所针对的质量控制材料进行的合格性评定测试。根据表的第三行，品牌B型号Y测试器械的使用者可以预期将特定的级别1的质量控制材料的测试用于测试葡萄糖，从而以通过用于分派范围的统计方法建立的置信度（confidence）来产生在 75mg/dL与103mg/dL之间的测试结果。在某些实施例中，可以建立范围以使得在被评定合格的测试器械正常工作时，器械使用者可预期测试结果在大约99.7%的时间落入指定范围内。因此，该范围之外的测试结果会产生关于器械是否正常工作或质量控制材料是否受损害（compromise）的疑问，从而提示进一步调查。

表1的“方法”部分是根据测试方法来组织的。使用在表的“仪器”部分中未表示的测试器械的实验室可以使用“方法”部分，以根据其特定测试器械所使用的方法来确定用于合格性评定测试的预期的范围。

表1的缩略列表包括16个不同的均值和范围条目。出于本公开的目的，每个条目将被称为对应于“测试条件”，“测试条件”可以是例如测试器械品牌和型号、分析物、试剂、质量控制材料、质量控制材料浓度以及测试方法的因素的特定组合。完整的表可以包括很多不同的测试条件的条目，包含几十种不同的测试器械型号和要由若干不同的方法中的任意方法进行的几十种不同的测试。质量控制材料的单个生产线可能要求在超过 1,500种测试条件下表征检验均值和范围。质量控制材料的制造方必须通过统计上有效的方法建立这些均值和范围中的每个，并且对于每个新批次的每个质量控制材料，必须重新建立均值和范围。

一种用于建立均值和范围的技术会针对每个新批次的特定质量控制材料，仅在若干不同的实验室中在若干不同的测试器械上对新批次的样本进行测试，并且统计地表征该结果。然而，这种方法会非常昂贵，因为需要每个材料/器械组合的很多测试以把测试处理中的不确定性的若干源考虑进来（account for）。

例如，众所周知，通过采样来估计群体的均值包含不确定性，因为不同的样本集合将会得到对群体均值的不同的估计。这种不确定性通常被表达为“均值的标准误差”，其是均值的不确定性的一个估计。

还存在不确定性的其它源。在单个测试器械上的重复测试将会稍微变化。这种变化被称为“仪器内”的变异性。此外，使用同一品牌和型号的不同测试器械进行的测试也将会变化。这种变化被称为“仪器间”的变异性。在不同的实验室中使用同一品牌和型号的测试器械进行的测试也将会变化。这种变化将被称为“实验室间”的变异性。在某些实施例中，可以假设仪器间和实验室间的变异性是可互换的术语。例如，如果每个实验室仅使用任意的特定品牌和型号的一台仪器，则该假设会是完全有效的。实际上，通过将仪器间和实验室间的变异性等同而引入的任何误差可以忽略。例如，对于特定器械品牌和型号的来自特定实验室的所有结果可以被假定为是在同一测试仪器上进行的。

如果仅基于新批次的材料的测试来分派均值和范围值，则会在多个实验室中使用多个测试器械中的每个进行多个测试，并且会收集足够的测试结果，以算出（account for）建立均值时的不确定性、仪器内的变异性、仪器间或实验室间的变异性。这种方法可能需要针对统计有效性的大量测试以建立可置信的范围。

本发明的实施例开发了两种意见以急剧减少为针对新的质量控制材料批次建立统计上有效的均值和范围必须要进行的测试的数目。首先，观测到与以类似的置信度来估计样本变异性所需要的样本的数目相比，可以使用相对少量的样本来估计样本均值。其次，还认识到，尽管根据特定质量控制材料预期的均值测试结果在批次之间不同（导致需要对于每个新批次重新分派均值和范围），但是测试结果的变异性趋于在批次之间保持相对稳定。

本发明的实施例使用对新批次的材料进行的测试针对新批次的质量控制材料建立检验均值，但是利用从先前批次得到的历史测试结果的数据库来建立检验范围，其可以基于均值估计的不确定性、仪器内的变异性，以及仪器间或实验室间的变异性。这样，必须进行相对较少的新的测试以针对新批次的材料建立检验均值和范围。在某些实施例中，还可以基于新建立的检验均值调整变异性的估计。然后可以针对每个测试条件指定检验均值和范围。

历史结果

全世界很多测试实验室在很多测试器械上进行的几乎每个合格性评定测试被记录，并且结果被传递回在合格性评定中使用的质量控制材料的制造方。在历史结果数据库中累积这些合格性评定测试结果，并且所述结果可以由质量控制材料制造方以各种方式使用。这种数据库可以包括数百万计的各个合格性评定测试结果，跨越多年的数据收集。每个被记录的记录通常指示取得结果的测试条件，并且可以包括下述信息：例如运行合格性评定测试的实验室、测试中使用的质量控制材料的类型、运行合格性评定测试的测试仪器的品牌和型号、被测试的分析物、使用的试剂、使用的测试方法、以及测试结果。还可以包括其它种类的信息。因此，数据库可以包含在每个关注的测试条件下使用的先前批次的每个质量控制材料进行的很多测试的结果。

示例检验均值计算

在某些实施例中，计算检验均值作为在类似的测试条件下进行的根据新批次的质量控制材料的测试获得的测试结果的平均值。类似的测试条件可以包括例如在不同的实验室中使用类似的品牌和型号的测试器械。在某些情况下，在单个测试仪器上进行测试就够了。可以如下计算均值：

令Y_ij为由第i个实验室报告的第j个测试结果，i=1,…,L,j=1,…,n_i，

并且n_i是每个报告实验室的报告的结果的数目。注意不需要所有实验室进行相同数目的测试。

令为第i个实验室的报告的结果的均值。

${\overline{Y}}_{i} = Σ_{j = 1}^{n_{i}} \frac{Y_{ij}}{n_{i}}$

计算检验均值作为所有实验室均值（Mean）的平均值：

$Mean = \frac{1}{L} Σ_{i = 1}^{L} {\overline{Y}}_{i}$

示例仪器（实验室）内的变异性计算

根据实施例，在可能存在于多个实验室中的多个测试器械上，使用来自对先前批次的特定质量控制材料进行的合格性评定测试的历史数据，估计仪器内的变异性。取决于与关注的测试条件对应的测试器械的品牌和型号，在可用于估计仪器内的变异性的数据库中可以存在很多测试结果，可能有数以千计的结果。在某些实施例中，可以计算仪器内的变异性作为由各个测试器械获得的测试结果的平均方差（变异性的平均值），或根据来自各个测试器械的测试结果的方差而导出。针对偏差可以对估计进行校正。可以如下进行计算仪器内的变异性估计：

对于每个报告实验室，计算报告结果之和：

对于每个报告实验室，计算报告结果的平方的和：

计算来自所有实验室的所有报告结果之和：

计算来自所有实验室的报告结果的总数目：

根据上面的量，计算实验室内的平方和，

以及计算实验室内方差，

然后可以将实验室内标准偏差计算为

注意这些计算作出以下假设：来自特定实验室的所有结果是使用相同仪器获得的。当然，可以分别追踪单独的仪器。实验室内标准偏差SD_W是仪器内或实验室内的变异性的估计的示例。如下文中将更详细说明的，还可以在计算检验范围的限制之前，基于以上确定的均值对估计进行调整。

示例仪器（实验室）间的变异性计算

根据实施例，在可能存在于多个实验室中的多个测试器械上，使用来自对先前批次的特定质量控制材料进行的合格性评定测试的历史数据来估计仪器间的变异性。每个特定测试器械可以产生与由类似的品牌和型号的其它器械获得的结果不同的结果。差异可以由校准或操作技术的差异引起。取决于与关注的测试条件对应的测试器械的品牌和型号，可以存在很多（可能有数百个）使用测试器械的实验室，实验室的合格性评定测试结果位于历史数据库中，并且可用于估计仪器间的变异性。在某些实施例中，可以将仪器间的变异性计算为从不同的各个测试器械获得的平均测试结果之间的变异性（平均值的变异性）。可以利用上述定义的量S_i、SS_i和N，如下计算仪器间的变异性估计：

计算其间的平方和：

计算 $n_{B} = \frac{1}{L - 1} (N - \frac{Σ_{i = 1}^{L} n_{i}^{2}}{N})$

计算实验室间方差， $V_{B} = Max (0, \frac{{SS}_{B} / (L - 1) - V_{W}}{n_{B}})$

计算实验室间标准偏差，

实验室间标准偏差SD_B是实验室间或仪器间的变异性的估计的示例。如下文中更详细说明的，在计算检验范围的限制之前，还可以基于以上确定的均值对估计进行调整。

假设仪器内的变异性和仪器间的变异性是构成总体变异性SD_T的变化的两个源，那么

基于均值对变异性估计的调整

在某些实施例中，可以在进一步处理之前对仪器内的估计、仪器间的估计以及总体变异性进行调整。例如，观察到仪器内的变异性例如SD_W，根据关注的特定质量控制材料的均值测试结果而改变。（均值测试结果将根据在批次之间有所不同的、质量控制材料中的分析物的浓度而改变。）在一个假设场景中，第一批次的特定质量控制材料可以产生比第二批次略高的均值测试结果，并且在特定测试仪器内第一批次相比于第二批次结果变化更大。也就是说，在这个假设的示例中，仪器内的变异性与均值测试结果正相关。因为对于新批次的质量控制材料而计算的均值的估计可以与先前批次的均值的平均值不同，所以会期望根据观察到的变异性与均值的关系对变异性估计进行调整。

为了表征均值与变异性的关系，对于关注的每个测试条件，可以对来自历史测试结果的数据库的数据进行回归分析。一旦已知该关系，就可以对变异性估计进行调整。优选地，分别对于仪器内的变异性、仪器间的变异性以及总体变异性，分别进行相关和调整。如果进行回归分析以建立均值与三个变异性（仪器内的变异性、仪器间的变异性以及总体变异性）中的任两个变异性之间关系，则可以根据将总体变异性与仪器间的和仪器内的变异性相关联的等式直接建立第三关系。

可以利用其它技术用于把变异性和均值测试结果之间的观察到的关系考虑进来。例如，另一种建立变异性估计的方式将会在历史测试结果的数据库中识别具有与针对新批次的质量控制材料计算出的均值测试结果相称的均值测试结果的具体先前批次的质量控制材料。在本实施例中，计算出来自特定的先前批次的测试结果的变异性，然后将对于新批次的质量控制材料的变异性估计分派为等于来自特定先前批次的质量控制材料的计算出的测试结果的变异性。可以以任何合适的方式建立先前批次的均值是否与针对材料的新批次计算的均值相称。例如，如果先前批次的均值在来自新批次的测试结果的均值的1%、2%、5%或其它合适的百分比内，则可以认为先前批次具有相称的均值。或如果先前批次的均值在如下文所述的针对新批次的质量控制材料计算的均值的标准误差内，则可以认为先前批次具有相称的均值。

均值估计的示例误差

通过若干因素使测试结果的范围变宽，预期由于在任何实验室中的任何仪器上进行的测试产生的新的测试结果将落入所述测试结果的范围内，所述因素包括对样本均值进行确定的不确定性、仪器内的变异性以及仪器间的变异性。在均值的估计中的不确定性取决于用来计算样本均值的估计的仪器和样本的数目，以及取决于仪器间的和仪器内的变异性。在本发明的实施例中，可以使用很少的样本来估计检验均值，例如少至四个样本。如果基于相同的少量的样本来计算均值的标准误差的估计，则检验范围可能不期望地不可靠。

这样，根据本发明的实施例，使用来自历史结果数据库的变异性数据对在均值的估计中的不确定性进行计算，因为用来估计变异性的可用的样本量要大得多。在某些实施例中，根据下式，将均值的标准误差用作均值的不确定性估计：

$SEM = \sqrt{\frac{V_{B}}{L} + \frac{V_{W}}{L^{2}} Σ_{i = 1}^{L} \frac{1}{n_{i}}} .$

在这个均值的标准误差（SEM）的公式中，项V_W和V_B是上述计算的仪器内方差和仪器间的或实验室间的方差，L是实验室的数目，n_i是对于用来估计新质量控制批次均值的每个报告实验室的报告结果的数目。

示例检验范围确定

一旦估计了均值误差和仪器内的和仪器间的变异性，就可以确定检验范围。使用任意实验室中的任意测试仪器得到的测试结果的预期分布将以检验均值为中心，并且具有受在均值的估计中的不确定性以及仪器内的和仪器间的变异性影响的宽度。使用上述计算的估计，预期测试结果的分布的标准偏差可以被计算为：

${SD}_{R} = \sqrt{{SD}_{B}^{2} + {SD}_{W}^{2} + {SEM}^{2}}$

出于本公开的目的，包括有均值的标准误差的估计以及仪器内的和仪器间的变异性估计的群体变异性的估计将被称为“整体”变异性的估计（不同于以上讨论的“总体”变异性）。上面计算的SD_R是整体变异性估计的示例。然后进行检验范围的指派以包含预期测试结果分布的指定部分。例如，如果期望检验范围包含在统计控制下工作的测试器械的所有预期测试结果的99.7%，则范围可以被设置为Mean±3*SD_R。在那种情况下，然后将会预期对新批次的质量控制材料的样本的测试以99.7%的概率落入指定范围内，无论哪一台仪器用于进行测试，并且无论仪器位于哪个实验室中。在另一示例中，如果期望检验范围包含所有的预期测试结果的95.4%，则范围可以被设置为Mean±2*SD_R，在该情况下，对于任意实验室中的任意正常工作的测试仪器，将预期对新批次的质量控制材料的样本的测试以 95.4%的概率落入指定范围内。

数据的管理

优选地，在使用前“管理（curation）”用于检验均值和范围的确定的所有数据，包括历史结果数据库中的数据以及对新批次的质量控制材料进行的测试的结果。也就是说，检查数据并且对明显错误或异常的数据进行校正或不予考虑。

很多原因可以导致异常数据。例如，不同的实验室以不同的方式向质量控制材料制造方报告其合格性评定测试结果。某些测试器械可能是自动化的并且与计算机网络连接，使得自动地和以电子的方式传送合格性评定测试结果，人为误差的几率很小，但是也可能有收集和传送误差。某些实验室可能手动记录合格性评定测试结果，使得存在很多其它的误差的几率。例如，数位（digit）可能被移位或错误地键入，或对于特定测试的测量单位被错误输入。在后一种情况下，以毫克每公升为单位正确报告的结果可能被错误地以克每公升为单位进行报告，使得报告结果与实际结果相差1000倍。可能有很多很多其它的误差源。

然而，重要的是，不是将可能处于测试结果的正态分布内的数据去除，而是仅将在分布的尾部的数据去除。可以排除测试结果的准则的示例包括：

●测试结果处于关注的测试的可能结果的范围之外；

●测试结果与平均测试结果相差了指定数目的类似测试的群组的标准偏差，例如四个、五个或六个标准偏差；

●对于只能以正数测量的量，测试结果是负数；

●测试结果超过类似测试的平均结果多于指定倍数，例如100倍或更多倍；或

●测试结果的报告单位与测试自身的性质不一致。

在所附权利要求的范围内可以设想和使用很多其它用于排除数据的准则。在某些实施例中，数据不会被自动地排除，但是自动化系统可以将可疑数据进行标记，以供熟练的操作者审查，如果有的话，该操作者于是可以决定哪些数据要被排除。

采样计划的指定

也可以将历史测试结果的数据库用于其它用途。例如，如上所述，在均值的估计中的不确定性受到被测试以建立检验均值、仪器内的变异性以及仪器（实验室）间的变异性的样本数目的影响。期望均值误差仅占检验范围的宽度的一小部分，例如不大于范围宽度的12%。然而，在没有仪器内的变异性和仪器间的变异性的先验知识的情况下，很难或不可能知道对在不同的实验室以及在不同仪器上进行的测试会如何影响对检验范围宽度。如果在均值和范围分派处理开始时，盲目选择用来建立对于不同的测试仪器和实验室的测试的分派以及检验均值的样本的数目，则在处理结束时会发现，由于均值的不确定性的过多的贡献使得范围不必要地过宽。

可以利用历史测试结果的数据库用于设计采样计划，以使为建立均值的不确定性在检验范围中占可接受的一小部分的检验范围和均值而必须完成的测试的数目最小化。例如，如果先验地已知对于特定测试条件，仪器间或实验室间的变异性相对于仪器内的变异性非常小，则可以使用仅在单个测试器械上进行的测试来建立检验均值，因为在其它器械上进行的测试很可能仅仅是对第一个器械的测试的复制。然而，如果仪器间的变异性相对于仪器内的变异性较大，则使用多个器械进行测试来把仪器间的变异性考虑进来是非常重要的。在这种情况下，在每个器械上可需要相对较少的测试，因为小的仪器内的变异性表示这种测试会很快变得冗余。当仪器内的变异性和仪器间的变异性严密平衡时，则有必要在若干测试仪器中的每个仪器上进行多个测试。

下面的表2示出了对仪器内的变异性和仪器间的变异性的不同关系的采样计划的影响。根据在实验室（仪器）间的变异性与实验室（仪器）内的变异性的比率k，即k＝SD_B/SD_W，以及可归因于不同采样计划的均值的误差的检验范围的部分给出影响。从表2中可以看出，如果实验室间的变异性相对于实验室内的变异性非常小（k=0.1），则有必要仅在单个仪器上进行测试以以下述置信度来建立均值：使得仅检验范围的一小部分可以归因于均值的不确定性。使用12%的贡献为例，可以看出，在表2的“k =0.1”这一列中，在单个测试器械上进行的四个或更多个测试是足够的。替选地，如果使用两个或三个仪器，则在每个器械上进行两个或更多个测试是足够的，并且如果使用四个仪器，则只需要在每个器械上进行一个测试。

如果k=2，则必须利用至少四个测试器械，以达到对检验范围宽度的贡献为12%或更少，如可以在表2的列“k=2”看到。

如果k=0.5，则若干个采样计划中的任一个会是足够的，包括在两个仪器中的每个仪器上进行的四个或更多个测试、在三个仪器中的每个仪器上进行的两个或更多个测试、或在四个仪器中的每个仪器上进行的一个或更多个测试。

通过使用历史测试数据预先对SD_B和SD_W进行估计，测试者能够安全地设计用于确定新的检验范围的有效采样计划。

表2.由于均值估计的不确定性而引起的范围百分比%增长

图1以流程图的形式示出了根据本发明的实施例的用于对于特定批次的质量控制材料建立统计上有效的检验均值和检验范围的方法100的步骤的概况。将认识到图1中示出的某些步骤是可选的或在某些实施例中可以不被执行。另外，可以适当地重新安排步骤的顺序。虽然图1的流程图是顺序示出的，但是可以与其它步骤并行地执行某些步骤。

在步骤101中，如上所述，收集历史测试结果的数据库。也就是说，测试实验室记录并报告合格性评定测试的结果，并且将结果连同对每个结果的测试条件进行识别的信息一起报告。可以将结果报告给在每个合格性评定测试中使用的质量控制材料的制造方。在步骤102中，数据库中的数据被管理以去除明显错误或反常的条目。数据库优选地包括很多合格性评定测试的结果，包括期望新的均值和检验范围的先前批次的质量控制材料。

在步骤103中，针对由于估计均值的不确定性产生的检验范围的百分比来设置上限。在某些实施例中，该限制可以设置在6%、8%、10%、 12%、15%、20%、25%或其它合适的值。该限制可以由执行该方法的实体来选择，并且可以被任意选择，或由于种种原因由建立限制的实体来选择。

在步骤104中，访问并使用历史结果数据库，以估计先前批次的质量控制材料的仪器内的变异性和仪器间的变异性。如上文中说明的，变异性估计可以被表达为标准偏差SD_W和SD_B。在实施例中可以使用其它类型的变异性估计，例如方差的最大似然估计或受限最大似然估计。

在步骤105中，至少部分地基于仪器内的变异性估计和仪器间的变异性估计确定采样计划。采样计划可以指明需要在多少不同的测试器械上对新批次的质量控制材料中的多少样本进行测试，以使得可足够精确地估计均值，从而均值的不确定性对检验范围的宽度的贡献不多于步骤103中设置的上限。如果仪器内的变异性和仪器间的变异性的估计被表达为标准偏差SD_W和SD_B，则可以使用表2来建立采样计划。

在步骤106中，对期望新的检验均值和范围的新批次的质量控制材料的样本进行测试。可以根据在步骤105中建立的采样计划来测试样本。

在步骤107中，可以根据针对关注的测试条件的变异性和均值之间的历史关系、基于在步骤106中计算的均值来调整仪器间和仪器内的变异性的估计。例如，可以对来自历史结果数据库的数据执行回归，以建立均值和仪器内的变异性之间以及均值和仪器间的变异性之间的预期的关系。

在步骤108中，根据仪器内的变异性估计和仪器间的变异性估计以及均值的不确定性的估计，计算整体变异性的估计。如上文中说明的，可以将均值的标准误差用作为均值的不确定性的估计。可以将标准偏差SD_R 用作整体变异性的估计，尽管本发明的实施例也可以使用其它整体变异性的再保证（reassure）。

在步骤109中，对于对在统计控制下工作的实验室中的正常运作的测试器械进行的新的合格性评定测试结果将落入待建立的检验范围内的概率，设置目标概率。例如，目标概率可以被设置在75%、80%、90%、 95.4%、99%、99.7%，99.9%或任何其它合适的值。

在步骤110中，建立检验范围的限制。优选地，该范围以计算出的均值为中心，并且具有一定宽度以使得新的合格性评定测试结果将以在步骤 109中建立的目标概率落入该范围内。当使用标准偏差SD_R估计整体变异性时，可以使用包含合格性评定测试结果的期望比例所要求的标准偏差的数目来建立该范围。

对于关注的每个新的测试条件，例如测试仪器品牌和型号、测试方法、特定质量控制材料以及质量控制材料浓度的新的组合，至少可以重复步骤 104至步骤110。

图2示出了根据本发明的实施例在检验均值和范围的分派中涉及的各种系统的交互的简化框图。多个实验室201a至201h记录合格性评定测试的结果。在历史结果数据库202中收集这些结果，并且可以如上所述管理这些结果。在图2中，描绘了使用三个不同的测试器械型号的八个实验室，但是将认识到可以存在更多的实验室和测试器械型号。检验均值和范围分派系统203对数据库202进行访问，并且执行用于分派均值和范围的计算。检验均值和范围分派系统203首先可以利用来自数据库202的数据来规划采样计划204，并且可以根据采样计划对新批次的质量控制材料的样本进行测试205。这些测试的结果被传送回检验均值和范围分派系统 203，检验均值和范围分派系统203计算并输出检验均值和范围206。

图3更详细地示出了检验均值和范围分派系统203。检验均值和范围分派系统203包括数据库202，如上所述，数据库202接收来自对多个不同的测试仪器进行的合格性评定测试301的结果。系统还包括均值确定模块302，均值确定模块302接收对新批次的质量控制材料的样本进行的测试的结果并计算测试结果的均值。系统203还包括变异性估计模块303，变异性估计模块303使用来自数据库202的数据，计算根据对至少一个先前批次的质量控制材料进行的测试获得的测试结果的变异性的估计。范围建立模块304接收均值和变异性估计、还有目标概率306，对新批次的质量控制材料的样本进行的新的合格性评定测试结果应该以目标概率306 落入检验范围内，并且范围建立模块304计算检验均值和范围206。系统 203还可以包括样本计划建立模块305，样本计划建立模块305基于来自数据库202的数据和一个或更多个其它输入来规划采样计划204，例如由于在估计均值的不确定性引起的检验范围的百分比的上限的规定307。模块302至305可以用硬件、软件、固件或这些硬件、软件、固件的组合来实现，例如使用下面更详细地描述的计算机系统。

图4中示出了根据实施例的各种数据流的更详细的描述。出于本公开的目的，来自数据库的“对等（peer）”数据是可以在针对特定测试条件建立的检验均值和范围中使用的数据。

图5是示出了可以实现本发明的实施例的示例性计算机系统500的框图。该示例示出了例如可以整体地、部分地或进行各种修改地使用的计算机系统500，用于提供本发明的检验均值和范围分派系统203和/或其它部件的功能。例如，计算机系统500可以控制或执行检验均值和范围分派系统203的各种功能，仅举例来说，包括估计仪器内的变异性和仪器间的变异性、计算均值和在均值的估计中的不确定性、回归和调整仪器内的变异性估计和仪器间的变异性估计、计算整体变异性估计、以及计算检验范围。

示出了计算机系统500，包括可以经由总线590电耦合的硬件单元。硬件单元可以包括一个或更多个中央处理单元510、一个或更多个输入装置520（例如鼠标、键盘等），以及一个或更多个输出装置530（例如显示装置、打印机等）。计算机系统500还可以包括一个或更多个存储装置540。通过示例的方式，一个或多个存储装置540可以是可编程可闪速更新的盘驱动器、光存储装置、和/或诸如随机存取存储器（“RAM”）和/或只读存储器（“ROM”）的固态存储装置等。

计算机系统500另外可以包括计算机可读存储介质读取器550、通信系统560（例如调制解调器、网卡（无线的或有线的）、红外通信装置、 Bluetooth^TM装置、蜂窝通信装置等）、以及可以包括如上所述的RAM和 ROM装置的工作存储器580。在某些实施例中，计算机系统500还可以包括处理加速单元570，处理加速单元570可以包括数字信号处理器和/ 或专用处理器等。

计算机可读存储介质读取器550还可以连接到计算机可读存储介质，从而一起（以及可选地与一个或多个存储装置540组合地）综合地表示远程、本地、固定的和/或可移除的存储装置加上用于临时和/或更永久地包含计算机可读信息的存储介质。通信系统560可以允许通过网络、系统、计算机和/或以上描述的其它部件交换数据。

计算机系统500还可以包括软件元件，被示出为当前位于工作存储器 580内，工作存储器580包括操作系统584和/或其它代码588。应该理解，计算机系统500的替选实施例可以具有根据以上描述的多种变型。例如，也可以使用定制的硬件，并且/或者以硬件、软件（包括便携式软件，例如小应用程序）或这二者来实现特定元件。此外，也会发生至其它计算装置例如网络输入/输出和数据获取装置的连接。

计算机系统500的软件可以包括用于实现本文所述的体系架构的各种元件的任何功能或全部功能的代码588。例如，存储在计算机系统例如系统500上和/或由其执行的软件，可以提供例如以上讨论的本发明的检验均值和范围分派系统203和/或其它部件的功能。在上文中已经更详细地讨论了可由软件在这些部件中的一些部件上实现的方法。

出于清楚和理解的目的，现在已经详细描述了本发明。然而，应该理解在所附权利要求的范围内可以进行某些变化和修改。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于产生质量控制材料的统计上有效的检验均值和范围的系统和方法 [P] . 中国专利： CN103548014B . 2017.01.18
2. 用于产生质量控制材料的统计上有效的检验均值和范围的系统和方法 [P] . 中国专利： CN103548014A . 2014-01-29
3. System and method for producing statistically valid assay means and ranges for quality control materials [P] . AU2017203982B2 . 2019-08-08

机译：产生用于质量控制材料的统计上有效的测定手段和范围的系统和方法
4. System and method for producing statistically valid assay means and ranges for quality control materials [P] . AU2019250160A1 . 2019-10-31

机译：产生用于质量控制材料的统计上有效的测定手段和范围的系统和方法
5. System and method for producing statistically valid assay means and ranges for quality control materials [P] . AU2016200387B2 . 2018-03-08

机译：产生用于质量控制材料的统计上有效的测定手段和范围的系统和方法