首页> 中国专利> 一种使用理化指标判断堆积酒醅微生物群落结构的方法

一种使用理化指标判断堆积酒醅微生物群落结构的方法

摘要

本发明涉及一种使用理化指标判断堆积酒醅微生物群落结构的方法。步骤如下:S1.构建不同发酵时段与微生物群落相对丰度区间的对应性关系;S2.获取待测样品的理化指标;S3:将待测样品的理化指标带入判别模型,鉴别待测样品的实际发酵时段;S4:通过步骤S1中的发酵时段与微生物群落相对丰度区间的对应性关系,得到待测样品的微生物群落结构。本发明使用测序技术,从而有效避免传统纯培养或非培养技术造成微生物信息获取严重不足的缺陷;直接利用酒醅理化指标,通过构建好的模型,快速、准确的反映待测样品所处的发酵时段,并给出这些样品合理的微生物群落组成区间,以致能够及时、有效的指导生产工作。

著录项

  • 公开/公告号CN108038350A

    专利类型发明专利

  • 公开/公告日2018-05-15

    原文格式PDF

  • 申请/专利权人 贵州茅台酒股份有限公司;

    申请/专利号CN201711184733.5

  • 申请日2017-11-23

  • 分类号

  • 代理机构北京市万慧达律师事务所;

  • 代理人谢敏楠

  • 地址 564501 贵州省遵义市仁怀市茅台镇

  • 入库时间 2023-06-19 05:18:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-19

    授权

    授权

  • 2018-06-08

    实质审查的生效 IPC(主分类):G06F19/12 申请日:20171123

    实质审查的生效

  • 2018-05-15

    公开

    公开

说明书

技术领域

本发明涉及酒醅微生物群落结构分析技术领域,具体涉及利用酒醅理化指标,结合多元统计手段,鉴别酒醅所处堆积发酵时段、判断酒醅内微生物群落结构的一种方法。

背景技术

堆积发酵是酱香型白酒生产的特殊工序环节,同时也是酱香型白酒风味形成的一个基础阶段,在堆积发酵相对开放式的条件下,将周围空气、场地、工具等处的微生物网罗富集于糟醅中,同时将曲中的微生物扩培繁殖,从而为入窖发酵提供丰富的微生物原料。在酱香型白酒生产过程中,大家逐渐形成一个共识,按生产操作规程,如加入高温曲,不进行堆积发酵,结果下一个轮次不产酒,更谈不上酱香风格;堆积发酵时间短,温度低(43~45℃),产酒多,但酱香不突出;堆积发酵时间较长,堆积温度较高(50℃左右),产酒较多,酱香突出,风格典型,可见堆积发酵工序对酒精发酵和酱香风味物质的生成都发挥了重要作用。另一方面,在堆积发酵阶段,环境较为开放,发酵质量受多种理化环境、气候因素影响,一旦微生物增殖、代谢所需要的环境条件发生改变,直接影响下游出酒环节,如出酒率低、酒质差等。微生物群落在酒醅中受微环境的影响,在整个发酵阶段经历着演替、富集和被筛选过程,并在此过程利用酒醅内的营养物质代谢产生一定量香味或香味前体物质。深度、全面了解微生物群落在整个堆积发酵阶段演替变化规律,可以为选择入窖最佳时机以及分析酒醅发酵质量不良原因提供重要线索。

目前,主要应用纯培养、变性梯度凝胶电泳(PCR-DGGE)、实时定量PCR(Q-PCR),以及近些10年逐渐兴起的二代测序技术获取酒醅发酵过程中微生物群落信息。纯培养技术虽然可意外获得某些功能性菌株,但从群落角度最多只能获得样品内不到1%的可培养微生物信息,且耗时长,人工成本大。PCR-DGGE以及Q-PCR技术相比纯培养耗时短,人力需求低,信息获取能够突破可培养微生物的限制,但该方法存在分辨率和检测限的问题,通常只能挖掘1%以上的优势微生物类群[高蕙文,吕欣,董明盛.PCR-DGGE指纹技术在食品微生物研究中的应用.食品科学,2005,26(8):465-468.]。此外,Q-PCR技术只能针对某种特定微生物群体,如芽孢杆菌,做定量分析,无法在分类水平解析。二代测序技术可较好的弥补前几类技术的缺陷,同时将微生物总信息量的挖掘提升至90%以上,能够更加全面的反映样品微生物群落结构特征。但因成本高昂,二代测序技术难以大规模应用,而在酒生产过程中,微生物群落结构的预测是普遍需求的。在实际生产中,通常参照酒醅理化参数,如温度、水分、乳酸等来了解发酵进程,而微生物生长代谢同时受控于这些因素。酒醅理化参数的检测周期短、速度快,在指导生产方面几乎无延迟性。因此,利用酒醅理化参数与二代测序数据建立分析方法,一方面可体现大数据在生产工艺使用上的优越性,另一方面可以迅速掌握发酵过程中微生物群落组成变化,从而为判断发酵质量,及时优化生产工艺提供保障。

建模方面,Wu等[Qun Wu,Jie Ling,Yan Xu.Starter culture selection formaking Chinese sesame-flavored liquor based on microbial metabolic activityin mixed-culture fermentation.AEM,2014,80(14):4450–4459.],Kong等[Yu Kong,QunWu,Yan Zhang,Yan Xu.In situ analysis of metabolic characteristics reveals thekey yeast in the spontaneous and solid-state fermentation process of Chineselight-style liquor.AEM,2014,80(12):3667–3676.]曾使用偏最小二乘回归(PLS)法建立酵母菌与风味物质之间联系,模型拟合优度良好,并可借助模型,通过酵母菌丰度数据预测相关风味物质的含量。然而此模型的构建思想,①只能反映特定变量(如风味物质)与某几类优势微生物间关系,无法尽可能反映它们与样品中所有微生物的关系;②使用降维法抽离主成分做回归,一旦解释变量远大于样本量,模型对原始数据信息的解释会出现偏差;③估计微生物组成时,其准确度受样本量影响,并且得出的结果为某一具体数值,对客观存在的推测较为绝对。此外,从指导生产角度出发,目前未见到直接使用理化参数预测微生物群落结构的方法,特别是使用二代测序原始数据构建方法。现今,随着二代测序成本降低,此技术已广泛渗透至各研究领域,所获得的微生物信息量极大。利用本发明所提供的方法,不仅可以判定待测样品所处的发酵时段,同时可以更加客观的反映这些样品中不同微生物类群相对丰度范围,从而为酿造微生物的分析思路提供新的见解。

发明内容

本发明针对实验周期对堆积发酵过程中需要即时获取酒醅微生物信息带来的滞后性,以及方法构建时微生物信息涵盖不充分,模型构建时数据总体分布有要求(如高斯分布)、样本量对模型预测准确度影响过重等技术缺陷,提供利用酒醅理化指标作预测参数,微生物二代测序原始OTU列表作响应数据集,借助二次判别分析法、Bootstrap法、以及加速偏差修正分位点法(BCa),判断样品实际所处发酵时段,以及这些样品中不同微生物类群占比区间的分析方法。本方法对检测值数据分布无要求,操作简便,并能准确的反映样品微生物组成,从而为指导生产工艺提供技术支持。

本发明的技术方案如下:

S1:构建不同发酵时段与微生物群落相对丰度区间的对应性关系,其具体又包含以下步骤:

(1)获取足够数量的、不同发酵时段的酒醅样品的理化指标和微生物测序信息;

(2)以酒醅样品的理化指标作为解释变量进行二次判别分析,构建判别模型;

(3)使用判别模型,分别对取样于不同发酵时段的建模样品进行回判;

(4)使用回判成功的酒醅样品的微生物测序信息,通过Bootstrap法计算各个发酵时段的微生物群落相对丰度区间;

S2:获取待测样品的理化指标;

S3:将待测样品的理化指标带入判别模型,鉴别待测样品的实际发酵时段;

S4:通过判别模型鉴别的发酵时段,步骤S1中的发酵时段与微生物群落相对丰度区间的对应性关系,得到待测样品的微生物群落结构;

其中,步骤S2获取待测样品的理化指标,可以在步骤S1前进行操作,也可以同时操作。

其中,步骤S1中,不同发酵时段为从丢堆至下窖整个阶段内连续选择的不同时段。基于发明人大量经验,作为优选的实施方式,预堆积时间大于4天,时段间隔不小于24小时,预堆积时间2-4天,时段间隔不小于12小时。基于此条件,时段划分越多,对样品实际发酵阶段的分辨越明晰。如果间隔时间低于设定值,微生物群落结构在两个时段间变化不显著,且增加工作量。

其中,步骤S1中,所述的足够数量是指每个发酵时段所选的样品数量能够满足构建二次判别模型的需求,当然是取样于每个发酵时段的建模样品数量越多越好。根据实践过程中,方法的可操作性,以及发明人的实践经验,每个发酵时段的样品数大于10,所构建的模型能够满足准确性要求;更优选地,每个发酵时段的样品数大于15;更优选地,每个发酵时段的样品数大于20。作为优选的实施方式,建模所用的样品取自堆体的不同部位,所取样本具有代表性,减少因取样而带来的误差。

其中,步骤S1、S2、S3中,所述的理化指标选自水分含量、乳酸含量、乙酸含量、酒精含量、温度、总糖含量、pH值中的至少三个;优选其中的至少四个。二次判别模型进行判别分析时,是根据解释变量的样本测定值在先验组间的变异,推断每个样本属于不同先验组的后验概率,概率最高的先验组即为鉴别组。此处,解释变量等同于理化指标,先验组等同于发酵时段,样本即为酒醅样品。从数学角度出发,至少两个解释变量就可以完成模型计算,但模型构建时对解释变量测定值的变异度相当敏感,一旦其中一个解释变量的少数测定值出现偏差,整个模型的预测效果会受很大影响。经验上,如果最少解释变量为三个,这种单个解释变量测定值的偏差影响通常会被其它两个解释变量缓冲掉,因此至少选择三个理化指标做建模分析。依此,如果实验条件充足,至少优选四个,模型预测效果会更好。作为优选的实施方式,在本发明的方法中,所述的理化指标选自温度、水分含量、乳酸含量、乙酸含量、酒精含量,这五个指标为酒醅发酵中最具代表性的五个指标。

其中,步骤S1中,所述的微生物测序信息是通过提取酒醅样品的DNA,进行测序技术获得;优选地,所述的测序技术为二代测序技术;更优选地,所述的二代测序技术选自454GSFLX焦磷酸测序或Illumina双端测序技术。测序后由测序公司返回的原始OTU列表数据,通常以"OTU_table.txt"或"OTU_table.xlsx"等方式储存的公知文件,文件包含样品内所有微生物信息。

作为优选的实施方式,步骤S1所述的二次判别分析,构建判别模型,可以采用任何统计软件完成,作为本发明一个示范性的实施方式,构建判别模型使用R软件完成。

作为优选的方式,所述的判别模型经过验证;作为一种可选的实施方式,经过1~K折(使用者可自定K数,但K不大于样本数)交叉验证法;优选地,所述的判别模型经过1~10折交叉验证法,精度达95%以上。

所述的采用1~K折交叉验证法,是指从1折开始直到K折(K≤样本数n),每个折数内完成t次重复运算(t≥样本数n,t越大运算结果越稳定),得到每个折数下的验证精度,并取这些验证精度的平均值作为判别模型的模型精度。此处,当K=1或K=样本数n时,验证过程等同于留一验证法。判别别模型的1~K折交叉验证可以采用现有技术中的软件进行验证,也可以在SAS、R、MATLAB等统计软件中编写程序脚本进行验证。在本发明一个实施例中,采用1~10折交叉验证法将数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计。

其中,步骤S1中,分别对取样于不同发酵时段的建模样品进行回判,具体步骤为将建模所用酒醅样品的理化性质,带入判别模型,鉴别酒醅样品的实际发酵时段,进一步地,经判别模型鉴别的实际发酵时段是通过判别模型计算出样品属于各发酵时段的鉴别概率后,其中鉴别概率最大的时段即为实际发酵时段。回判成功指建模样品的取样时的发酵时段与经模型回判后鉴别的实际发酵时段相一致。最为优选的实施方式,回判成功不仅需要满足建模样品取样时的发酵时段与经模型回判后鉴别的实际发酵时段相一致,且判别模型计算得到的最大鉴别概率大于0.6。

作为优选的实施方式,本发明采用R软件进行回判。

其中,步骤S3中,所述的将待测样品的理化指标带入判别模型,得到待测样品的实际发酵时段,是指模型在计算出样品属于各发酵时段的鉴别概率后,会选取鉴别概率最大的时段作为鉴别时段,即实际发酵时段,即同上面的回判的步骤。根据发明人大量实验后的研究经验,如果最大鉴别概率低于0.6,且此概率对应的鉴别的实际发酵时段(鉴别时段)与取样时的发酵时段(取样时段)不符,说明样品正处于一个发酵过渡时段(不属于某个特定时段)或者发酵异常,此类样品的鉴别结果不予采纳,即不能通过本发明的方法判断该待测样品的微生物群落结构。

作为优选的实施方式,其中所述的将待测样品的理化指标带入判别模型,得到待测样品的实际发酵时段,可使用R软件完成。

其中,步骤S1(4)中,通过Bootstrap法计算各个发酵时段的微生物群落相对丰度区间,此步骤基于R软件,调用boot包、RAM包。RAM包中功能函数用于将OTU数据整合成微生物不同分类等级下相对丰度数据,boot包中功能函数用于OTU数据的重抽样,以及在m次重抽样后,获得各类群相对丰度区间。参数设定:Bootstrap重置抽样次数大于样本数,且次数越多结果可信度越高。OTU数据无论来自细菌或真菌,可在界、门、纲、目、科、属、种,七个分类等级下,根据需要,整合任一分类等级的丰度数据。当然,此步骤也可使用其它软件完成。

因为不同类型、不同酒厂的制酒工艺不同。对于酱香型白酒,会进行八个轮次的堆积发酵,且每个轮次发酵的时间不一定相同,微生物群落结构也不尽相同。因此,针对不同的酒醅发酵轮次,可分别采用本发明的方法,使用理化指标判断堆积发酵的微生物群落结构。

作为一个示范性的实施例,本发明判断制酒二轮次的微生物群落结构,所述的酒醅发酵时段选自第二轮次从丢堆至下窖整个阶段,其预堆积的时间大于4天,因此选择间隔时间大于24小时为一个发酵时段,按时间顺序分为为P1、P2、P3、P4、P5五个发酵时段。

建模所采用的样本数据为每个发酵时间段15个样品。

二次判别模型构建,由R软件完成。

经过1~10折交叉验证,精度达95%以上。

二次判别模型回判建模样品,由R软件完成。

使用回判成功的建模样品,Bootstrap法得到,不同发酵时段与优势微生物群落相对丰度区间的对应性关系如下表:

其中,优势微生物为在微生物群落结构中,丰度占比大于0.5%的微生物。本领域中一般认为,这些优势微生物可以完全代表某一时段的微生物群落结构。

本发明的有益效果是:

(1)相比可培养以及常规非培养如PCR-DGGE等微生物信息提取技术,使用二代测序技术更全面反映酒醅微生物群落结构;

(2)提供二次判别建模时样本量及解释变量的合理范围、对模型强健有效的验证方法、以及待测样品鉴别结果的可信度,促使构建出的判别模型能够有效鉴别待测样品所处发酵时段;

(3)在分离微生物群落信息方面,避开使用对OTU信息处理后的“再加工”数据,而直接使用测序后生成的原始OTU数据,一方面可使分析更加高效,另一方面可避免使用“再加工”数据所导致的微生物群落信息流失或信息出现偏差的问题。

(4)Bootstrap法结合二次判别模型,为待测样品所属发酵时段提供一种各类微生物组成区间,使推测出的群落组分特征更具普适性、客观性,进而增强对生产指导的实际意义。

附图说明

图1为本发明所述方法的流程示意图;

图2是实施例2中二次判别模型对实施例的鉴别结果;柱图中每根立柱代表每个待测样品。待测样品的鉴别概率由柱中代表各发酵时段的形状填充大小表示,来源于不同取样时段的待测样品由图中黑色竖线分隔开;

图3是实施例1中,微生物信息经Bootstrap法重置计算5000次,在属分类级别下,每个发酵阶段6个代表菌群相对丰度的密度分布曲线。

具体实施方式

以下通过具体的实施例进一步说明本发明的技术方案,具体实施例不代表对本发明保护范围的限制。其他人根据本发明理念所做出的一些非本质的修改和调整仍属于本发明的保护范围。

需要说明的是,取样时的发酵时段为取样时,样品所处的发酵时段。但是由于样品所在堆体位置不同,以致理化环境及微生物组成也可能不同。因此,取自同一时段的样品,其发酵程度可能不同。如某些样品的取样时间段是第48h,其取样时间段属于P2阶段,但是该样品发酵速度可能较慢,其实际的发酵阶段还处于P1。所以本发明才通过构建模型,以及理化指标,来鉴定酒醅样品的真正的发酵时段,从而根据发酵时段与酒醅微生物群落相对丰度区间的对应性关系,获得待测样品的微生物群落特征。

标准酱香型白酒制酒工艺1年为一个生产周期,一个生产周期共九个蒸煮轮次,按时间顺序为下沙轮次、糙沙轮次、制酒一至七轮次。需要堆积发酵的前八个轮次中,每个轮次堆积时间,经酒厂常年累月生产经验,都制定有一个大致范围,这便是预堆积时间。因每年节气,时令不同,并且同一生产年中,各轮次所处月份、季节不同,以致每个轮次之间堆积发酵时间不同,同一轮次在不同生产年之间,堆积时间也略有差异。当然,微生物群落也不尽相同。

二次判别模型构建、建模样品回判、待测样品鉴别,可优选使用R软件实施。R软件操作灵活,对原始数据编排要求宽泛,读取数据简洁、快速,分析数据高效、彻底,并可将当前分析结果作为下一分析原始数据再次做分析。当然可以采用其他的软件完成。

本发明中实施例采用的R软件是由新西兰奥克兰大学的Robert Gentleman和RossIhaka及其他志愿人员开发。它是一套由数据操作、计算和图形展示功能整合而成的套件。包括:有效的数据存储和处理功能,一套完整的数组(特别是矩阵)计算操作符,一套完善、简单、有效的编程语言(包括条件、循环、自定义函数、输入输出功能),一套完整体系的数据分析工具,以及为数据分析和显示提供的强大图形功能。R软件的定位是一个完善、统一的系统,而非其他数据分析软件那样作为一个专门、不灵活的附属工具。关于R软件的详细介绍可参考百度百科(https://baike.baidu.com/item/R%E8%AF%AD%E8%A8%80/4090790?fr=aladdin),或进入官网(https://www.r-project.org/)具体了解并免费下载该软件。

实施例1 构建不同发酵时段与微生物群落相对丰度区间的对应性关系

如图1所示,一种使用理化指标判断堆积酒醅微生物群落结构的方法,包括如下步骤:

1.信息提取

本实施例中堆积酒醅样品取自制酒二轮次。以丢堆(堆体收拢完毕)为起始时间点开始取样,记为P1(0小时),后续48小时,120小时,144小时,168小时各取一次样,分别记为P2,P3,P4,P5。P1~P5各时段分别取建模样品15个,总计75个样品。取样时同时测得样品温度。实验室提取所有样品基因组DNA,另外检测样品水分含量(g/10g酒醅)、乳酸含量(g/100g酒醅)、乙酸含量(g/100g酒醅)、酒精含量(g/100g酒醅)。75个样品的采样时间段和测定的理化性质如表1。

表1 75个建模样品的采样时间段和测定的理化性质

2.获取测序信息

使用Illumina双端测序技术,对75个建模样品测序,获得样品原始OTU数据。

3.判别模型的建立

将样品按取样时段归为5组,理化参数包括温度、水分含量、乳酸含量、乙酸含量、乙醇含量作为解释变量,使用二次判别分析法对这5组样品构建判别模型。此步骤使用R软件完成。

操作方法为:①Excel表中将建模样本的理化数据整理成一个n行×p列的变量数据框,数据框行名为各建模样本名称,列名为不同理化指标名称,框内数据为每个样本对应不同理化指标的检测数值。此外,根据样本取样时段再整理一个n行×1列分组数据框,数据框行名为各样本名称,列名可自拟,如“分组”、“时段”、“group”等,每个样本取样时段如P1、P2、P3、P4、P5,分别填入。需要注意,变量数据框和分组数据框内样本名称所处框中位置要一一对应,如样本M1在变量数据框内位于第三行,它在分组数据框内必须也位于第三行。②启动R软件,复制Excel表中变量数据框,在R软件操作平台内准确输入命令“data=read.table(“clipboard”,header=T,row.names=1)”(输入时不加引号,一定键入,不能将此口令复制后粘贴输入)。而后,复制Excel表中分组数据框,在R软件操作平台内准确输入命令“library(MASS);grp=read.table(“clipboard”,header=T,row.names=1)”(输入时不加引号,一定键入,不能将此口令复制后粘贴输入)。③在R软件操作平台内准确输入“model=qda(data,grp[,1])”(输入时不加引号,可复制此口令粘贴输入)。此处的“model”即为构建出的二次判别模型。

4.模型验证

使用1~10折交叉验证法验证模型精度,每个折数下运算次数t=1000,验证结果如表1。取K=1~10,10个折数下验证精度平均值95.671%作为模型精度,证明所构建模型对5个发酵时段样品判别效果良好。

表2 二次判别模型1~10折交叉验证结果

5.回判

对建模样品做回判。其路线为:将建模样品的理化指标带入模型,以理化指标为预测变量,对建模样品做判别。此步骤由R软件完成,其具体的路线是通过软件判别模型计算出样品属于各发酵时段的鉴别概率后,其中鉴别概率最大的时段即为实际发酵时段。回判成功指样品的发酵时段来源与经模型回判后的鉴别时段相一致,且更为保险的是,判别模型计算得到的最大鉴别概率大于0.6。如果最大鉴别概率低于0.6,且此概率对应的鉴别时段与取样时段不符,说明样品正处于一个发酵过渡时段(不属于某个特定时段)或者发酵异常。

回判的操作方法为:在R软件中,二次判别模型“model”构建完成后,准确输入“predmodel=predict(model,data);predmodel”(输入时不加引号,可复制此口令粘贴输入),即可得到每个样本的鉴别时段以及各时段鉴别概率。

回判结果见表3,发酵时段回判成功的样品数分别为P1(14个)、P2(13个)、P3(14个)、P4(13个)、P5(15个),总回判成功率0.92,样品回判效果很好。

表3

注:取样时段为酒醅样品取样时,所处的时段,回判时段为该样品经回判后,鉴别得到的实际发酵时段。鉴别概率小于0.001,以0值代替

6.群落相对丰度区间估计

使用回判成功的样品微生物测序信息,Bootstrap法计算5个发酵时段细菌(属水平)各群落相对丰度区间,并将待测样品按鉴别后所属的发酵阶段归类,获得类似表4,属于不同发酵阶段待测样品的微生物群落组成区间,如样品M4I1、M4I2、M4I3的发酵程度正处于P1时段,它们中芽孢杆菌属(Bacillus)所占比例估计在45.31%~50.47%之间。而后,画出各微生物类群Bootstrap密度分布图,根据曲线正态性评估所得区间稳定性。曲线正态性越明显,表明获得的区间越稳定,即结果越能代表客观事实。如图3所示,各发酵阶段6个代表菌群相对丰度密度分布曲线正态性表现良好,说明表4对应的各菌群相对丰度区间能较为准确的反映待测样品所属发酵时段的实际微生物组成情况。

此步骤基于R软件,调用boot包、RAM包。参数设定:Bootstrap重置抽样5000次,细菌OTU数据整合基于属水平。

操作步骤是:针对OTU列表中样本列进行重抽样,抽样次数m>样本数n(m越大效果越好)。每次抽样结束后,根据需要计算不同微生物分类等级下各类群相对丰度。待所有抽样运算结束后,借助加速偏差修正分位点方法(BCa)估计95%概率下各类群相对丰度区间。同时画出对应类群概率密度曲线,评估区间估计的稳健性。此步骤需要调用R软件boot包、RAM包,RAM包中功能函数用于将OTU数据整合成微生物不同分类等级下相对丰度数据,boot包中功能函数用于OTU数据的重抽样,以及在m次(本实施例为5000次)重抽样后,获得各类群相对丰度区间。

表4 回判成功的不同发酵时段的样品与微生物群落相对丰度区间的对应性关系

实施例2 待测样品的微生物群落结构的鉴定

1,获取待测样品的理化指标

本实施例中堆积酒醅样品取自制酒二轮次。以丢堆(堆体收拢完毕)为起始时间点开始取样,记为P1(0小时),后续48小时,120小时,144小时,168小时各取一次样,分别记为P2,P3,P4,P5。P1~P5各时段分别取待测样品10个,50个样品。取样时同时测得样品温度。同时检测待测样品水分含量(g/10g酒醅)、乳酸含量(g/100g酒醅)、乙酸含量(g/100g酒醅)、酒精含量(g/100g酒醅)。50个样品的采样时间段和测定的理化性质如表5。

表5 50个待测样品的采样时间段和测定的理化性质

2鉴别待测样品的实际发酵时段

将待测样品的理化指标带入判别模型,鉴别待测样品的实际发酵时段。

如附图2所示,某些来源于P1时段的样品,被鉴别属于P1时段的概率最高,模型推断此样品发酵水平处于时段P1;另一些取自发酵时段P4的样品,被鉴别属于P2时段的概率最高,因此推断此样品发酵水平正处于时段P2,即可说明此类样品所处堆体位置发酵程度相对缓慢,虽然这些样取自于P4时段,但发酵水平正处于P2时段。最终50个待测样品经鉴别,分别处于5个发酵阶段。其中,仅一个样品M16IV5的最大鉴别概率低于0.6的同时,其鉴别时段P3与取样时段P2不符,说明此样品发酵水平很可能处于P2-P3的过渡阶段,或样品本身发酵异常。据此,样品M16IV5的鉴别结果不予采纳。其余49个样品均符合鉴别结果的采纳要求,说明模型对待测样品识别度良好。

此步骤采用R软件完成,操作方法为:①Excel表中将待测样品的理化数据整理成一个n行×p列的变量数据框,数据框行名为各建模样本名称,列名为不同理化指标名称,框内数据为每个样本对应不同理化指标的检测数值。此处需注意,待测样品所用理化指标必须与建模样品所用理化指标完全相同,且各理化指标在这两个变量数据框中所处列的位置一一对应。如建模所用变量数据框中,乳酸位于第二列,待测样品的变量数据框中乳酸也必须位于第二列。②复制Excel表中变量数据框,在R软件操作平台内准确输入命令“test=read.table(“clipboard”,header=T,row.names=1)”(输入时不加引号,一定键入,不能将此口令复制后粘贴输入)。③待测样本变量数据框代入模型“model”,即准确输入命令“discrim=predict(model,test);discrim”(输入时不加引号,可复制此口令粘贴输入),可得到待测样本鉴别时段以及每个时段鉴别概率。

表6 待测样品的发酵时段鉴别结果

注:取样时段为酒醅样品取样时,所处的发酵时段,鉴别时段为该样品经模型判别后,鉴别得到的实际发酵时段。鉴别概率小于0.001,以0值代替。鉴别结果不予采纳的样品,以加粗字体指示。

3.待测样品的微生物群落结构

通过模型预测的实际发酵时段,根据实施例1中获得的发酵时段与优势微生物群落相对丰度区间的对应性关系,得到待测样品的微生物群落结构结果见表7。

表7 待测样品的微生物群落结构

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号