首页> 中国专利> 建立自闭症儿童康复效果预测模型的方法、预测自闭症儿童康复效果的方法及系统

建立自闭症儿童康复效果预测模型的方法、预测自闭症儿童康复效果的方法及系统

摘要

本发明公开了一种建立自闭症儿童康复效果预测模型的方法,所述模型包括多棵代表不同特征分类的弱决策树;所述样本根据其特征在每棵弱决策树上对应一个节点;所述节点对应着该棵决策树上的分数;所述样本在所有决策树上的分数加和即为该样本的特征值。所述建立方法包含以下步骤:步骤a:获取自闭症儿童的基本信息;步骤b:获取自闭症儿童中残联47项指标的评估结果;步骤c:将获取的上述基本信息和评估结果信息矢量化为特征值;步骤d:依据上述特征值进行机器学习,得到上述各项特征对于自闭症儿童康复效果的权重值,完成模型建立。本发明还公开了一种预测自闭症儿童康复效果的方法及系统。

著录项

说明书

技术领域

本发明属于人工智能技术领域,具体涉及一种建立自闭症儿童康复预测模型的方法以及基于该模型方法的系统。

背景技术

症状分析是自闭症儿童康复活动中的重要一环。目前,自闭症儿童的康复环节中,症状分析都是由康复师根据特征表现,以以往具有相似表现的症状分析为基础,生成新的症状分析反馈给自闭症儿童。

自闭症儿童的基数极为庞大,而有经验的康复师的数量相较之下则少之又少,如何将经验丰富的康复师对儿童通过经验进行的康复趋势的判断转化为科学可复现的预测模型,是一个重要的问题。经验不足的康复师们可能无法对自闭症儿童做出最有效的康复趋势判断,通过机器学习将康复师的经验转化为预测模型,可以大大提高经验尚浅的康复师对自闭症儿童康复趋势的判断,从而提高对自闭症儿童康复的成效。

发明内容

本发明为了克服现有技术的缺陷,提出了一种建立自闭症儿童康复效果预测模型的方法,所述方法包含以下步骤:

步骤a:获取自闭症儿童的基本信息;

步骤b:获取自闭症儿童中残联47项指标的评估结果;

步骤c:将获取的上述基本信息和评估结果信息矢量化为特征值;

步骤d:依据上述特征进行机器学习建立模型,建立用于自闭症儿童康复效果预测的模型,并得到上述各项特征对于自闭症儿童康复效果的权重值。

其中,建立模型的方法如下:

所述模型为F模型,用以预测

所述模型建立分为M个阶段,在每个阶段m(1≤m≤M)中,对F

已知实际的差值为L

本发明为了最小化模型误差

本发明为了考虑到更多的场景,使用贪婪算法进行预测,贪婪算法的模型如下:

其中,

在预测中采用CART回归树的思想,运用了如下函数将预测函数F

F

在模型中,通过贝叶斯算法防止过拟合,其原理为重新定义MSE的运算方法来减小误差,即其原理为在计算原函数的MSE时,在原函数上增加人为的误差以增加模型的普适性,具体算法如下:

将实际模型简化为:y=f(x)+ε;

其中,f(x)为预测函数,ε为人为增加的误差,方差为σ

最终可得可得如下函数:

其中,

最后得到符合上述函数的模型,并得到各项特征值的权重值。

本发明运用交叉验证技术,反复将数据集拆分为运算集和测试集,对样本进行多次模型建立,并筛选出其中结果最优的模型;所述数据集为所有儿童的30项儿童基本信息及47项特征值;

所述最优模型为根据运算集得到的模型,用测试集中的输入信息预测输出信息,其结果与测试集中的输出信息进行比对,保留正确率最高的模型;

进一步筛选最优的参数。

本发明中所述特征值为矢量数据。

本发明还提出了一种上述方法应用中建立的模型,所述模型包括多棵代表不同特征分类的弱决策树;所述样本根据其特征在每棵弱决策树上对应一个节点;所述节点对应着该棵决策树上的分数;所述样本在所有决策树上的分数加和即为该样本的特征值。

本发明还公开了一种非诊断目的的基于上述模型预测自闭症儿童康复效果的方法,所述方法包含以下步骤:

步骤I:获取自闭症儿童的基本信息;

步骤II:获取自闭症儿童中残联47项指标的评估结果;

步骤III:将获取的上述基本信息和评估结果信息矢量化为特征值;

步骤IV:将上述特征输入事先建立的模型中运算;

步骤V:得到针对该儿童自闭症康复效果的预测。

本发明还提出了一种预测自闭症儿童康复效果的系统,所述系统包含以下:

数据录入模块:包含前端网页和微信小程序,负责录入自闭症儿童的基本信息和中残联47项指标的评估结果;

数据库模块:负责储存,筛选录入的自闭症儿童基本信息及中残联47项评估指标的结果;所述筛选为根据所需要获得的模型依照模型特征对数据进行筛选;

机器学习模块:负责通过XGBoost算法学习并建立自闭症儿童康复效果预测模型,获得各项自闭症儿童特征对于自闭症儿童康复效果的权重值;

预测模块:负责将录入的自闭症儿童基本信息及中残联47项指标的评估结果代入模型中进行预测并返回康复概率实现自闭症儿童康复效果预测。

本发明的有益效果在于:

本发明可以把康复师在实际对儿童自闭症康复效果进行评估时积累的经验转化为数学模型,将儿童的数据输入本发明即可预测该儿童的自闭症康复效果。

此外,现有各类自闭症康复课程繁多,本发明可以作为一个帮助评估课程有效性的指标。

附图说明

图1是本发明特征值权值图。

图2是本发明一个含有n个数据,折叠k次的数据集。

图3是本发明随机化后的数据集。

图4是本发明第一次拆分模型计算的数据集。

图5是本发明第二次拆分模型计算的数据集。

图6是本发明第三次拆分模型计算的数据集。

图7是本发明实施例中数据部分截图。

具体实施方式

结合以下具体实施例和附图,对发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。

本发明提出了一种建立自闭症儿童康复效果预测模型的方法,所述方法包含以下步骤:

步骤a:获取自闭症儿童的基本信息;

步骤b:获取自闭症儿童中残联47项指标的评估结果;

步骤c:将获取的上述基本信息和评估结果信息矢量化为特征值;

步骤d:依据上述特征进行机器学习建立模型,得到上述各项特征对于自闭症儿童康复效果的权重值,完成模型建立。

本发明还公开了一种基于上述模型预测自闭症儿童康复效果的方法,所述方法包含以下步骤:

步骤I:获取自闭症儿童的基本信息;

步骤II:获取自闭症儿童中残联47项指标的评估结果;

步骤III:将获取的上述基本信息和评估结果信息矢量化为特征值;

步骤IV:将上述特征输入事先建立的模型中运算;

步骤V:得到针对该儿童自闭症康复效果的预测。

本发明还公开了一种预测自闭症儿童康复效果的系统,所述系统包含以下:

数据录入模块:包含前端网页和微信小程序,负责录入自闭症儿童的基本信息和中残联47项指标的评估结果;

数据库模块:负责储存,筛选录入的自闭症儿童基本信息及中残联47项评估指标的结果;所述筛选为根据所需要获得的模型依照模型特征对数据进行筛选(例:若只想研究上海儿童的情况,则筛选出上海儿童的数据,得到上海儿童的模型);

机器学习模块:负责通过XGBoost算法学习并建立自闭症儿童康复效果预测模型,获得各项自闭症儿童特征对于自闭症儿童康复效果的权重值;

预测模块:负责将录入的自闭症儿童基本信息及中残联47项指标的评估结果代入模型中进行预测并返回康复概率实现自闭症儿童康复效果预测。

本发明还提出了一种上述方法应用中建立的模型,所述模型包括多棵代表不同特征分类的弱决策树;所述样本根据其特征在每棵弱决策树上对应一个节点;所述节点对应着该棵决策树上的分数;所述样本在所有决策树上的分数加和即为该样本的特征值。

在步骤d中,采用XGBoost算法作为建立机器学习预测自闭症儿童康复效果模型的机器学习算法。XGBoost是梯度提升树(GDBT)算法的增强算法,其核心在于回归树(CART)。在XGBoost中,建立以下模型:

本发明建立名为F的模型,以预测

本发明的模型建立分为M个阶段,在每个阶段m(1≤m≤M)中,对F

已知实际的差值为MSE

而为了最小化本发明中模型误差

在预测中还采用了CART回归树的思想,运用了如下函数将预测函数拆分。F

在精确预测模型的同时,也需要避免过拟合。在模型中,贝叶斯算法是防止过拟合的主要方法。具体算法如下:

在数据集D中,

最后得到符合上述函数的模型,并得到各项特征值的权重值。

在步骤d中,为了让模型尽可能普适,运用了交叉验证(Cross Validation)技术,反复将数据集拆分为运算集和测试集。假设有一含有n个数据,折叠k次的数据集;先将数据集进行随机化,然后进行连续三次拆分模型计算。

可见,折叠三次可以对样本进行三次模型建立,并可以筛选出其中结果最优的模型,从而进一步筛选最优的参数。

在实际的运算中,随机拆分了30%总样本的样本数据作为测试集,将测试集的结果与对测试集的预测结果进行反复比对,最后反复验证计算出最合适的参数,从而计算出最准确的模型。

建模方法中,算法要求输入的数据为矢量数据,则需要对数据进行整理(步骤c),具体细则依下表:

在步骤III中,对于自闭症儿童康复效果的判定基于该儿童中残联47个评估点的评估结果总分判定,若该儿童康复训练后评估总分高于训练前评估总分,则认定该儿童的康复有效果,反之则表示无效。

实施例

将模拟的30条儿童数据放入t1.csv中:每个模拟的儿童数据中均包含了上述儿童基本信息及儿童的47个社交评估点的信息。

其中数据部分截图如图7所示,每行对应一个儿童信息,每列对应一个儿童指标,如列J对应的即是儿童母亲的怀孕周数。

通过这行命令

通过

运算完成后即可以获得模型model,用y_pred=model.predict(X_test)函数来对目标结果进行预测。在测试阶段(测试集中有准确的结果,与预测结果进行对比则可以知道准确率),

在实际预测中(结果未知),则可以通过如下命令获得预测的准确率:

model.predict_proba(X_test。

在模拟运算中,取九条数据作为测试集,则程序会输出预测结果,并与实际结果进行对比,得出预测准确率:

然后随机模拟一组数据,将其保存为t2.csv,并对t2进行预测,得到结果为:

本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号