首页> 外文OA文献 >Design and evaluation of analytical tools for emergency department management based on machine learning techniques
【2h】

Design and evaluation of analytical tools for emergency department management based on machine learning techniques

机译:基于机器学习技术的应急部门管理分析工具的设计与评估

摘要

The Spanish National Healthcare System (NHS) is mostly publicly funded and provided. It is considered highly cost-efficient according to international studies based on World Health Organization (WHO) data. However, the contention of healthcare costs increases while maintaining adequate levels of quality of care, is still a largely unsolved problem. In recent years, Emergency Departments (EDs) of specialized care hospitals have been subjected to budget restrictions, increased visits and increased clinical complexity of these visits. These circumstances require new approaches to ED management, which could benefit from decision support tools. In this Ph.D. thesis, we propose machine learning solutions for two problems common to most EDs of specialized care hospitals: ED census forecasting and real-time prediction of probabilities of inpatient admission for all triaged patients in the ED. These solutions could be used as decision support systems. Data for the development of these solutions were provided by the Ramon y Cajal University Hospital of Madrid, a large specialized care referral center with all medical specialties excepting Obstetrics. In years 2011 and 2012 it had approximately 1,100 beds and approximately 553,000 patients assigned to its clinical area. Another topic of this Ph.D. thesis are software tools for the generation of logistic regression and Cox regression nomograms, since nomograms can be used as clinical decision aids and as contingency procedures in case of failure of computer-based decision support systems. The first topic of this Ph.D. thesis is the development of models for ED census forecasting (i.e. prediction of the number of patients present at the ED at a given time). One of the uses of ED census forecasting is nursing personnel allocation, based on national and international recommendations. We chose an 8-hour granularity for our forecasts since many resources (such as nursing personnel) in the ED are organized in 8-hour shifts. Our aim was to generate forecasts for two dependent variables: average ED census levels and maximum ED census levels. Maximum ED census forecasts within 8-hour shifts could be used for nursing personnel allocation, while average ED census forecasts within 8-hour shifts could be used for the other needs (such as allocation of administrative personnel). We used a generalized regression approach to time series forecasting with several machine learning algorithms: M5P, Alternating Model Trees (AMT) and Support Vector Regression (SVR). We compared these to a series of benchmarks: usual nursing staffing levels (and usual resource allocation policies), stratified average (averages stratified by the three 8-hour shifts of a day), linear regression and Seasonal Autoregressive Integrated Moving Average (SARIMA) models. Forecasts were generated for both dependent variables: average ED census levels and maximum ED census levels. Four forecast horizons were tested: 1 week, 2 weeks, 4 weeks and 8 weeks. Underestimation risks, overestimation risks and approximations to monetary costs of resource allocations policies were defined for both average and maximum ED census forecasts. Maximum ED census forecasts were transformed into nursing personnel levels, and underestimation and overestimation risks for maximum ED census forecasts were transformed into understaffing and overstaffing risks. A custom training and evaluation scheme was used, with increasingly larger train sets and fixed-length test sets. The same scheme but with fixed-length train sets of 1 year and fixed-length test sets was also used. The latter approach did not improve the results. In the case of maximum ED census forecasts, M5P was the best choice for the reduction of major and medium nursing personnel understaffing risks, for all forecast horizons. Compared to the usual staffing levels, personnel planning with M5P could reduce major understaffing (>9 nurse) risks more than 10-fold (a reduction to ~1% with M5P compared to ~13% obtained with the usual nurse staffing levels); and could reduce medium understaffing (7-9 nurses) risks approximately 3-fold (a reduction to ~3% with M5P compared to ~10% obtained with the usual staffing levels). The usage of M5P also implied 5% - 6.1% increases in estimated nursing personnel costs (compared to the usual staffing levels), which are acceptable given the large reductions in understaffing risks. In the case of average ED census forecasts, once again, M5P was the best choice for the reduction of major and medium underestimation risks, for all forecast horizons. Relative risk reductions were similar to those of maximum ED census forecasts (more than 10-fold reduction in major underestimation and approximately 3-fold reduction in medium underestimation, compared to usual resource allocation policies). However, in this case, the usual resource allocation policies already had low risks of major and medium underestimation (~2% risk of major underestimation and ~3.7% risk of medium underestimation). On the other hand, most importantly, in the case of average ED census forecasts, M5P led to a cost reduction of more than 15% compared to the usual resource allocation policies. The second topic of this Ph.D. thesis is the development of models for real-time prediction of probabilities of inpatient admission from the ED. Our aim in this case was the development of classifiers with adequate performance in terms of both discrimination and calibration (goodness-of-fit), reliant on a small number of variables, available in most ED settings right after triage. In our setting, the Manchester Triage System (MTS) was used. Discrimination was evaluated with the area under the ROC curve (AUROC). Calibration was evaluated with Hosmer-Lemeshow (H-L) χ2 and p-values with 10 fixed probability intervals. We used logistic regression (LR) models, artificial neural networks (ANN) models and models based on an ad hoc ensemble classifier that optimized calibration (it combined a LR model with a tree of MTS chief complaints with LogitBoost on its leaves). A custom method was used for the evaluation of models, with increasingly larger train sets and 12 consecutive test sets of approximately monthly length. This evaluation method produced the results that follow, reported with 95 % confidence intervals (CIs). For LR models, average AUROC = 0.8531, 95% CI (0.8501, 0.8561); for ANN models, average AUROC = 0.8568, 95% CI (0.8531, 0.8606) and for ad hoc ensemble classifier models, average AUROC = 0.8635, 95% CI (0.8605, 0.8665). Confidence intervals of average AUROCs for LR and ad hoc ensemble classifier models did not overlap. Confidence intervals of average AUROCs for LR and ANN models slightly overlapped, although ANN models had higher AUROCs than LR models in all but one of the 12 test sets. Average H-L χ2 were, respectively, 35.15, 95% CI (32.57, 37.73) for LR models, 10.47, 95% CI (7.78, 13.17) for ANN models and 11.4, 95% CI (9.10, 13.75) for ad hoc ensemble classifier models. Both ANN and ad hoc ensemble classifier models possessed better calibration than LR models, with H-L p-values>0.05 in 10 of the 12 experiments. The third topic of this Ph.D thesis is the development and evaluation of software for the generation of logistic and Cox regression nomograms. We developed two programs (nomolog and nomocox) for these purposes, based on Stata (a statistical software package widely used in biomedical research). At the time of the writing of this Ph.D. thesis these programs are used by an international community of researchers in the fields of clinical medicine, epidemiology or biostatistics. We surveyed some of these users about their background, their user experience with nomolog and nomocox, as well as the ease-of-use and flexibility of our programs compared to those available in R (another well-known statistical software). Most respondents were “Promoters” (Net Promoter Score > 8), i.e. very likely to recommend the software to other researchers. All respondents (100%) who had used both our programs (nomolog and nomocox) and nomogram generators available for the R statistical software, found nomocox and nomolog easier to use; with a 95% adjusted Wald CI (75.83%, 100%). A raw proportion of 81.25%, with a 95% adjusted Wald CI (54.03%, 96.36%) found our programs to be more flexible than the nomogram generators available for the R statistical software. RESUMEN El Sistema Nacional de Salud (SNS) español es fundamentalmente público, tanto en su financiación, como en la titularidad de los entes proveedores. El SNS español es considerado altamente eficiente en términos de costes según estudios internacionales basados en datos de la Organización Mundial de la Salud (OMS). Sin embargo, la contención del incremento de los costes sanitarios, manteniendo a la vez niveles de calidad asistencial adecuados, sigue siendo un problema de difícil solución. En los últimos años los servicios de urgencias de los hospitales de atención especializada se han visto sometidos a restricciones presupuestarias, acompañadas de un incremento simultáneo del número de visitas y de la complejidad clínica de las mismas. Estas circunstancias exigen nuevos modelos de gestión de estos servicios de urgencias, que podrían beneficiarse de sistemas de soporte a la decisión. En esta tesis doctoral se proponen soluciones basadas en algoritmos de aprendizaje automático para dos problemas comunes a la mayoría de los servicios de urgencias de hospitales de atención especializada: la predicción del censo de urgencias y la predicción en tiempo real de las probabilidades de hospitalización para todos los pacientes triados presentes en el servicio de urgencias en un determinado momento. Dichas soluciones pueden emplearse en la construcción de sistemas de soporte a la decisión. Los datos para dichos estudios fueron proporcionados por el Hospital Universitario Ramón y Cajal de Madrid, un hospital de atención especializada con todas las especialidades médicas exceptuando Obstetricia. En los años 2011 y 2012 este hospital tenía aproximadamente 1.100 camas instaladas y aproximadamente 553.000 pacientes asignados a su área clínica. Otro tema tratado en esta tesis es el desarrollo y la evaluación de herramientas software para la generación de nomogramas para modelos basados en regresión logística y en regresión de Cox, dado que los nomogramas pueden emplearse para ayudar en la toma de decisiones clínicas o en procedimientos de contingencia en caso de fallo de sistemas de soporte a la decisión basados en sistemas de información. El primer tema de esta tesis doctoral es la generación de modelos para la predicción de niveles de censo de urgencias (número de pacientes en el servicio de urgencias en un determinado instante de tiempo). Una de las aplicaciones de la predicción del censo de urgencias es la planificación del personal de enfermería, basada en recomendaciones nacionales e internacionales. Se decidió emplear una granularidad de 8 horas en las predicciones dado que numerosos recursos de los servicios de urgencias hospitalarias están organizados en turnos de 8 horas. Nuestro objetivo era generar predicciones para dos variables dependientes: niveles máximos de censo de urgencias y niveles medios de censo de urgencias. Las predicciones de niveles máximos de censo de urgencias en turnos de 8 horas pueden emplearse para la planificación de personal de enfermería, mientras que las predicciones de niveles medios de censo de urgencias en turnos de 8 horas pueden emplearse para otros fines (tales como la asignación de personal administrativo). Se construyeron modelos de series temporales basados en métodos de regresión generalizada con los siguientes algoritmos de aprendizaje automático: M5P, Alternating Model Trees (AMT) y Support Vector Regression (SVR). Estos modelos fueron comparados con una serie de modelos de referencia: dotación de personal habitual (y niveles de dotación de recursos habituales), medias estratificadas (medias estratificadas por los tres turnos diarios, de 8 horas cada uno), regresión lineal y Seasonal Autoregressive Integrated Moving Average (SARIMA). Se generaron predicciones para las dos variables dependientes: niveles medios de censo de urgencias y niveles máximos de censo de urgencias. Se probaron cuatro horizontes de predicción: 1 semana, 2 semanas, 4 semanas y 8 semanas. Se definieron riesgos de subestimación, riesgos de sobreestimación y aproximaciones a costes de políticas de asignación de recursos para las predicciones de niveles de censo medios y máximos. Las predicciones de niveles de censo máximos fueron transformadas en requisitos de personal de enfermería; y los riesgos de subestimación y sobreestimación para niveles de censo máximos fueron transformados en riesgos de subestimación y sobreestimación de personal. Se empleó un esquema propio de entrenamiento y prueba, con conjuntos de entrenamiento de tamaño creciente y conjuntos de prueba de tamaño fijo. También se empleó el mismo esquema con una variación consistente en el uso de conjuntos de entrenamiento de tamaño fijo de un año y conjuntos de prueba de longitud fija. Este último esquema no produjo una mejora de los resultados. En el caso de las predicciones de niveles máximos de censo de urgencias, M5P fue la mejor opción para la reducción del riesgo de situaciones de subestimación de severidad alta y severidad media de personal de enfermería para todos los horizontes de predicción. En comparación con los niveles habituales de personal de enfermería, el uso de M5P podría reducir los riesgos de severidad alta de subestimación de personal de enfermería (> 9 enfermeros/as) en más de 10 veces (una reducción hasta el ~ 1 % con M5P en comparación con el ~13% obtenido con los niveles habituales de personal de enfermería); y podría reducir los riesgos de subestimación de severidad media de de personal de enfermería (7-9 enfermeros/as) en aproximadamente 3 veces (una reducción hasta el ~3 % con M5P en comparación con el ~10% obtenido con los niveles habituales de personal de enfermería). El uso de M5P también implicaría incrementos de costes estimados de personal de enfermería de 5% - 6,1% en comparación con los niveles de personal habituales. Dicho incremento de costes sería aceptable dadas las grandes reducciones de riesgos de subestimación de personal de enfermería. En el caso de las predicciones de niveles medios de censo de urgencias, M5P también fue la mejor opción para la reducción de los riesgos de subestimación de severidad alta y media para todos los horizontes de predicción. Las reducciones relativas de riesgos de subestimación eran similares a las de las obtenidas sobre las predicciones de niveles máximos de censo de urgencias (reducción en más de 10 veces de los riesgos de subestimación de severidad alta y reducción en aproximadamente 3 veces de los riesgos de subestimación de severidad media, en comparación con las políticas habituales de asignación de recursos). Sin embargo, en este caso, las políticas habituales de asignación de recursos ya presentaban riesgos reducidos de subestimación de severidades alta y media (~ 2% de riesgo de subestimación de severidad alta y ~ 3,7% de riesgo de subestimación de severidad media). No obstante, en el caso de las predicciones de niveles medios de censo de urgencias, el uso de M5P conduciría también a una reducción de costes superior al 15% en comparación con las políticas habituales de asignación de recursos. El segundo tema tratado en esta tesis doctoral es el desarrollo de modelos para la predicción de probabilidades de hospitalización procedente de urgencias en tiempo real. El objetivo en este caso era desarrollar modelos predictivos basados en un número reducido de variables disponibles en la mayor parte de los servicios de urgencias de atención especializada inmediatamente después del triaje. En nuestro caso se empleaba el Sistema de Triaje Manchester (MTS). Asimismo, era fundamental diseñar clasificadores con un rendimiento adecuado en términos de discriminación y calibración. La discriminación se evaluó con áreas bajo la curva ROC (AUROC). La calibración se evaluó con χ2 y p-valores de Hosmer- Lemeshow (H-L), con 10 grupos fijos de probabilidad. Se emplearon modelos de regresión logística (RL), redes neuronales artificiales (RNA) y modelos basados en un algoritmo ad hoc que optimizaba la calibración (combinaba un modelo base de regresión logística con un árbol de motivos de consulta del MTS con modelos LogitBoost en sus ramas). Se empleó un método de evaluación propio, con conjuntos de entrenamiento de tamaño creciente y 12 conjuntos de prueba consecutivos de una longitud aproximadamente mensual. Dicho método de evaluación produjo los resultados que se indican a continuación, con intervalos de confianza (ICs) al 95 %. Para los modelos de RL, AUROC media = 0,8531, IC 95% (0,8501 , 0,8561), para los modelos de RNA, AUROC media = 0,8568, IC 95% (0,8531 , 0,8606), y para los modelos ad hoc, AUROC media = 0,8635, IC 95% (0,8605 , 0,8665). Los intervalos de confianza de AUROCs medias para modelos de RL y ad hoc no se superponían. Los intervalos de confianza de AUROCs medias para modelos de RL y modelos de RNA sí se superponían ligeramente, aunque los modelos de RNA tenían AUROCs más elevadas que los modelos de RL en los 12 conjuntos de prueba exceptuando uno. Las χ2 de H-L promedio fueron, respectivamente, 35,15 IC 95% (32,57 , 37,73) para modelos de LR, 10,47; IC 95% (7,78 , 13,17) para los modelos de RNA y 11.4, IC 95% (9,10 , 13,75) para los modelos ad hoc. Tanto los modelos de RNA como los modelos ad hoc tenían una calibración mejor que los RL, con p-valor H-L > 0.05 en 10 de los 12 experimentos. El tercer tema de esta tesis doctoral es el desarrollo y evaluación de software para la generación de nomogramas basados en modelos de regresión logística binaria y regresión de Cox. Se han desarrollado dos programas (nomolog y nomocox) basados en Stata (un paquete de software estadístico ampliamente usado en la investigación biomédica). En el momento de la redacción de esta tesis doctoral, estos programas son usados por una comunidad internacional formada por investigadores en las disciplinas de medicina clínica, epidemiología y bioestadística. Se realizó una encuesta a dicha comunidad de usuarios sobre el perfil de cada investigador, así como sobre la experiencia de usuario de los programas nomolog y nomocox. También se evaluó la facilidad de uso y la flexibilidad de estos programas en comparación con los generadores de nomogramas disponibles en el software estadístico R (un software estadístico ampliamente conocido). La mayoría de los encuestados afirmaron ser "promotores" (Net Promoter Score > 8), es decir, muy propensos a recomendar el software a otros investigadores. Todos los encuestados (100%), que habían utilizado tanto los generadores de nomogramas disponibles para el software estadístico R como los generadores de nomogramas nomolog y nomocox, indicaron que estos últimos eran más fáciles de usar, con un IC 95% de Wald ajustado (75,83% , 100%). Asimismo, una proporción del 81,25%, IC 95% de Wald ajustado (54,03% , 96,36%) afirmó que nomolog y nomocox eran más flexibles que los generadores de nomogramas disponibles para el software estadístico R.
机译:西班牙国家医疗保健系统(NHS)主要由公共资助和提供。根据基于世界卫生组织(WHO)数据的国际研究,此方法被认为具有很高的成本效益。然而,在维持适当水平的护理质量的同时,医疗保健费用的争夺仍然是很大程度上未解决的问题。近年来,专业护理医院的急诊科(ED)受到预算限制,增加的就诊次数以及这些就诊的临床复杂性的增加。这些情况要求采用新的ED管理方法,这些方法可以从决策支持工具中受益。在这个博士学位论文中,我们针对大多数专科医院急诊室常见的两个问题提出了机器学习解决方案:急诊普查预测和急诊科所有分诊患者住院率的实时预测。这些解决方案可以用作决策支持系统。这些解决方案的开发数据由马德里拉蒙·卡哈尔大学医院提供,马德里是一家大型专业护理转诊中心,除产科外,所有其他医学专业。在2011年和2012年,该病床约有1100张床位,约有553,000名患者分配到其临床区域。这个博士的另一个话题。论文是用于生成逻辑回归和Cox回归列线图的软件工具,因为列线图可以用作临床决策辅助工具,也可以在基于计算机的决策支持系统出现故障时用作应急程序。该博士的第一个主题论文是ED普查预测模型的开发(即预测给定时间在ED的患者人数)。 ED普查预测的用途之一是根据国家和国际建议分配护理人员。由于急诊室中的许多资源(例如护理人员)都是按8小时轮班组织的,因此我们为预测选择了8小时粒度。我们的目标是生成两个因变量的预测:平均ED普查水平和最大ED普查水平。 8小时班次内的最大ED普查预测可用于护理人员分配,而8小时班次内的平均ED普查预测可用于其他需求(例如管理人员分配)。我们使用通用回归方法通过以下几种机器学习算法对时间序列进行预测:M5P,交替模型树(AMT)和支持向量回归(SVR)。我们将它们与一系列基准进行了比较:通常的护理人员配备水平(和通常的资源分配政策),分层的平均值(每天的三个8小时班次进行分层的平均值),线性回归和季节性自回归综合移动平均(SARIMA)模型。产生了两个因变量的预测:平均ED普查水平和最大ED普查水平。测试了四个预测范围:1周,2周,4周和8周。针对ED普查的平均和最大预测,定义了低估风险,高估风险和资源分配政策货币成本的近似值。 ED普查的最高预测被转换为护理人员的水平,而ED普查的最大预测被低估和高估的风险被转换为人员不足和人员过多的风险。使用了定制的培训和评估方案,其中包含越来越多的训练集和固定长度的测试集。也使用相同的方案,但使用1年的定长火车集和定长测试集。后一种方法没有改善结果。就最大的ED普查预测而言,在所有预测范围内,M5P是减少大中型护理人员人员不足风险的最佳选择。与通常的人员配置水平相比,使用M5P进行人员计划可以将严重的人员不足(> 9名护士)风险降低10倍以上(M5P降低到〜1%,而通常的护士配置水平为〜13%);并可以减少中等人员不足(7-9名护士)的风险约3倍(M5P降低到〜3%,而通常人员配置水平则降低到〜10%)。 M5P的使用还意味着护理人员的估计成本增加了5%-6.1%(与通常的人员配备水平相比),考虑到人员不足的风险已大大降低,因此可以接受。就ED普查的平均预测而言,对于所有预测范围,M5P再次是降低主要和中等低估风险的最佳选择。相对风险降低与最大的ED普查预测相似(与通常的资源分配政策相比,主要低估降低了10倍以上,中度低估降低了约3倍)。但是,在这种情况下,通常的资源分配政策已经具有较低的重大和中等偏低风险(重大偏低的风险约为2%,中等偏低的风险约为3.7%)。另一方面,最重要的是,在平均ED普查预测的情况下,与通常的资源分配政策相比,M5P导致成本降低了15%以上。本博士课程的第二个主题论文是用于从ED实时预测住院率的模型的开发。在这种情况下,我们的目标是开发分类器,该分类器在辨别和校准(拟合优度)方面均具有良好的性能,并且依赖于少数变量,这些变量在分诊后立即在大多数ED设置中可用。在我们的环境中,使用了曼彻斯特分诊系统(MTS)。使用ROC曲线下的面积(AUROC)评估歧视。用Hosmer-Lemeshow(H-L)χ2和带有10个固定概率区间的p值评估校准。我们使用了逻辑回归(LR)模型,人工神经网络(ANN)模型以及基于优化校准的临时集成分类器的模型(该模型将LR模型与MTS主要投诉树结合在一起,并在其叶子上放置LogitBoost)。定制方法用于模型评估,具有越来越大的训练集和大约每月长度的12个连续测试集。此评估方法产生了以下结果,报告的置信区间为95%(CIs)。对于LR型号,平均AUROC = 0.8531,95%CI(0.8501,0.8561);对于ANN模型,平均AUROC = 0.8568,95%CI(0.8531,0.8606);对于临时集成分类器模型,平均AUROC = 0.8635,95%CI(0.8605,0.8665)。 LR和临时集合分类器模型的平均AUROC的置信区间不重叠。 LR和ANN模型的平均AUROC的置信区间略有重叠,尽管除12个测试集之一以外,所有ANN模型的AUROC均比LR模型高。 LR模型的平均HLχ2分别为35.15,95%CI(32.57,37.73),ANN模型的平均HLχ2为10.47,95%CI(7.78,13.17)和ad hoc集成分类器为11.4,95%CI(9.10,13.75)楷模。 ANN和临时集合分类器模型都比LR模型具有更好的校准,在12个实验中的10个中,H-L p值> 0.05。本博士学位论文的第三个主题是用于开发逻辑和Cox回归列线图的软件的开发和评估。为此,我们基于Stata(广泛用于生物医学研究的统计软件包)开发了两个程序(nomolog和nomocox)。在撰写本博士学位时。论文这些程序被临床医学,流行病学或生物统计学领域的国际研究人员所采用。我们调查了其中一些用户的背景,与nomolog和nomocox的用户体验以及与R(另一种著名的统计软件)相比,我们程序的易用性和灵活性。大多数受访者是“推广者”(净推广者得分> 8),即很有可能向其他研究人员推荐该软件。所有使用了R统计软件的程序(nomolog和nomocox)和列线图生成器的受访者(100%)都发现nomocox和nomolog更易于使用。调整后的Wald CI为95%(75.83%,100%)。原始比例为81.25%,调整后的Wald CI为95%(54.03%,96.36%),发现我们的程序比R统计软件可用的列线图生成器更灵活。全国人民法院(SNS)的西班牙文,西班牙联邦财政部,洛杉矶地方法院证明了事实。萨尔瓦多国家组织(OMS)的西班牙语高级培训课程。犯罪禁运,卫生监督所增加的违法行为,加利福利亚州立大学的助理教育长,尼加拉瓜的圣女禁令,解决问题的自由。紧急情况下的紧急求医服务和补充签证,请同时阅读并补充《关于改善就诊时间的建议》。紧急情况下的紧急情况,这可以从决策支持系统中受益。在本博士论文中,针对大多数专科医院急诊服务中常见的两个问题,提出了基于机器学习算法的解决方案:急诊普查的预测和所有人的住院概率的实时预测。在一定时间出现在急诊室的肿患者。这些解决方案可用于构建决策支持系统。这些研究的数据由马德里的拉蒙·卡哈尔大学医院(Ramóny Cajal University Hospital)提供,这是一家专门护理医院,除产科外,所有其他医学专业。在2011年和2012年,这家医院安装了约1100张病床,约有553,000名患者被分配到其临床区域。本文涉及的另一个主题是开发和评估用于基于逻辑回归和Cox回归的模型生成列线图的软件工具,因为列线图可用于帮助临床决策或临床程序。基于信息系统的决策支持系统发生故障时的突发事件。该博士论文的第一个主题是预测紧急普查水平(在特定时间点的急诊科患者数量)的模型的生成。紧急普查预测的应用之一是根据国家和国际建议对护理人员进行计划。由于医院急救服务的许多资源都是按8小时轮班组织的,因此在预测中决定使用8小时粒度。我们的目标是为两个因变量生成预测:紧急情况人口普查的最大水平和紧急情况人口普查的平均水平。 8小时轮班的最大紧急普查水平的预测可以用于计划护士,而8小时轮班的平均紧急普查水平的预测可以用于其他目的(例如分配)行政管理人员)。使用以下机器学习算法构建了基于广义回归方法的时间序列模型:M5P,交替模型树(AMT)和支持向量回归(SVR)。这些模型与一系列参考模型进行了比较:常规人员编制(和标准资源end赋水平),分层均值(按每天三班,每天8小时分层的平均值),线性回归和季节性自回归综合移动平均线(SARIMA)。生成了两个因变量的预测:紧急普查的平均水平和紧急普查的最大水平。测试了四个预测范围:1周,2周,4周和8周。为预测平均和最大普查水平定义了低估风险,高估风险和资源分配政策成本的近似值。最高人口普查水平的预测已转化为护理人员的需求;最高普查水平被低估和高估的风险被转化为人员被低估和高估的风险。使用了专有的培训和测试方案,并增加了规模的培训集和固定大小的测试集。还采用了相同的方案,但对一年固定大小的训练集和固定长度的测试集的使用却发生了变化。最后一种方案并未改善结果。对于最大的紧急普查水平预测,对于所有预测范围,M5P是降低高严重性和平均严重性的低估情况的风险的最佳选择。与通常的护理人员水平相比,使用M5P可以使高估严重低估护理人员(> 9名护士)的风险降低10倍以上(M5P降低高达〜1%)与普通护理人员水平的13%相比);并可以将被低估的护理人员(7-9名护士)的平均严重性的风险降低约3倍(M5P降低约3%,而通常水平下降低约10%)护理人员)。使用M5P还意味着护理人员的估计费用将增加5%-6与一般员工水平相比为0.1%。鉴于大大降低了护理人员被低估的风险,这种成本增加是可以接受的。在中级紧急情况人口普查预测的情况下,M5P还是降低所有预测范围对高低和中度严重性低估风险的最佳选择。低估风险的相对减少与从最大紧急普查水平的预测中获得的减少相似(高严重度低估风险减少10倍以上,低估风险减少约3倍)。与通常的资源分配策略相比)。但是,在这种情况下,通常的资源分配策略已经显示出降低了高低和中度严重性的风险(〜2%的低度严重性的风险和〜3.7%的低度严重性的风险) 。但是,在中等紧急普查水平的预测情况下,与标准资源分配政策相比,使用M5P还可以使成本降低15%以上。该博士论文涵盖的第二个主题是实时预测突发事件住院可能性的模型的开发。在这种情况下,目标是根据分诊后立即在大多数专科急诊服务中可用的变量数量减少,来开发预测模型。在我们的案例中,使用了曼彻斯特分诊系统(MTS)。同样,在分类和校准方面设计具有足够性能的分类器也至关重要。使用ROC曲线下的面积(AUROC)评估歧视。使用χ2和Hosmer-Lemeshow(H-L)p值对校准进行评估,并使用10个固定概率组。使用了Logistic回归模型(RL),人工神经网络(RNA)和基于优化校准的ad hoc算法的模型(将Logistic回归基础模型与原因树相结合,以便在MTS中与LogitBoost模型进行协商)分支机构)。使用了专有的评估方法,并增加了规模的训练集和大约每月长度的12个连续测试集。该评估方法产生以下结果,置信区间(CI)为95%。对于RL模型,平均AUROC = 0.8531,95%CI(0.8501,0.8561),对于RNA模型,平均AUROC = 0.8568,95%CI(0.8531,0.8606) ),对于特设模型,平均AUROC = 0.8635,95%CI(0.8605,0.8665)。 RL模型和ad hoc模型的平均AUROC的置信区间不重叠。 RL模型和RNA模型的平均AUROC的置信区间确实略有重叠,尽管在所有12个测试集中,除了一个模型,RNA模型的AUROC高于RL模型。 LR模型的平均H-L H2分别为35.15 95%CI(32.57,37.73),10.47; RNA模型的可信度为95%CI(7.78,13.17),ad hoc模型的可信度为11.4,95%CI(9.10,13.75)。 RNA模型和ad hoc模型均具有比RL更好的校准,在12个实验中的10个中,p值H-L> 0.05。该博士论文的第三个主题是基于二进制logistic回归和Cox回归模型的列线图生成软件的开发和评估。已经开发了基于Stata的两个程序(nomolog和nomocox)(一种广泛用于生物医学研究的统计软件包)。在撰写本博士论文时,由国际临床医学,流行病学和生物统计学领域的研究人员组成的国际团体正在使用这些程序。根据每个研究人员的个人资料以及nomolog和nomocox程序的用户体验,对该用户社区进行了调查。与R统计软件(众所周知的统计软件)中提供的列线图生成器相比,还评估了这些程序的易用性和灵活性。大多数受访者声称自己是“推广者”(Net Promoter Score> 8),也就是说,他们很有可能向其他研究人员推荐该软件。所有受访者(100%)既使用了R统计软件提供的列线图生成器,又使用了nomolog和nomocox列线图生成器,他们表示后者更易于使用,调整后的Wald CI为95%( 75.83%,100%)。此外,调整了Wald的81.25%,95%CI的比例(54.03%,96(36%)表示Nomolog和Nomocox比R统计软件可用的列线图生成器更灵活。

著录项

  • 作者

    Zlotnik Enaliev Alexander;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号