首页> 外文OA文献 >Nuevos modelos de redes de neuronas artificiales para simulación y control desistemas dinámicos
【2h】

Nuevos modelos de redes de neuronas artificiales para simulación y control desistemas dinámicos

机译:人工神经元网络的新模型,用于动态系统的仿真和控制

摘要

Uno de los principales problemas en el campo de los procesos dinámicos es el control de su comportamiento, control que es necesario para que la evolución del proceso se lleve a cabo en una dirección y con una cierta dinámica deseada. Esto puede traducirse en mantener una condición estable, seguir una trayectoria especificada o alcanzar una determinada meta. Para ello es necesario incluir un sistema de control, el cual influye en la dinámica del proceso, regulando su comportamiento. La teoría de sistemas ha sido ampliamente desarrollada en las últimas cinco décadas, por lo que en la actualidad existe una gran variedad de técnicas de control. Dichas técnicas, en su mayoría, hacen uso de una representación matemática del proceso, también llamada modelo del proceso, permitiendo así la construcción de sistemas de control cuya actuación está basada en la propia naturaleza del proceso dinámico. A pesar de que la gran mayoría de los procesos reales son no lineales, la mayor parte de las técnicas de control se han desarrollado para procesos dinámicos lineales. En los últimos años ha habido, sin embargo, un interés creciente en incorporar técnicas no lineales, tanto para tratar el problema del control de procesos dinámicos, como para afrontar el problema de su modelización. En el desarrollo de técnicas de control no lineales, las redes de neuronas artificiales ocupan un lugar importante. Características tales como la naturaleza adaptativa y la capacidad para aproximar y aprender relaciones complejas no lineales a partir de un conjunto de ejemplos o patrones, hacen que sean buenas candidatas para tratar el problema de la modelización y el control de procesos dinámicos no lineales. Como Introducción 3 consecuencia, en los últimos diez años aproximadamente ha surgido una gran variedad de trabajos, en los que se utilizan diferentes arquitecturas y métodos de aprendizaje para la construcción de modelos y sistemas de control no lineales (ASMC, 92). Los modelos estudiados en este trabajo pertenecen a la categoría de modelos NARMA, los cuales son una extensión no lineal de los modelos ARMA (Auto-Regressive Moving Average) y se caracterizan porque describen el comportamiento dinámico del proceso a partir de las variables observables o medibles. Estos modelos son generalmente más fáciles de construir y tratar que los modelos físicos o modelos construidos a partir de leyes físicas que rigen el comportamiento dinámico del proceso, los cuales suelen ser modelos complicados, ya que intervienen un gran número de ecuaciones diferenciales, su construcción es laboriosa y requiere normalmente de una gran cantidad de tiempo y experimentos. Los modelos NARMA neuronales más populares son los llamados modelos de identificación en serie-paralelo, los cuales consisten en aproximar la relación no lineal utilizando el perceptron multicapa o una red de base radial, también conocidas como redes de neuronas estáticas, ya que la representación o el procesamiento de información temporal no es una propiedad intrínseca a ellas. En este caso, los patrones de entrada a la red son vectores que contienen las variables de entrada y salida del proceso, así como una historia de dichas variables, de modo que pueda ser representada la información temporal. Un modelo apropiado de un proceso tiene que poseer la propiedad de saber actuar como simulador del proceso. Esto significa que, dado el estado inicial del proceso y la variable de entrada, el modelo tiene que aproximar o predecir la dinámica de dicho proceso durante un cierto intervalo de tiempo, utilizando únicamente dicha información. Los modelos de identificación en serie-paralelo presentan el inconveniente de que no pueden utilizarse para simular la dinámica del proceso, ya que para predecir la salida actual del proceso es necesario conocer una historia de dicha variable, datos que no están disponibles cuando se simula el comportamiento del proceso dinámico. Algunos autores, (NAPA, 90), han propuesto reemplazar estos valores medibles en el modelo de identificación en serie-paralelo por los valores predichos por la red en instantes anteriores de tiempo, cuando sea necesario disponer de un simulador, obteniendo los llamados modelos de identificación en paralelo. Sin embargo, en los Introducción 4 estudios realizados en este trabajo se observa que los modelos en paralelo propuestos por estos autores, no siempre proporcionan aproximaciones adecuadas y convenientes del proceso dinámico, e incluso pueden existir situaciones en las que la capacidad de representación de estos modelos quede prácticamente anulada. Con respecto a las estrategias de control, en esta tesis se analizan dos sistemas diferentes de control no lineal, denominados control inverso y control predictivo. Ambas estrategias han sido ya estudiadas por diferentes autores, (JORD, 89), (NAPA, 90), (WIMO, 91), entre otros, aunque siguen aún presentando en la actualidad una serie de limitaciones e inconvenientes, sobre todo en lo referente a aplicaciones en tiempo real, las cuales se especifican brevemente a continuación. Las estrategias de control inverso, básicamente, consisten en entrenar una red de neuronas para que aprenda la dinámica inversa del proceso. Cuando se plantea un esquema de control inverso se distinguen dos formas diferentes de aprendizaje del controlador, que se denominan aprendizaje generalizado y aprendizaje especializado, respectivamente. La finalidad del aprendizaje generalizado es que la red aprenda la dinámica inversa del proceso, en su totalidad, a partir de un conjunto de datos representativos de dicha dinámica. Mediante el aprendizaje especializado, sin embargo, la red aprende la inversa local del proceso en la región de interés, utilizando la diferencia entre la salida actual del proceso y la salida deseada para adaptar los pesos del controlador. En este caso no es necesario disponer de un conjunto de patrones salida-entrada del proceso, sino que los datos para el aprendizaje proceden de la evolución directa de dicho proceso. Los esquemas de control inverso con aprendizaje generalizado son sistemas de control off-line, es decir, el aprendizaje de la red tiene que realizarse antes de su actuación como controlador del proceso dinámico real. Por tanto, el éxito del controlador depende en gran medida de los datos disponibles y de la capacidad de generalización de la red, factores que impiden, en la mayor parte de los casos, obtener un control eficiente del proceso dinámico real. Por otra parte, no es un esquema de control aplicable a cualquier proceso dinámico, ya que es necesario que la dinámica inversa de dicho proceso esté bien definida. Introducción 5 El esquema de control inverso con aprendizaje especializado se considera, sin embargo, un esquema de control on-line o en tiempo real, por lo que el aprendizaje de la red de neuronas se lleva a cabo mientras controla el proceso. Es, por tanto, una aproximación más conveniente y exacta, pues la red aprende a conseguir un objetivo de control, el dictado por las necesidades de cada momento. No obstante, y debido, precisamente, a que se trata de un esquema de control on-line, la inicialización de los pesos del controlador tiene una repercusión importante en los resultados de control; una inicialización no adecuada del controlador inverso cuando se dispone a realizar el aprendizaje especializado utilizando el proceso real, podría provocar situaciones de inestabilidad o incluso de “no control” en el proceso, lo cual no es admisible en aplicaciones en tiempo real. Debido a que la señal de control en un cierto instante de tiempo no sólo influye en la respuesta del proceso en el instante siguiente, sino también en un cierto futuro, es interesante utilizar esquemas de control que hagan uso de cierta información en el futuro para calcular la acción de control en el presente, y poder así obtener controladores más eficientes. Estos sistemas de control son los llamados controladores predictivos. Las estrategias de control predictivo consisten en calcular, en cada instante de tiempo, la acción de control que minimice la diferencia entre la salida de un modelo del proceso y la salida deseada durante un cierto intervalo de tiempo en el futuro, cuya longitud viene dada por el horizonte de predicción. Los modelos más empleados en estos sistemas de control han sido los clásicos modelos ARMA lineales (WIMO, 91), ya que, debido precisamente a su estructura lineal, el problema de optimización que engloba estas estrategias es lineal. Sin embargo, la capacidad de representación de los modelos ARMA para procesos dinámicos no lineales es bastante limitada. Por otra parte, la utilización de modelos no lineales para predecir el comportamiento del proceso en el futuro involucra la resolución de un problema de optimización no lineal en cada instante de tiempo, lo cual es un serio inconveniente cuando se trata de aplicaciones de control en tiempo real, ya que normalmente requieren de un alto esfuerzo computacional. Generalmente, este hecho hace que las estrategias de control predictivo que hacen uso de un modelo no lineal sean impracticables en aplicaciones reales. Introducción 6 Con vistas a superar los inconvenientes anteriores, en esta tesis se plantean los siguientes objetivos fundamentales: 1º Obtener modelos NARMA neuronales que puedan proporcionar una aproximación conveniente del proceso dinámico no lineal cuando dichos modelos actúan como simulador del proceso y resolver así los inconvenientes que puedan presentar los modelos de identificación en paralelo mencionados anteriormente. 2º Encontrar métodos que proporcionen inicializaciones de los parámetros del controlador neuronal inverso, de modo que pueda obtenerse un control eficiente del proceso dinámico real cuando se aplica un esquema de control inverso con aprendizaje especializado. 3º Construir sistemas de control predictivo no lineales aplicables en tiempo real y que requieran de un menor esfuerzo computacional que los esquemas de control predictivo existentes en la actualidad. Para cubrir los objetivos marcados, la tesis se estructura en cuatro capítulos. En el primero de ellos, capítulo 1, se da una panorámica sobre las redes de neuronas artificiales y sobre los procesos dinámicos, presentándose conceptos que serán utilizados. En este capítulo se incluye también el estado del arte del uso de las redes de neuronas artificiales para tratar el problema de la modelización y el control de procesos dinámicos no lineales. El capítulo 2 está dedicado al planteamiento del problema, presentándose las dificultades encontradas en los modelos de identificación en serie-paralelo para actuar como simulador del proceso y las limitaciones de las estrategias de control inverso y predictivo para controlar procesos dinámicos no lineales en tiempo real. En el capítulo 3 se presentan las soluciones propuestas para resolver los problemas planteados en el capítulo anterior y conseguir así los objetivos marcados. Dicho capítulo contiene, en primer lugar, la descripción de la arquitectura de red parcialmente recurrente que se propone utilizar, tanto para la construcción de simuladores como Introducción 7 controladores de procesos dinámicos no lineales, y el algoritmo de aprendizaje para llevar a cabo su entrenamiento. En segundo lugar, se analiza la incapacidad de los modelos de identificación en paralelo mencionados anteriormente para representar adecuadamente el proceso dinámico, proponiéndose una solución para resolver los problemas que se presentan. Finalmente, se desarrollan los esquemas de control inverso y predictivo propuestos en este trabajo. El capítulo 4 está dedicado a la validación de las soluciones propuestas en el capítulo anterior. Para ello se utiliza un proceso dinámico real que describe el comportamiento de la temperatura del fluido que circula en la camisa de un reactor químico situado en el Centro Común de Investigación de la Comunidad Europea de Ispra (Italia) y dentro del marco del proyecto FIRES (Facility for Investigating Runaway Events Safely). En este capítulo se realiza la descripción del reactor y de los circuitos de calentamiento y enfriamiento, la aplicación de las técnicas propuestas para modelizar y controlar el proceso dinámico en cuestión y finalmente un análisis de los resultados obtenidos. Con la finalidad de comprobar la validez de las técnicas desarrolladas para afrontar la modelización y el control de procesos dinámicos no lineales, este capítulo incluye también los resultados que proporciona un modelo físico que describe el comportamiento dinámico de la temperatura del fluido de intercambio de calor (ZALD, 95), así como los resultados de control que se obtienen con el controlador actualmente incorporado en la instalación (controlador PID: proporcional-integral-derivativo). Para finalizar, se establecen las conclusiones del trabajo desarrollado y posibles líneas futuras de investigación en este campo.
机译:动态过程领域的主要问题之一是对其行为的控制,这是必要的控制,以便在一个方向上以一定的期望动态进行过程的演化。这可以转化为维持稳定的状态,遵循指定的路径或达到特定的目标。为此,必须包括一个控制系统,该系统会影响过程的动力学并调节其行为。在过去的五十年中,系统理论得到了广泛的发展,因此今天有各种各样的控制技术。这些技术在大多数情况下利用过程的数学表示形式(也称为过程模型),从而允许构建控制系统,其性能基于动态过程的本质。尽管大多数实际过程都是非线性的,但大多数控制技术都是针对线性动态过程而开发的。然而,近年来,人们越来越关注结合非线性技术,以解决动态过程控制的问题并面对其建模的问题。在非线性控制技术的发展中,人工神经元网络占有重要地位。诸如自适应性质和从一组示例或模式中近似和学习复杂非线性关系的能力等特性使其成为解决建模和控制非线性动态过程问题的理想候选者。作为引言3的结果,在最近十年中,出现了各种各样的作品,其中使用了不同的体系结构和学习方法来构建模型和非线性控制系统(ASMC,92)。在这项工作中研究的模型属于NARMA模型的类别,它是ARMA(自回归移动平均值)模型的非线性扩展,其特征在于它们基于可观察或可测量的变量来描述过程的动态行为。 。这些模型通常比物理模型或由控制过程动态行为的物理定律建立的模型更易于构建和处理,这些模型通常是复杂的模型,因为涉及大量微分方程,因此它们的构造是费力的,通常需要大量的时间和实验。最受欢迎的神经NARMA模型是所谓的串行-并行识别模型,该模型包括使用多层感知器或基于径向的网络(也称为静态神经元网络)近似非线性关系,因为其表示形式为临时信息的处理不是它们的固有属性。在这种情况下,网络的输入模式是包含过程的输入和输出变量以及所述变量的历史的向量,以便可以表示时间信息。适当的流程模型必须具有知道如何充当流程模拟器的属性。这意味着,在给定过程的初始状态和输入变量的情况下,模型必须仅使用此信息来在某个时间间隔内近似或预测所述过程的动力学。串并联识别模型的缺点是它们不能用于模拟过程的动态,因为要预测过程的当前输出,必须知道所述变量的历史,而在模拟过程时则无法获得数据。动态过程行为。一些作者(NAPA,90)提出了将串行并行识别模型中的这些可测量值替换为网络在先前时刻预测的值,这时需要使用模拟器来获得所谓的并行识别。但是,在这项工作中进行的前言4研究中,可以观察到这些作者提出的并行模型并不总是能为动态过程提供足够且方便的近似值,甚至可能存在表示这些模型的能力的情况。实际上被取消了。关于控制策略,本文分析了两种不同的非线性控制系统,称为反向控制和预测控制。这两种策略已经由不同的作者(JORD,89),(NAPA,90),(WIMO,91)进行了研究,尽管它们目前仍存在一系列局限性和缺陷。,尤其是关于实时应用程序,下面简要说明。反向控制策略主要包括训练神经元网络以学习过程的反向动力学。当提出反向控制方案时,区分控制器学习的两种不同形式,分别称为广义学习和专门学习。广义学习的目的是使网络从代表所述动力学的一组数据中整体学习过程的逆动力学。但是,通过专门的学习,网络将使用当前过程输出与所需输出之间的差异来学习控制器区域中的过程局部逆。在这种情况下,不必具有该过程的一组输入-输出模式,但是用于学习的数据来自所述过程的直接演变。具有广义学习的反向控制方案是离线控制系统,也就是说,在充当实际动态过程的控制器之前必须进行网络学习。因此,控制器的成功很大程度上取决于可用数据和网络的通用性,这些因素在大多数情况下都无法有效地控制实际的动态过程。另一方面,它不是适用于任何动态过程的控制方案,因为有必要很好地定义所述过程的逆动力学。引言5考虑到具有专门学习功能的反向控制方案,但是,它是一种在线或实时控制方案,因此在控制过程的同时进行神经元网络的学习。因此,这是一种更方便,更精确的方法,因为网络学会了根据每个时刻的需求来实现控制目标。但是,正是由于它是一种在线控制方案,所以控制器权重的初始化对控制结果有重大影响。准备使用实际过程进行专门学习时,反向控制器的初始化不当会导致过程不稳定甚至“无法控制”,这在实时应用中是不允许的。由于某个时刻的控制信号不仅会影响下一时刻的过程响应,而且还会影响将来的某个时刻,因此使用将来利用某些信息的控制方案进行计算很有趣。当前的控制动作,因此能够获得更有效的控制器。这些控制系统称为预测控制器。预测控制策略包括在每个时间点计算控制动作,该控制动作可最大程度地减小将来某个时间间隔内过程模型的输出与所需输出之间的差异,其长度由下式给出:预测范围。这些控制系统中最常用的模型是经典的线性ARMA模型(WIMO,91),因为正是由于它们的线性结构,包含这些策略的优化问题才是线性的。但是,ARMA模型对于非线性动态过程的表示能力非常有限。另一方面,使用非线性模型预测未来过程的行为会涉及在每个时间瞬间解决非线性优化问题,这在时间控制应用程序中是一个严重的缺点。真正的,因为它们通常需要大量的计算工作。通常,这一事实使得在实际应用中使用非线性模型的预测控制策略不切实际。引言6为了克服上述缺陷,本文提出了以下基本目标:1º获得神经NARMA模型,当这些神经模型充当过程模拟器时,它可以提供非线性动态过程的便捷近似,从而解决了以下缺点:可以提出上述并行识别模型。 2º查找提供逆神经控制器参数初始化的方法,因此在应用带有专门学习功能的反向控制方案时,可以获得对实际动态过程的有效控制。 3º构建可实时应用的非线性预测控制系统,并且与现有的预测控制方案相比,其所需的计算量更少。为了涵盖既定目标,本文分为四章。在第1章的第一部分中,概述了人工神经元网络和动态过程,并提出了将要使用的概念。本章还介绍了使用人工神经元网络来处理对非线性动态过程进行建模和控制的问题。第2章专门针对问题陈述,介绍了在串行并行识别模型中用作过程模拟器的困难以及逆向和预测控制策略实时控制动态非线性过程的局限性。第3章介绍了为解决上一章中提出的问题从而实现既定目标而提出的解决方案。本章首先包含拟用于仿真器和Introduction 7非线性动态过程控制器的构造的部分递归网络体系结构的描述,以及进行训练的学习算法。其次,分析了上述并行识别模型不能充分代表动态过程,提出了解决问题的解决方案。最后,本文提出了逆向和预测控制方案。第4章致力于验证上一章中提出的解决方案。为此,使用了一个真实的动态过程,该过程描述了位于意大利伊斯普拉(Espra)欧洲共同研究中心和FIRES项目框架内的化学反应器夹套中循环的流体温度的行为(安全调查失控事件的设施)。本章介绍了反应堆,加热和冷却回路,所提出的用于对动态过程进行建模和控制的技术的应用,最后对获得的结果进行了分析。为了检查开发用于处理非线性动态过程的建模和控制的技术的有效性,本章还包括由物理模型提供的结果,该模型描述了换热流体温度的动态行为( ZALD,95),以及当前安装在设备中的控制器(PID控制器:比例积分微分)所获得的控制结果。最后,确定了该领域的工作结论和今后可能的研究方向。

著录项

  • 作者

    Galván León Inés María;

  • 作者单位
  • 年度 1997
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"es","name":"Spanish","id":10}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号