NAVEGACIÓN REACTIVA EN ENTORNOS ESTRECHOS E INTRINCADOS

Transcripción

1 NAVEGACIÓN REACTIVA EN ENTORNOS ESTRECHOS E INTRINCADOS Javer Antch Tobaruela Cra. de Valldemossa km. 7,5 Campus Unverstat de les Illes Balears Palma de Mallorca, Javer.Antch@ub.es Alberto Ortz Rodríguez Cra. de Valldemossa km. 7,5 Campus Unverstat de les Illes Balears Palma de Mallorca, Alberto.Ortz@ub.es Resumen El que un robot pueda moverse autónomamente y sn conocmento prevo del entorno desde un punto A o ncal a un punto B o/u fnal/objetvo consttuye una necesdad básca dentro de la robótca móvl. Durante las tres últmas décadas, nvestgadores de todo el mundo han ntentado dotar a sus robots de esa capacdad. Para ello, estos nvestgadores han propuesto/desarrollado dversos paradgmas de control que, prncpalmente, se clasfcan en: paradgma reactvo, paradgma jerárquco, y paradgma híbrdo. Cada paradgma se caracterza por un conjunto de prncpos báscos que descrben en térmnos generales la forma en la que debe llevarse a cabo el control de un robot. El prmero de estos paradgmas, el reactvo, se nspra en la mtacón del comportamento de supervvenca de algunos anmales. Más concretamente, el paradgma reactvo sugere que cada accón se decda sólo tenendo en cuenta el entorno local del robot; además, dcho paradgma exge que todas las decsones sean tomadas sguendo razonamentos smples/no ntensvos. El presente trabajo se stúa, precsamente, en este contexto, es decr, bajo el enfoque del paradgma reactvo. Basándose en los prncpos del paradgma reactvo, son muchas y varadas las estrategas de control que se han propuesto a lo largo de los últmos años. Algunas de estas estrategas facltan la navegacón del robot por espacos estrechos; otras, posbltan que el robot pueda evtar grandes obstáculos, ncluso cuando éstos tenen una forma compleja e ntrncada; etc. En este trabajo se presenta una nueva estratega de control reactvo denomnada Most Promsng Gap o, abrevadamente, MPG. Esta nueva estratega resulta de la combnacón adecuada de otras dos estrategas ya exstentes. MPG hereda las capacdades de navegacón de las dos estrategas que combna, permtendo así que un robot pueda moverse con éxto tanto en entornos con pasos estrechos como en entornos altamente ntrncados. Con el objetvo de valdar la herenca de estas capacdades, se ncluyen los resultados de varos expermentos smulados y reales. Palabras Clave: Robótca móvl, paradgma de control reactvo, navegacón en entornos estrechos e ntrncados 1 INTRODUCCIÓN La robótca móvl autónoma es el área de la robótca que crea robots capaces de desplazarse de un lugar a otro sn ntervencón humana. Para que eso sea posble, el robot debe percbr, razonar y actuar sobre el entorno que le rodea. El robot percbe su entorno con un conjunto de sensores, razona aplcando técncas pertenecentes al ámbto de la Intelgenca Artfcal (IA), y actúa sobre su entorno medante un conjunto de actuadores, todo ello con el objetvo fnal de acometer la tarea que le han encomendado. Desde fnales de los 60 hasta los años 90, muchos nvestgadores ntentaron defnr los prncpos báscos que un robot debía segur a la hora de percbr, razonar y actuar. De esta larga etapa surgeron tres correntes prncpales que tomaron el nombre de paradgma jerárquco tambén conocdo como paradgma delberatvo, paradgma reactvo y paradgma híbrdo. Cada una/uno de estas/estos correntes/paradgmas representa una forma dstnta de entender cómo debe llevarse a cabo el control autónomo de un robot. A grandes rasgos, el paradgma jerárquco propugna la construccón de un modelo smbólco del entorno y la utlzacón de este modelo como base para la toma de cualquer decsón (cabe notar aquí que, en las mplementacones más avanzadas de este paradgma, el modelo smbólco se construye a medda que el robot navega por el entorno; cada vez que el robot camba de poscón y/u orentacón, los sensores del robot proporconan nuevo conocmento del entorno; ese nuevo conocmento se va acumulando y así se va hacendo progresvamente el modelo más completo). Por otro lado, el paradgma reactvo plantea una dea dametralmente opuesta al del paradgma anteror. Ahora, la acumulacón de conocmento se nterpreta como algo negatvo que mpde que el robot pueda Actas de las XXXV Jornadas de Automátca, 3-5 de septembre de 2014, Valenca

2 adaptarse adecuadamente a su entorno, prncpalmente cuando éste es cambante. Partendo de esta dea, el paradgma reactvo propone que todas las decsones sean tomadas en base a, úncamente, la percepcón local que el robot tenga del entorno justo en el momento de la toma de la decsón. Es más, según este paradgma, cualquer decsón debe ser fruto de un razonamento smple/básco, tal y como ocurre en la mayor parte de los comportamentos nstntvos de los anmales y de las personas. Fnalmente, el últmo paradgma, el híbrdo, puede ser vsto como un punto ntermedo entre el enfoque puramente cogntvo del paradgma jerárquco y el enfoque puramente bológco del paradgma reactvo. Al gual que el paradgma jerárquco, el paradgma híbrdo permte la construccón de modelos globales del entorno, así como la aplcacón de procesos de razonamento ntensvos sobre estos modelos. Además de esta capacdad de razonamento global, el paradgma híbrdo permte tambén dotar al robot de comportamentos reactvos que garantcen su supervvenca ante hechos nesperados. Desde los años 90 hasta hoy, los mayores avances en la creacón de robots autónomos ntelgentes se han consegudo bajo el nflujo del paradgma híbrdo. Este nflujo, sn embargo, tene su verdadero orgen en los paradgmas jerárquco y reactvo, dado que el paradgma híbrdo se almenta fundamentalmente de los avances provenentes de esos dos otros paradgmas. Como ndca el título del artículo, el presente trabajo aborda el problema de la navegacón reactva de un robot. Por ello, en lo que resta de ntroduccón, ya sólo hablaremos del paradgma reactvo, dejando a un lado los paradgmas jerárquco e híbrdo. En la lteratura relaconada con el paradgma reactvo podemos encontrar dos formas lgeramente dferentes de entender este paradgma. Esas dos formas se conocen bajo los nombres de paradgma reactvo puro y paradgma reactvo no puro. Debdo a su naturaleza reactva, ambos paradgmas tenen un carácter local; es decr, toman decsones exclusvamente en funcón del entorno más próxmo que rodea al robot. Pero, qué sgnfca más próxmo? Ahí es, precsamente, donde el paradgma reactvo puro y no puro se dferencan, al dar cada uno de ellos un sgnfcado sensblemente dstnto a dcho térmno. A este respecto, el paradgma reactvo puro consdera como entorno más próxmo al robot a aquél que está sendo actualmente percbdo por los sensores del robot (se gnora, por tanto, cualquer percepcón del entorno pasada, y se trabaja sobre el mundo tal y como es ahora). Por otro lado, la versón no pura del paradgma reactvo hace una nterpretacón más ampla del térmno, al consderar que el entorno más próxmo al robot vene dado no sólo por la percepcón actual, sno tambén por todas aquellas percepcones que se hceron en un pasado recente (en estos sstemas, el robot retene ese pasado recente utlzando una memora a corto plazo). En el año 1986, el profesor Rodney Brooks [1] propuso con gran éxto la prmera arqutectura de control basada en el paradgma reactvo (esa arqutectura fue y es, a día de hoy conocda bajo el nombre nglés de subsumpton ). Desde el año 1987 en adelante, muchos otros nvestgadores sgueron el camno ncado por Brooks, en busca de nuevas y más avanzadas arqutecturas/estrategas de control reactvo. Como fruto de esa nvestgacón, actualmente exste un número muy elevado de dferentes arqutecturas/estrategas reactvas. Algunas de estas arqutecturas/estrategas son puras [2]; otras, en cambo, son no puras [3]. Algunas de ellas están específcamente pensadas para ser aplcadas sobre robots de tpo holonómco [4]; otras, en cambo, son capaces de tener en cuenta las restrccones de movmento que tenen algunos robots [5]. Algunas arqutecturas/estrategas reactvas permten que el robot pueda navegar por espacos estrechos [6]; otras, en cambo, posbltan que el robot pueda segur camnos razonablemente efcentes en espacos amplos [7] esos espacos se caracterzan por la práctca total ausenca de obstáculos. Algunas arqutecturas/estrategas reactvas favorecen los movmentos del robot a alta velocdad bajo la premsa de la no colsón [8]. Por últmo, algunas otras proveen al robot la habldad de sortear grandes obstáculos y de encontrar camnos de salda en entornos ntrncados, tal y como pueda ser un labernto [9]. En este trabajo se presenta la fusón de dos arqutecturas/estrategas de control reactvo exstentes: Closest Gap [6] o, abrevadamente, CG y T 2 [9]. La prmera de estas arqutecturas/estrategas es pura y permte a un robot moverse por pasajes extremadamente estrechos sn resgo de colsón. La otra arqutectura/estratega, en cambo, sgue un enfoque no puro y dota al robot de la ntelgenca sufcente como para permtrle evtar cualquer obstáculo, con ndependenca del tamaño y la forma smple o ntrncada que tengan estos obstáculos. Como quedará demostrado a lo largo de este artículo, la fusón propuesta da lugar a una nueva arqutectura/estratega reactva que goza de todas las ventajas que CG y T 2 ofrecen por separado. En concreto, esta nueva arqutectura/estratega, bautzada con el nombre de Most Promsng Gap o, smplemente, MPG, hace posble la navegacón autónoma de un robot en entornos estrechos e/o ntrncados. Actas de las XXXV Jornadas de Automátca, 3-5 de septembre de 2014, Valenca

3 Tras esta ntroduccón, el resto del artículo se ha organzado del sguente modo: en la seccón 2 se descrben los prncpos de funconamento bajo los cuales operan las arqutecturas/estrategas reactvas CG y T 2 ; la seccón 3 muestra cómo se puede obtener una mejor arqutectura/estratega de control reactvo a partr de la fusón de CG y T 2 (es decr, la seccón 3 nos presenta a MPG); la seccón 4 evalúa, medante la realzacón de complcados expermentos smulados y reales, las ventajas que MPG ofrece frente a CG y T 2 ; fnalmente, en la seccón 4 se exponen las conclusones del trabajo y se sugeren algunas líneas de nvestgacón futura. 2 PRINCIPIOS BÁSICOS DE FUNCIONAMIENTO DE CG y T SOBRE CG Como ya se ha comentado en parte en la seccón 1, CG es una estratega de control reactvo de carácter puro que fue propuesta en [6] como una mejora de las estrategas Nearness Dagram [10] popularmente conocda como ND y Smooth Nearness Dagram [11] tambén conocda por las sglas SND. Tanto CG como ND y SND son estrategas que tenen como prncpal objetvo el permtr que un robot pueda moverse por espacos estrechos, es decr, por lugares donde la dstanca entre obstáculos es escasamente superor al tamaño físco del robot. CG aventaja a ND y a SND en los tres sguentes aspectos: (1) por un lado, CG es una estratega más efcente desde un punto de vsta computaconal, al ser capaz de tomar decsones adecuadas sguendo razonamentos menos complejos que los aplcados por ND y SND; (2) por otro lado, CG consgue que los movmentos del robot sean más suaves; (3) adconalmente, CG dsmnuye la probabldad de que el robot quede atrapado en una poscón que no sea la destno. Podemos magnar el funconamento de CG como el de un proceso dvddo en tres fases secuencales: en la prmera fase F1, CG busca camnos lbres de obstáculos (aunque obvo, notar que esa búsqueda es de tpo local; esto sgnfca que se basa, únca y exclusvamente, en la nformacón del entorno que proporconan los sensores del robot en el nstante en el que se nca la búsqueda); en la segunda fase F2, CG escoge uno de entre todos aquellos camnos encontrados en la fase anteror; fnalmente, en la tercera fase F3, CG genera los comandos de control necesaros para el robot sga el camno que ha sdo selecconado en la fase F2. La ejecucón de las fases F1, F2 y F3 se repte hasta que el robot completa su tarea, es decr, hasta que el robot alcanza la poscón destno deseada. Segudamente, estas tres fases se descrben con mayor detalle. En la fase F1, CG analza el entorno más próxmo al robot en busca de huecos entre obstáculos lo sufcente amplos como para que el robot pueda navegar por ellos (en [6], los autores emplean el térmno nglés de gap para referrse a dchos huecos). Sendo más precsos, la fase F1 comprende los sguentes tres pasos: (F1.1) en prmer lugar, CG percbe el entorno que rodea al robot utlzando los sensores que el robot tene a bordo; (F1.2) posterormente, CG hace uso de la nformacón obtenda en el paso anteror para encontrar huecos entre obstáculos (en este punto, cualquer hueco es consderado sea cual sea su tamaño); (F1.3) fnalmente, el últmo paso actúa como un fltro sobre el conjunto de huecos encontrados en el paso F1.2; más concretamente, CG elmna aquí todos aquellos huecos que tengan un ancho menor al tamaño físco del robot. La fgura 1 lustra con un ejemplo cada uno de los tres pasos de la fase F1. En cuanto a la fase F2, ésta recbe como entrada los huecos resultantes/no elmnados del paso F1.3. En esta segunda fase, de todos esos huecos, CG seleccona aquél que, con mayor probabldad, permtrá al robot alcanzar o, al menos, estar más cerca de alcanzar la poscón destno deseada. Profundcemos un poco más en esta dea. Sn embargo, para ello, necestamos antes ntroducr una sere de conceptos. Por un lado, r destno representa la recta que une el centro del robot con la poscón destno. Por otro lado, P extremo 1 y son los puntos extremos del hueco #; P extremo 2 es más, dado un j {1,2}, r extremo j denota la recta que une el centro del robot con el punto P extremo j. Por últmo, dst (r 1, r 2 ) es una funcón que devuelve el ángulo formado por las rectas r 1 y r 2, y mndst es otra funcón que se defne como: mn(dst (r destno, r extremo 1 ), dst (r destno, r extremo 2 )). (1) De acuerdo con la expresón (1), fjado un hueco #, la funcón mndst permte conocer la dstanca angular mínma que exste entre la recta r destno y cada una de las dos rectas r extremo1 y r extremo2. Podemos conclur la explcacón de la fase F2 dcendo que CG seleccona el hueco con más pequeña. Contnuando el ejemplo de la fgura 1, la fgura 2 muestra gráfcamente cómo CG lleva a cabo este proceso de seleccón. la mndst Actas de las XXXV Jornadas de Automátca, 3-5 de septembre de 2014, Valenca

4 Actas de las XXXV Jornadas de Automátca, 3-5 de septembre de 2014, Valenca

10 Como trabajo futuro a corto plazo, pretendemos fusonar la estratega T 2 con algunas mejoras de la estratega CG que han aparecdo recentemente ([13,14]). Agradecmentos Este trabajo se enmarca en el contexto de varos proyectos de nvestgacón españoles y europeos: DG-R+I+D del goberno de las Islas Baleares, DPI C03-03 del Mnstero de Cenca e Innovacón, y, por últmo, EU-MOVE/FP7/ /INCASS de la Unón Europea. Los autores agradecen a estas nsttucones la fnancacón recbda, sn la cual no hubese sdo posble la realzacón de este trabajo. Referencas [1] Brooks, R. (1986) A robust layered control system for a moble robot, IEEE journal of Robotcs and Automaton, 2(1): pp [2] Borensten, J.; Koren, Y. (1991) The vector feld hstogram fast obstacle avodance for moble robots, IEEE Transactons on Robotcs and Automaton, 7(3): pp [3] Lkhachev, M.; Arkn, R. (2001) Spatotemporal case-based reasonng for behavoral selecton, Internatonal Conference on Robotcs and Automaton, pp [4] Khatb, O. (1986) Real-tme obstacle avodance for manpulators and moble robots, the nternatonal journal of Robotcs Research, 5(1): pp [5] Mínguez, J.; Montano, L. (2009) Extendng collson avodance methods to consder the vehcle shape, knematcs and dynamcs of a moble robot, IEEE Transactons on Robotcs, 25(2): pp [6] Mujahed, M.; Fscher, D.; Mertschng, B.; Jaddu, H. (2010) Closest Gap based (CG) reactve obstacle avodance navgaton for hghly cluttered envronments, nternatonal conference on Intellgent Robots and Systems, pp [7] Mínguez, J. (2005) The obstacle-restrcton method for robot obstacle avodance n dffcult envronments, nternatonal conference on Intellgent Robots and Systems, pp [8] Fox, D.; Burgard, W.; Thrun, S.; (2002) The dynamc wndows approach to collson avodance, IEEE Robotcs & Automaton Magazne, 4(1): pp [9] Antch, J.; Ortz, A.; (2005) Extendng the potental felds approach to avod trappng stuatons, nternatonal conference on Intellgent Robots and Systems, pp [10] Mínguez, J.; Montano, L. (2004) Nearness Dagram (ND) navgaton: collson avodance n troublesome scenaros, IEEE Transactons on Robotcs and Automaton, 20(1): pp [11] Durham, J.W.; Bullo, F. (2008) Smooth Nearness-Dagram navgaton, nternatonal conference on Intellgent Robots and Systems, pp [12] Antch, J.; (2012) New reactve and pathplannng methods for moble robot navgaton, tess doctoral, Unverstat de les Illes Balears. [13] Mujahed, M.; Jaddu, H.; Fscher, D.; Mertschng, B. (2013) Tangental Closest Gap based (TCG) reactve obstacle avodance navgaton for cluttered envronments, nternatonal symposum on Safety, Securty and Rescue Robotcs. [14] Mujahed, M.; Fscher, D.; Mertschng, B. (2013) Safe Gap based (SG) reactve navgaton for moble robots, European Conference on Moble Robots, pp Actas de las XXXV Jornadas de Automátca, 3-5 de septembre de 2014, Valenca