{"id":776,"date":"2015-11-26T13:08:00","date_gmt":"2015-11-26T13:08:00","guid":{"rendered":"http:\/\/ijandev-test.fi.uncoma.edu.ar\/Wordpress\/index.php\/2015\/11\/26\/giuliani-diego-aprendizaje-por-refuerzo-aplicado-a-un-agente-arquero-noviembre-2015\/"},"modified":"2022-02-07T00:20:10","modified_gmt":"2022-02-07T03:20:10","slug":"680-giuliani-diego-aprendizaje-por-refuerzo-aplicado-a-un-agente-arquero-noviembre-2015","status":"publish","type":"post","link":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/nuevos-lic-lcc\/680-giuliani-diego-aprendizaje-por-refuerzo-aplicado-a-un-agente-arquero-noviembre-2015\/","title":{"rendered":"Giuliani, Diego: Aprendizaje por refuerzo aplicado a un agente arquero. Noviembre 2015"},"content":{"rendered":"\t\t<div data-elementor-type=\"wp-post\" data-elementor-id=\"776\" class=\"elementor elementor-776\">\n\t\t\t\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-6b19c7d7 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"6b19c7d7\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-dff1580\" data-id=\"dff1580\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t\t\t<div class=\"elementor-element elementor-element-41d19f10 elementor-widget elementor-widget-text-editor\" data-id=\"41d19f10\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.6.7 - 03-07-2022 *\/\n.elementor-widget-text-editor.elementor-drop-cap-view-stacked .elementor-drop-cap{background-color:#818a91;color:#fff}.elementor-widget-text-editor.elementor-drop-cap-view-framed .elementor-drop-cap{color:#818a91;border:3px solid;background-color:transparent}.elementor-widget-text-editor:not(.elementor-drop-cap-view-default) .elementor-drop-cap{margin-top:8px}.elementor-widget-text-editor:not(.elementor-drop-cap-view-default) .elementor-drop-cap-letter{width:1em;height:1em}.elementor-widget-text-editor .elementor-drop-cap{float:left;text-align:center;line-height:1;font-size:50px}.elementor-widget-text-editor .elementor-drop-cap-letter{display:inline-block}<\/style>\t\t\t\t<p><strong>T\u00edtulo<\/strong>: \u00abAprendizaje por refuerzo aplicado a un agente arquero\u00bb<\/p><p><strong>Autor<\/strong>: Diego Giuliani<\/p><p><strong>Director<\/strong>: Dra. Laura Cecchi<\/p><p><strong>Carrera<\/strong>: Licenciatura en Ciencias de la Computaci\u00f3n<\/p><p><strong>Fecha de defensa<\/strong>: 26 de noviembre de 2015<\/p><p><strong>Resumen<\/strong><\/p><p style=\"text-align: justify;\">En las \u00faltimas d\u00e9cadas, el aprendizaje autom\u00e1tico ha evolucionado a pasos agigantados. Se han desarrollado algoritmos eficientes para ciertos tipos de aprendizaje, como por ejemplo sistemas de reconocimiento facial, autom\u00f3viles que conducen en forma aut\u00f3noma y sistemas de detecci\u00f3n de fraude electr\u00f3nico. Una de las \u00e1reas que ha despertado en los investigadores mayor inter\u00e9s en los \u00faltimos a\u00f1os dentro del aprendizaje autom\u00e1tico es el aprendizaje por refuerzo. El aprendizaje por refuerzo estudia c\u00f3mo un agente es capaz de aprender a partir de la experiencia obtenida por la interacci\u00f3n con su ambiente, sin la intervenci\u00f3n de un supervisor externo.<br \/>En el campo de la rob\u00f3tica, el aprendizaje por refuerzo tiene particular importancia debido a las caracter\u00edsticas inherentes del entorno en que se desarrollan los agentes. Dichos entornos se caracterizan por ser continuos, din\u00e1micos y estoc\u00e1sticos. Esto di\u001cculta la creaci\u00f3n de modelos del ambiente necesarios para el entrenamiento del agente.<br \/>En este trabajo se presenta una arquitectura de un agente arquero que aprende a atajar pelotas a trav\u00e9s del entrenamiento utilizando una t\u00e9cnica de aprendizaje por refuerzo: Diferencia Temporal. En particular, el agente aprende a trav\u00e9s del algoritmo Q-learning ya que esta t\u00e9cnica no requiere conocer previamente un modelo del entorno.\u00a0 A fin de definir los estados, se discretiz\u00f3 el ambiente dividiendo a la cancha en regiones imaginarias y al movimiento de la pelota en secciones fijas. En base a esta discretizaci\u00f3n del ambiente, se observ\u00f3 que exist\u00eda una simetr\u00eda de estados respecto al centro de la cancha y se defini\u00f3 una relaci\u00f3n de equivalencia entre los estados. Esta relaci\u00f3n de equivalencia permiti\u00f3 aumentar la exploraci\u00f3n del espacio de estados y reducir la complejidad espacial del algoritmo. El framework desarrollado en este trabajo puede ser extendido y aplicado en otro ambiente siempre y cuando se respete la relaci\u00f3n de equivalencia entre los estados opuestos.<br \/>Por otra parte, se presenta la implementaci\u00f3n de un simulador que controla tanto el aprendizaje del agente como los movimientos de la pelota y del arquero. Gracias su dise\u00f1o modular, este puede ser f\u00e1cilmente modificado para incorporar variables f\u00edsicas presentes en el mundo real, como por ejemplo la velocidad variable de la pelota o casos en los que la pelota rebota en un objeto.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-805e734 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"805e734\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-d00e9ca\" data-id=\"d00e9ca\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t\t\t<div class=\"elementor-element elementor-element-89ab61b elementor-widget elementor-widget-image\" data-id=\"89ab61b\" data-element_type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.6.7 - 03-07-2022 *\/\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\t\t\t\t\t\t\t\t\t<figure class=\"wp-caption\">\n\t\t\t\t\t\t\t\t\t\t<img width=\"900\" height=\"508\" src=\"https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani.jpg\" class=\"attachment-large size-large\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani.jpg 900w, https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani-300x169.jpg 300w, https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani-768x433.jpg 768w\" sizes=\"(max-width: 900px) 100vw, 900px\" \/>\t\t\t\t\t\t\t\t\t\t\t<figcaption class=\"widget-image-caption wp-caption-text\">Foto del d\u00eda de la defensa con su tutora y el tribunal, integrado por los profesores Lic. Sandra Roger y Lic. Eduardo Grosclaude<\/figcaption>\n\t\t\t\t\t\t\t\t\t\t<\/figure>\n\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-f8c3942 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"f8c3942\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-179b191\" data-id=\"179b191\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t\t\t<div class=\"elementor-element elementor-element-94e27cf elementor-align-center elementor-widget elementor-widget-button\" data-id=\"94e27cf\" data-element_type=\"widget\" data-widget_type=\"button.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-button-wrapper\">\n\t\t\t<a href=\"https:\/\/www.fi.uncoma.edu.ar\/index.php\/nuevos-lic-lcc\/\" class=\"elementor-button-link elementor-button elementor-size-sm\" role=\"button\">\n\t\t\t\t\t\t<span class=\"elementor-button-content-wrapper\">\n\t\t\t\t\t\t<span class=\"elementor-button-text\">Ver otras tesis LCC FaI<\/span>\n\t\t<\/span>\n\t\t\t\t\t<\/a>\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t\t\t\t<\/div>\n\t\t","protected":false},"excerpt":{"rendered":"<p>T\u00edtulo: \u00abAprendizaje por refuerzo aplicado a un agente arquero\u00bb Autor: Diego Giuliani Director: Dra. Laura Cecchi Carrera: Licenciatura en Ciencias de la Computaci\u00f3n Fecha de defensa: 26 de noviembre de 2015 Resumen En las \u00faltimas d\u00e9cadas, el aprendizaje autom\u00e1tico ha evolucionado a pasos agigantados. Se han desarrollado algoritmos eficientes para ciertos tipos de aprendizaje, como &hellip;<\/p>\n<p class=\"read-more\"> <a class=\"\" href=\"https:\/\/www.fi.uncoma.edu.ar\/index.php\/nuevos-lic-lcc\/680-giuliani-diego-aprendizaje-por-refuerzo-aplicado-a-un-agente-arquero-noviembre-2015\/\"> <span class=\"screen-reader-text\">Giuliani, Diego: Aprendizaje por refuerzo aplicado a un agente arquero. Noviembre 2015<\/span> Leer m\u00e1s &raquo;<\/a><\/p>\n","protected":false},"author":1,"featured_media":8899,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"default","ast-global-header-display":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":""},"categories":[14],"tags":[],"uagb_featured_image_src":{"full":["https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani.jpg",900,508,false],"thumbnail":["https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani-150x150.jpg",150,150,true],"medium":["https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani-300x169.jpg",300,169,true],"medium_large":["https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani-768x433.jpg",768,433,true],"large":["https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani.jpg",900,508,false],"1536x1536":["https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani.jpg",900,508,false],"2048x2048":["https:\/\/www.fi.uncoma.edu.ar\/wp-content\/uploads\/2015\/11\/tesis-giuliani.jpg",900,508,false]},"uagb_author_info":{"display_name":"ufai","author_link":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/author\/ufai\/"},"uagb_comment_info":0,"uagb_excerpt":"T\u00edtulo: \u00abAprendizaje por refuerzo aplicado a un agente arquero\u00bb Autor: Diego Giuliani Director: Dra. Laura Cecchi Carrera: Licenciatura en Ciencias de la Computaci\u00f3n Fecha de defensa: 26 de noviembre de 2015 Resumen En las \u00faltimas d\u00e9cadas, el aprendizaje autom\u00e1tico ha evolucionado a pasos agigantados. Se han desarrollado algoritmos eficientes para ciertos tipos de aprendizaje, como&hellip;","_links":{"self":[{"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/posts\/776"}],"collection":[{"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/comments?post=776"}],"version-history":[{"count":5,"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/posts\/776\/revisions"}],"predecessor-version":[{"id":8903,"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/posts\/776\/revisions\/8903"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/media\/8899"}],"wp:attachment":[{"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/media?parent=776"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/categories?post=776"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.fi.uncoma.edu.ar\/index.php\/wp-json\/wp\/v2\/tags?post=776"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}