Logotipo del repositorio
  • English
  • Español
  • Français
  • Iniciar sesión
    Identificación habilitada exclusivamente para personal de Biblioteca.
    ¿Has olvidado tu contraseña?
Logotipo del repositorio
  • Colecciones
  • Filtrar búsqueda
  • Depositar
  • English
  • Español
  • Français
  • Iniciar sesión
    Identificación habilitada exclusivamente para personal de Biblioteca.
    ¿Has olvidado tu contraseña?
  1. Inicio
  2. Buscar por autor

Examinando por Autor "Minaya Montalvo, Marcos"

Mostrando 1 - 1 de 1
Resultados por página
Opciones de ordenación
  • Cargando...
    Miniatura
    Publicación
    Reconocimiento de códigos grabados por láser mediante técnicas de Deep Learning
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Sistemas de Comunicación y Control, 2022-03-07) Minaya Montalvo, Marcos; Haut Hurtado, Juan Mario; Pastor Vargas, Rafael
    Los algoritmos tradicionales de reconocimiento óptico de caracteres (OCR) tienen una larga historia, un amplio desarrollo y una gran aplicabilidad a muchos problemas de digitalización de textos. Sin embargo, en términos de generalización, estos algoritmos están limitados a su propia parametrización ad-hoc para el problema en el que se aplican y al preprocesamiento de la imagen necesario para que funcionen correctamente. Al mismo tiempo, el funcionamiento intrínseco de estos algoritmos, basado en el contraste entre el carácter a reconocer y el fondo de la imagen, hace que en los casos en los que dicho contraste no es muy pronunciado, la tarea de reconocimiento pueda ser imposible. El presente trabajo pretende desarrollar un nuevo algoritmo basado en técnicas de Deep Learning, conocidas por su alta capacidad de generalización para numerosos escenarios gracias a su arquitectura en forma de red neuronal, y de un conjunto de datos suficientemente amplio y variado. Los resultados obtenidos por el modelo D3POCR desarrollado superan con creces a los algoritmos tradicionales de OCR, al menos en este caso de uso. Este nuevo modelo compuesto se basa en 3 fases: la detección y localización del código a reconocer, un ajuste y calibración de sus coordenadas, y finalmente la fase que más se asemeja a un OCR tradicional, que se encarga del reconocimiento del propio código. Para ello, se entrenaron 3 modelos de redes neuronales y se diseñó un algoritmo parametrizado denominado ventana deslizante. A su vez, se recogieron 3 conjuntos de datos en formato de imagen para el entrenamiento de los 3 modelos mencionados anteriormente. Una vez finalizada la fase de desarrollo y entrenamiento del modelo D3POCR, se procedió a su despliegue y se inició la fase de pruebas para comprobar la precisión real del modelo. Los resultados obtenidos reflejaron el gran potencial del modelo frente a la enorme variabilidad de los datos con los que se trabajaba y a un entorno poco controlado. Por último, cabe destacar que este algoritmo no fue diseñado como un modelo de OCR avanzado que pueda ser implementado en otros casos de uso similares, ya que es un desarrollo completamente ad-hoc para un caso de uso real de una empresa de logística. Sin embargo, viendo los resultados obtenidos por este nuevo enfoque de OCR, se pretende que este trabajo sirva de inspiración para nuevos modelos de OCR que trabajen en situaciones similares a las presentadas en este trabajo.
Enlaces de interés

Aviso legal

Política de privacidad

Política de cookies

Reclamaciones, sugerencias y felicitaciones

Recursos adicionales

Biblioteca UNED

Depósito de datos de investigación

Portal de investigación UNED

InvestigaUNED

Contacto

Teléfono: 913988766 / 6633 / 7891 / 6172

Correo: repositoriobiblioteca@adm.uned.es