Publicación:
Hacia un corrector ortográfico para la nueva ortografía del chabacano de Zamboanga

dc.contributor.authorHimoro, Marcelo Yuji
dc.contributor.directorPareja-Lora, Antonio
dc.date.accessioned2024-05-20T12:54:21Z
dc.date.available2024-05-20T12:54:21Z
dc.date.issued2019-10-22
dc.description.abstractEn la actualidad, el zamboangueño es la variedad de chabacano o criollo filipino de base española más hablado, contando con más de 400.000 hablantes nativos en todo el país en 2010, sin contar sus hablantes como segunda lengua. Desde 2012, se enseña como asignatura y sirve de lengua vehicular en los tres primeros años de la educación primaria en las escuelas públicas de la Ciudad de Zamboanga, en la región de Mindanao (Filipinas). En la primera parte de este trabajo, se muestra, a través de un análisis breve de algunas actitudes de los hablantes, que pese a su vitalidad, el zamboangueño puede estar amenazado, y proporcionamos muchas directrices para trabajos futuros a ese respecto. Mesuramos también, por medio de un cuestionario difundido en las redes sociales, el grado de familiaridad de los hablantes a la nueva ortografía del chabacano de Zamboanga. En la segunda parte, tomando esa grafía como referencia, procuramos analizar y clasificar errores de ortografía frecuentes tanto en contextos formales como informales en nuestro corpus y proponemos una aproximación para corregir tokens utilizando Traducción Automática Estadística de Caracteres. Los resultados obtenidos muestran que esta aproximación es sumamente adecuada y podría combinarse con las tecnologías de corrección ortográfica más utilizadas actualmente para obtener un mejor desempeño.es
dc.description.abstractZamboangueño is nowadays the most widely spoken Chabacano or Philippine Creole Spanish (PCS) variety, with over 400.000 native speakers in the Philippines in 2010, not including the numerous L2 speakers. Since 2012, it has been taught as a subject and serves as a medium of instruction from Grade 1 to 3 in the public schools of Zamboanga City, Mindanao, Philippines. In the first part of this research, we show through a brief analysis of some attitudes of the speakers that, despite its high vitality, Zamboangueño may in fact be endangered, while suggesting many directions for future works regarding this issue. By means of a questionnaire widely distributed to social media users, we also assess the speakers’ level of familiarity with the so-called “Zamboanga Chavacano Orthography”. In the second part, using that orthography as a reference, we aim to analyze and classify the most frequent spell errors found in both formal and informal Zamboangueño in our corpus and propose a Character-Based Statistical Machine Translation approach to correct tokens. The results show that this approach is suitable for the presented purposes and could well be combined with the current de facto spell checking technologies to achieve further performance.en
dc.description.versionversión final
dc.identifier.urihttps://hdl.handle.net/20.500.14468/15035
dc.language.isoes
dc.publisherUniversidad Nacional de Educación a Distancia. Facultad de Filología. Departamento de Filologías Extranjeras y sus Lingüísticas
dc.relation.centerFacultades y escuelas::Facultad de Filología
dc.relation.degreeMáster universitario en Las Tecnologías de la Información y la Comunicación en la Enseñanza y el Tratamiento de Lenguas
dc.relation.departmentFilologías Extranjeras y sus Lingüísticas
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject.keywordschabacano
dc.subject.keywordszamboangueño
dc.subject.keywordsprocesamiento del lenguaje natural
dc.subject.keywordsPLN
dc.subject.keywordslenguas con pocos recursos
dc.subject.keywordscorrector ortográfico
dc.subject.keywordsChavacano
dc.subject.keywordsZamboanga
dc.subject.keywordsnatural language processing
dc.subject.keywordsNLP
dc.subject.keywordsunderresourced languages
dc.subject.keywordsspell checker
dc.titleHacia un corrector ortográfico para la nueva ortografía del chabacano de Zamboangaes
dc.typetesis de maestríaes
dc.typemaster thesisen
dspace.entity.typePublication
relation.isAuthorOfPublication5919c865-0d82-4873-b4df-9b363fe78b71
relation.isAuthorOfPublication.latestForDiscovery5919c865-0d82-4873-b4df-9b363fe78b71
Archivos
Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Himoro__Marcelo_Yuji_TFM.pdf
Tamaño:
2.08 MB
Formato:
Adobe Portable Document Format