Persona:
Martínez Cantón, Clara Isabel

ORCID

0000-0003-0781-2418

Apellidos

Martínez Cantón

Nombre de pila

Clara Isabel

Página completa del ítem

Resultados de la búsqueda

Mostrando 1 - 6 de 6

The Diachronic Spanish Sonnet Corpus (DISCO): TEI and Linked Open Data Encoding, Data Distribution and Metrical Findings
(2018) Ruiz Fabo, Pablo; Bermúdez Sabel, Helena; González-Blanco García, Elena; Navarro Colorado, Borja; Martínez Cantón, Clara Isabel
This paper describes the DISCO corpus and how it complements available digital materials for poetry in Spanish in several respects: First, the author and period range. Second, metadata concerning the authors and their works expressed in TEI-RDFa, given the importance of interoperability between literary datasets and the advantages of Linked Open Data as a paradigm. Finally, example findings that can be obtained with our corpus are provided, regarding metrical patterns diachronically.
Poetry Lab (POSTER)
(2018) González-Blanco García, Elena; Díez Platas, María Luisa; Ruiz Fabo, Pablo; Bermúdez Sabel, Helena; Ayciriex, Luciana; Ros Muñoz, Salvador; Martínez Cantón, Clara Isabel
Main goals: a) Develop Tools for automatic poetry analysis, largely based on Natural Language Processing. b) Carry out the detection of literary phenomena relied on linguistic characteristics.
Poetry and Digital Humanities making interoperability possible in a divided world of digital poetry: POSTDATA project. (ABSTRACT)
(2018) González-Blanco García, Elena; Ruiz Fabo, Pablo; Díez Platas, María Luisa; Bermúdez Sabel, Helena; Ayciriex, Luciana; Ros Muñoz, Salvador; Martínez Cantón, Clara Isabel; Caminero Herráez, Agustín Carlos
Poesía, interoperabilidad y estándares para el tratamiento de datos poéticos. Una aproximación desde el proyecto POSTDATA
González-Blanco García, Elena; Bermúdez Sabel, Helena; Curado Malta, Mariana; Rio Riande, Gimena del; Ferreyra, Diego; Ruiz Fabo, Pablo; Martínez Cantón, Clara Isabel
Este panel integra y agrupa varias aproximaciones tecnológicas al tratamiento computacional de la poesía, que se suman y se trabajan en paralelo dentro del proyecto POSTDATA (www.postdata.linhd.es), un proyecto financiado por la Comisión Europea a través de su programa ERC Starting Grant, que busca la interoperabilidad de datos poéticos procedentes de diferentes fuentes, tradiciones y corpora mediante la utilización de estándares tecnológicos: los datos enlazados y la creación de un perfil de aplicación para el análisis poético; la utilización de estándares existentes en el ámbito de las Humanidades Digitales, como el TEI y la automatización de los procesos de análisis de los textos y específicamente de la poesía, gracias a la utilización combinada de las tecnologías del lenguaje, el aprendizaje automático y el análisis estadístico de los textos. El panel consiste en una presentación de los resultados obtenidos hasta el momento mediante 1) la presentación del proceso de construcción del modelo de datos poéticos obtenido tras realizar el análisis de veinte (20) bases de datos de proyectos dedicados a poesía, y que servirá como base para la creación de un perfil de aplicación de metadatos; 2) la recolección y organización de los vocabularios controlados que cada una de las diferentes tradiciones poéticas, lingüísticas y culturales utiliza para nombrar y clasificar su información, gracias al uso de una herramienta común de gestión de estos vocabularios (TemaTres); 3) el análisis de los problemas específicos del modelado de la rima , y 4) los nuevos retos del proyecto y las líneas que están en marcha, como la cuestión de la transformación de los datos en XML/TEI para datos en RDF teniendo como base el modelo semántico del perfil de aplicación de metadatos, o la definición de los algoritmos que configurarán el “PoetryLAB”, espacio de análisis y experimentación con PLN y tecnologías del lenguaje que buscan automatizar el proceso de análisis poético.
Procesamiento del lenguaje natural y fijación del texto. Experiencias en torno a la constitución de un corpus diacrónico de sonetos
(Studia Aurea Monográfica, 2024-01-01) Bermúdez Sabel, Helena; Martínez Cantón, Clara Isabel; Ruiz Fabo, Pablo; Ministerio de Economía, Industria y Competitividad FFI2015-65093-P, Ministerio de Ciencia e Innovación PID2019-107928GB-I00
Esta contribución surge en el contexto de desarrollo del corpus de sonetos DISCO (Diachronic Spanish Sonnet Corpus), un corpus de 4530 sonetos en español compuestos entre el siglo xvi y el xx por autores de diversas procedencias (Europa, Latinoamérica y Filipinas). Este recurso contiene las anotaciones de diferentes fenómenos de versificación que han sido obtenidas a partir de técnicas del procesamiento del lenguaje natural (PLN). En este artículo presentamos cómo los resultados de la anotación automática pueden ser utilizados para detectar problemas de transmisión textual. Uno de los objetivos de esta contribución es el de proporcionar claves sobre posibles flujos de trabajo que, ayudándose de herramientas de PLN, permitan detectar posibles errores textuales, centrando así los esfuerzos de revisión manual en pasajes concretos.
DISCOvering Spanish Sonnets: A Circular Reading Experience
(DE GRUYTER, 2022-12-19) Bermúdez Sabel, Helena; Ruiz Fabo, Pablo; Martínez Cantón, Clara Isabel
With DISCO, the DIachronic Spanish Sonnet COrpus, we collected 4085 sonnets, from the 15th to the 19th centuries, including canonical and lesser-studied authors from both Spain and Latin- America, with detailed author metadata, metrics, rhyme-scheme and enjambment annotations. The dataset is available on public repositories, offered in plain text and TEI, and enriched with RDFa, a linked-data format. The corpus was intended for research and teaching, as well as for non-specialist use. Some questions naturally emerge: How can we easily navigate this corpus and its rich metadata? How can we identify trends thanks to its annotations? How can users not proficient in XML query languages and linked data benefit from such a dataset? To address these issues, we have created DISCOver, a user-friendly web interface to explore the DISCO corpus. It was conceived as a means to help students, researchers, and readers overall, making the corpus accessible to a wider audience. The interface displays literary annotations on individual texts as well as quantitative data on user-defined subcorpora. In turn, from the aggregated data we can go back to the texts the data are based on. Thus, the interface helps us assess the features of individual texts in the context of quantitative data about larger parts of the corpus, and vice-versa. It also helps us nuance hypotheses based on aggregate data by consulting the texts they are derived from.

Persona:
Martínez Cantón, Clara Isabel

Dirección de correo electrónico

ORCID

Fecha de nacimiento

Proyectos de investigación

Unidades organizativas

Puesto de trabajo

Apellidos

Nombre de pila

Nombre

Filtros

Autor

Tipo

Departamento

Centro

Fecha

Tiene archivos

Tipo de ítem

Nivel de acceso

Ajustes

Ordenar por

resultados por página

Resultados de la búsqueda

Persona: Martínez Cantón, Clara Isabel

Dirección de correo electrónico

ORCID

Fecha de nacimiento

Proyectos de investigación

Unidades organizativas

Puesto de trabajo

Apellidos

Nombre de pila

Nombre

Filtros

Autor

Tipo

Departamento

Centro

Fecha

Tiene archivos

Tipo de ítem

Nivel de acceso

Ajustes

Ordenar por

resultados por página

Resultados de la búsqueda

Persona:
Martínez Cantón, Clara Isabel