Persona:
Martínez Cantón, Clara Isabel

Cargando...
Foto de perfil
Dirección de correo electrónico
ORCID
0000-0003-0781-2418
Fecha de nacimiento
Proyectos de investigación
Unidades organizativas
Puesto de trabajo
Apellidos
Martínez Cantón
Nombre de pila
Clara Isabel
Nombre

Resultados de la búsqueda

Mostrando 1 - 10 de 12
  • Publicación
    ANJA, ¿dónde están los encabalgamientos?
    (2018) Ruiz Fabo, Pablo; González-Blanco García, Elena; Martínez Cantón, Clara Isabel
    Este póster presenta la interfaz ANJA para el análisis automático del encabalgamiento desde una sencilla aplicación web: http://prf1.org/anja/index/, desarrollada dentro del proyecto ERC POSTDATA GA- 6795281.
  • Publicación
    DISCO: Diachronic Spanish Sonnet Corpus
    (Universität zu Köln, 2018) Ruiz Fabo, Pablo; Calvo Tello, José; Martínez Cantón, Clara Isabel
    This poster presents a corpus of 19th-century sonnets in Spanish in XML-TEI (685 authors, 2677 sonnets). It includes well-known authors, like Bécquer, Delmira Agustini or “Clarín”, but also less canonized authors. Texts and authors are enriched with identifiers and metadata.
  • Publicación
    Plotting Poetry: On Mechanically Enhanced Reading, 5th-7th October, Basel, Switzerland [Chronicle]
    (University of Tartu, 2017) Plecháč, Petr; Ruiz Fabo, Pablo; Seláf, Levente; Martínez Cantón, Clara Isabel
    The international conference Plotting Poetry: On Mechanically Enhanced Reading was organised by Anne-Sophie Bories, Hugues Marchal (both University of Basel), and Gérald Purnelle (Liege University) held in Basel, Switzerland from 5 to 7 October 2017. This conference comprised 26 pres­entations in English and French, delivered by scholars from eleven different countries and devoted to a wide range of projects in which poetry, poetics, and poeticity meet with computers and quantitative models.
  • Publicación
    Automatic enjambment detection as a new source of evidence in Spanish versification
    (2017) Ruiz Fabo, Pablo; González-Blanco García, Elena; Poibeau, Thierry; Martínez Cantón, Clara Isabel
    We present software to automatically identify enjambment (and its type) in Spanish. Traditionally, enjambment is described as a device whereby no syntactic pause occurs at the end of a poetry line, splitting a phrase across two lines. Most definitions highlight the conflict between syntactic and metrical units, yielding stylistic effects like double interpretations. In Spanish versification, Quilis (1964) performed poetry reading experiments, characterizing enjambment as happening only when very cohesive syntactic units, which it would be unnatural to interrupt, are split across lines. Spang (1983) noted that splitting verbs and their subject or object across two lines also triggers (softer) enjambment-like effects. These characterizations are still considered current, but some points in them are debated. To systematically gather evidence on enjambment, we created a Natural Language Processing-based system that automatically detects and types enjambments as characterized above. For evaluation, we manually annotated a reference corpus. We consider system results satisfactory; F1 varied depending on enjambment type and poems’ period. A system and corpus description, and evaluation are at: https://sites.google.com/site/spanishenjambment/ We are not aware of large-sample enjambment studies across periods, literary movements, or versification types in Spanish, or other languages. Automatic detection can provide quantitative evidence for questions in verse theory, e.g.: To what an extent is enjambment used differently in free verse vs. traditional versification? Applying the system to 3750 sonnets covering four centuries is shedding light on unclear points in the definition of enjambment. The system finds line-pairs formally fitting the description of enjambment, but that, upon human validation, we’d consider borderline cases, given other stylistic factors, e.g. hyperbaton. Conversely, our annotators are sometimes surprised that certain line-pairs are not considered enjambed in the typology. Automatic identification of many examples, plus expert validation, is helping towards a more nuanced redefinition of enjambment.
  • Publicación
    Enjambment Detection in a Large Diachronic Corpus of Spanish Sonnets
    (Association for Computational Linguistics, 2017) Ruiz Fabo, Pablo; Poibeau, Thierry; González-Blanco García, Elena; Martínez Cantón, Clara Isabel
    Enjambment takes place when a syntactic unit is broken up across two lines of poetry, giving rise to different stylistic effects. In Spanish literary studies, there are unclear points about the types of stylistic effects that can arise, and under which linguistic conditions. To systematically gather evidence about this, we developed a system to automatically identify enjambment (and its type) in Spanish. For evaluation, we manually annotated a reference corpus covering different periods. As a scholarly corpus to apply the tool, from public HTML sources we created a diachronic corpus covering four centuries of sonnets (3750 poems), and we analyzed the occurrence of enjambment across stanzaic boundaries in different periods. Besides, we found examples that highlight limitations in current definitions of enjambment.
  • Publicación
    Poesía, interoperabilidad y estándares para el tratamiento de datos poéticos. Una aproximación desde el proyecto POSTDATA
    González-Blanco García, Elena; Bermúdez Sabel, Helena; Curado Malta, Mariana; Rio Riande, Gimena del; Ferreyra, Diego; Ruiz Fabo, Pablo; Martínez Cantón, Clara Isabel
    Este panel integra y agrupa varias aproximaciones tecnológicas al tratamiento computacional de la poesía, que se suman y se trabajan en paralelo dentro del proyecto POSTDATA (www.postdata.linhd.es), un proyecto financiado por la Comisión Europea a través de su programa ERC Starting Grant, que busca la interoperabilidad de datos poéticos procedentes de diferentes fuentes, tradiciones y corpora mediante la utilización de estándares tecnológicos: los datos enlazados y la creación de un perfil de aplicación para el análisis poético; la utilización de estándares existentes en el ámbito de las Humanidades Digitales, como el TEI y la automatización de los procesos de análisis de los textos y específicamente de la poesía, gracias a la utilización combinada de las tecnologías del lenguaje, el aprendizaje automático y el análisis estadístico de los textos. El panel consiste en una presentación de los resultados obtenidos hasta el momento mediante 1) la presentación del proceso de construcción del modelo de datos poéticos obtenido tras realizar el análisis de veinte (20) bases de datos de proyectos dedicados a poesía, y que servirá como base para la creación de un perfil de aplicación de metadatos; 2) la recolección y organización de los vocabularios controlados que cada una de las diferentes tradiciones poéticas, lingüísticas y culturales utiliza para nombrar y clasificar su información, gracias al uso de una herramienta común de gestión de estos vocabularios (TemaTres); 3) el análisis de los problemas específicos del modelado de la rima , y 4) los nuevos retos del proyecto y las líneas que están en marcha, como la cuestión de la transformación de los datos en XML/TEI para datos en RDF teniendo como base el modelo semántico del perfil de aplicación de metadatos, o la definición de los algoritmos que configurarán el “PoetryLAB”, espacio de análisis y experimentación con PLN y tecnologías del lenguaje que buscan automatizar el proceso de análisis poético.
  • Publicación
    The Diachronic Spanish Sonnet Corpus (DISCO): TEI and Linked Open Data Encoding, Data Distribution and Metrical Findings
    (2018) Ruiz Fabo, Pablo; Bermúdez Sabel, Helena; González-Blanco García, Elena; Navarro Colorado, Borja; Martínez Cantón, Clara Isabel
    This paper describes the DISCO corpus and how it complements available digital materials for poetry in Spanish in several respects: First, the author and period range. Second, metadata concerning the authors and their works expressed in TEI-RDFa, given the importance of interoperability between literary datasets and the advantages of Linked Open Data as a paradigm. Finally, example findings that can be obtained with our corpus are provided, regarding metrical patterns diachronically.
  • Publicación
    Poetry Lab (POSTER)
    (2018) González-Blanco García, Elena; Díez Platas, María Luisa; Ruiz Fabo, Pablo; Bermúdez Sabel, Helena; Ayciriex, Luciana; Ros Muñoz, Salvador; Martínez Cantón, Clara Isabel
    Main goals: a) Develop Tools for automatic poetry analysis, largely based on Natural Language Processing. b) Carry out the detection of literary phenomena relied on linguistic characteristics.
  • Publicación
    A caballo entre el verso y las humanidades digitales. La evaluación de herramientas como modo de aprendizaje en el aula
    Ruiz Fabo, Pablo; Navarro Colorado, Borja; Martínez Cantón, Clara Isabel
    Esta comunicación presenta una experiencia docente llevada a cabo en 2016-2017 en la asignatura de “Estilística y métrica españolas” de la UNED. En ella se ofreció a los estudiantes la posibilidad de participar en la anotación métrica de un amplio corpus de sonetos, introduciéndoles mediante charlas y debates en las nociones fundamentales de las Humanidades Digitales e informándoles de las actividades de investigación y evaluación de herramientas que eran posibles gracias a la anotación del corpus en el que estaban trabajando.
  • Publicación
    Distant Rhythm: Automatic Enjambment Detection on Four Centuries of Spanish Sonnets
    (2017) Ruiz Fabo, Pablo; Poibeau, Thierry; Martínez Cantón, Clara Isabel
    Enjambment takes place when a syntactic unit is broken up across two lines of poetry, giving rise to different stylistic effects. In Spanish literary studies, detailed case-studies of the phenomenon based on single authors exist. However, a larger-scale study spanning hundreds of major and minor authors, across several centuries, is not available so far. Towards that need, we have developed software based on Natural Language Processing (NLP), to automatically identify enjambment (and its type) in Spanish. To evaluate the system, we manually annotated two reference corpora (one diachronic, one from the 20th century). Results are satisfactory for the system's first version, with F1 varying depending on period and enjambment type. As a scholarly corpus to apply the tool, from public HTML sources we created a diachronic corpus covering four centuries of sonnets (3750 poems). We applied the tool to analyze the occurrence of enjambment across stanzaic boundaries in different periods.