Detecting the Central Units of Brazilian Portuguese argumentative answer texts

  1. Kepa Bengoetxea
  2. Mikel Iruskieta
  3. Juliano Antonio
Procesamiento del lenguaje natural

ISSN: 1135-5948

Any de publicació: 2018

Número: 61

Pàgines: 23-30

Tipus: Article

Altres publicacions en: Procesamiento del lenguaje natural


Understanding or writing properly the main idea or the Central Unit (CU) of a text is a very important task in exams. So, detecting automatically the CU may be of interest in language evaluation tasks. This paper presents a CU detector based on machine learning techniques for argumentative answer texts in Brazilian Portuguese. Results show that the detection of CUs following machine learning techniques in argumentative answer texts is better that those using rules.

Referències bibliogràfiques

  • Aleixo, P. and T. Pardo. 2008. CSTNews: um córpus de textos jornalísticos anotados segundo a teoria discursiva multidocumento CST (Cross-Document Structure Theory). Technical Report ICMC-USP.
  • Antonio, J. 2015. Detecting central units in argumentative answer genre: signals that influence annotators’ agreement. In 5th Workshop ”RST and Discourse Studies” in Actas del XXXI Congreso de la Sociedad Española del Procesamiento del Lenguaje Natural. SEPLN.
  • Antonio, J. D. and J. A. Santos. 2014. A estrutura retórica do gênero resposta argumentativa. Signum: Estudos da Linguagem, 17(2):193–223.
  • Bengoetxea, K., A. Atutxa, and M. Iruskieta. 2017. Un detector de la unidad central de un texto basado en técnicas de aprendizaje automático en textos científicos para el euskera. Procesamiento del Lenguaje Natural, 58:37–44.
  • Bengoetxea, K. and M. Iruskieta. 2018. A supervised central unit detector for spanish. Procesamiento del Lenguaje Natural 60: 29–36. ISSN 1135-5948. DOI 10.26342/2018-60-3.
  • Burstein, J. and D. Marcu. 2003. A machine learning approach for identification of thesis and conclusion statements in student essays. Computers and the Humanities, 37(4):455–467.
  • Dall’Aglio-Hattnher, M. 2007. Pesquisas em sintaxe: a abordagem funcionalista da evidencialidade. Trilhas de Mattoso Câmara e outras trilhas: fonologia, morfologia e sintaxe. Araraquara: Cultura Acadêmica Editora, 12:103–145.
  • Iruskieta, M., J. Antonio, and G. Labaka. 2016. Detecting the central units in two different genres and languages: a preliminary study of Brazilian Portuguese and Basque texts. Procesamiento de Lenguaje Natural, 56:65–72.
  • Mann, W. and S. Thompson. 1988. Rhetorical Structure Theory: Toward a functional theory of text organization. TextInterdisciplinary Journal for the Study of Discourse, 8(3):243–281.
  • Menegassi, R. J. 2011. A escrita na formação docente inicial: influências da iniciação à pesquisa. Signum: Estudos da Linguagem, 14(1):387–419.
  • Pardo, T. and M. Nunes. 2004. Dizer um analisador discursivo automático para o português do brasil. In In Anais do IX Workshop de Teses e Dissertações do Instituto de Ciências Matemáticas e de Computação, pages 1–3, São Carlos-SP, Brasil. 19 a 20 de Novembro.
  • Pardo, T., L. Rino, and M. Nunes. 2003. GistSumm: A summarization tool based on a new extractive method. Computational Processing of the Portuguese Language, pages 196–196.
  • Platt, J. 1998. Sequential minimal optimization: A fast algorithm for training support vector machines. Technical Report MSRTR-98-14.