Extracción y aprovechamiento de DTDs emparejadas en corpus paralelos

  1. Casillas Rubio, Arantza
  2. Martínez Unanue, Raquel
  3. Abaitua, Joseba
Aldizkaria:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Argitalpen urtea: 1999

Zenbakia: 25

Orrialdeak: 33-41

Mota: Artikulua

Beste argitalpen batzuk: Procesamiento del lenguaje natural

Laburpena

El artículo presenta un algoritmo que permite abstraer DTDs a partir de textos etiquetados en SGML. Estas DTDs se utilizan luego para generar textos similares. El algoritmo se ha aplicado a un corpus paralelo y con ello se han obtenido DTDs emparejadas que permiten generar nuevos documentos bilingües. Esta metodología supone una importante contribución al campo de la edición plurilingüe.