Search and access to information contained in the speech of multimedia resources

Amparo Varona Fernández; Luis Javier Rodríguez Fuentes; Mikel Peñagarikano Badiola; Silvia Nieto Nieto; Mireia Díez Sánchez; Germán Bordel García

Search and access to information contained in the speech of multimedia resources

Amparo Varona Fernández
Luis Javier Rodríguez Fuentes
Mikel Peñagarikano Badiola
Silvia Nieto Nieto
Mireia Díez Sánchez
Germán Bordel García

Revista:

Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2010

Número: 45

Páginas: 317-318

Tipo: Artículo

DIALNET GOOGLE SCHOLAR RUA editor

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

El proyecto tiene como objetivo hacer aportaciones científicas e introducir mejoras de tipo tecnológico en el sistema de indexado y búsqueda de contenidos multimedia (Hearch) desarrollado por el Grupo de Trabajo en Tecnologías Software de la UPV/EHU. Hearch es un buscador de aspecto convencional (como Google, Bing, etc.) pero con la capacidad de obtener como resultado segmentos de vídeo gracias a la transcripción automática de sus contenidos de voz. El sistema consta de un back-end que capta, procesa e indexa los recursos, y de un front-end que permite realizar búsquedas, configurar los distintos módulos y monitorizar el funcionamiento, mediante una interfaz web. Actualmente se encuentra operativa una primera versión de la herramienta que trabaja frente a repositorios de noticias en castellano y euskera (http://gtts.ehu.es/Hearch/), aunque está preparada también para tratar con recursos en inglés.

Fuente de los datos: Dialnet