Search and access to information contained in the speech of multimedia resources
- Amparo Varona Fernández
- Luis Javier Rodríguez Fuentes
- Mikel Peñagarikano Badiola
- Silvia Nieto Nieto
- Mireia Díez Sánchez
- Germán Bordel García
ISSN: 1135-5948
Año de publicación: 2010
Número: 45
Páginas: 317-318
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
El proyecto tiene como objetivo hacer aportaciones científicas e introducir mejoras de tipo tecnológico en el sistema de indexado y búsqueda de contenidos multimedia (Hearch) desarrollado por el Grupo de Trabajo en Tecnologías Software de la UPV/EHU. Hearch es un buscador de aspecto convencional (como Google, Bing, etc.) pero con la capacidad de obtener como resultado segmentos de vídeo gracias a la transcripción automática de sus contenidos de voz. El sistema consta de un back-end que capta, procesa e indexa los recursos, y de un front-end que permite realizar búsquedas, configurar los distintos módulos y monitorizar el funcionamiento, mediante una interfaz web. Actualmente se encuentra operativa una primera versión de la herramienta que trabaja frente a repositorios de noticias en castellano y euskera (http://gtts.ehu.es/Hearch/), aunque está preparada también para tratar con recursos en inglés.