CIBERABSTRACTS

Inicio -> Representación de la información

Búsqueda avanzada

Número de registros encontrados: 11

Autor

MARCU, Daniel

Titulo

The Rhetorical Parsing, Summarization, and Generation of Natural Language Texts.

Fuente

PhD thesis, University of Toronto, 1997.

Soporte

Archivo PDF

Resumen

Esta tesis es una investigación sobre la naturaleza de la retórica en textos de lenguaje natural ilimitados, los medios informáticos para posibilitar su derivación y dos aplicaciones (de sumarización automática y generación de lenguaje natural) que resultan de la capacidad de construir esas estructuras automáticamente. La tesis propone la formalización en primer lugar de la estructura retórica de alto nivel del texto. La formalización asume que el texto puede ser secuenciado en unidades elementales, que las relaciones del discurso se mantienen entre unidades textuales de varios tamaños, que algunas unidades del texto son más importantes para el propósito del escritor que otras y que los árboles son una buena aproximación para conocer la estructura abstracta del texto. La formalización también introduce un criterio composicional incentivado lingüísticamente que se pone de relieve para almacenar las estructuras del texto que son válidas. La tesis propone, analiza teóricamente y compara empíricamente cuatro algoritmos para determinar las estructuras válidas del texto de una secuencia de unidades entre las que se mantienen algunas relaciones retóricas. Dos algoritmos aplican técnicas del modelo teórico y los otros dos aplican técnicas de teorías de pruebas. La formalización y los algoritmos mencionados hasta ahora corresponden a la faceta teórica de la tesis. Un corpus preliminar de análisis del indicio de frases proporciona los instrumentos para aplicar la formalización a los textos de lenguaje natural sin limitaciones. Un grupo de algoritmos empíricamente motivados fueron diseñados para determinar las unidades textuales elementales de un texto, hipotetizar las relaciones retóricas que se mantienen entre estas unidades y, finalmente, obtener las estructuras del discurso del texto. El proceso que encuentra la estructura del discurso de un texto de lenguaje natural sin limitaciones se llama análisis gramatical retórico. Esta tesis analiza dos posibles aplicaciones de la teoría del texto propuesta. La primera aplicación concierne al sistema de sumarización basado en el discurso, que se muestra para superar de manera significativa tanto al algoritmo de base como al sistema comercial. Un experimento empíricamente psicolingüístico no sólo ofrece una evaluación objetiva del sistema de sumarización sino que además confirma la idoneidad de utilizar la teoría del texto aquí propuesto para determinar las unidades más importantes de un texto. La segunda aplicación concierne a un grupo de algoritmos de planificación de un texto que pueden ser usados por los sistemas de generación de lenguaje natural para construir proyectos de texto en los casos en que la meta comunicativa de alto nivel sea trazar el mapa de una fuente completa de conocimiento del texto.

P. Clave

estructura retórica; sumario; automatización ; procesamiento natural del lenguaje

Valoración

Autor

MARCU, Daniel

Titulo

The Automatic Construction of Large-Scale Corpora for Summarization Research.

Fuente

In HEARST, M., GEY. F., TONG, R., (Eds), Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp 137-144, University of California, Berkely, August 1999.

Soporte

En línea (consulta: 07/2005) SOLO UGR

Resumen

La investigación en sumarización es conocida por la falta de un corpus adecuado. En la actualidad existen sólo unas pocas colecciones de textos reducidas cuyas secciones han sido manualmente comentadas por su importancia textual. Dado el coste y la pesadez del proceso, es poco probable que se comente manualmente la importancia textual de corpus de textos bastante extensos. Para evitar este problema, se ha desarrollado un algoritmo que construye este corpus automáticamente. Este algoritmo toma como entrada una abstracción-h, Texti tuple y genera el extracto correspondiente, por ejemplo, un grupo de oraciones en el texto que se usan para escribir la abstracción. La actuación del algoritmo se pone de manifiesto para ser lo más parecida a la de los humanos por medio de un experimento empírico. El experimento también sugiere estrategias de extracción que podrían mejorar la actuación de sistemas de sumarización automáticos.

P. Clave

sistema de información; documento; sumario

Valoración

Autor

CONNAWAY, Lynn Silipigni; LOGAN, Rochelle; BROWN, Chistopher

Titulo

Identifying and Representing Electronic Engineering Resources: A Case Study in Knowledge Management

Fuente

International Symposium on Research Development and Practice in Digital Libraries, vol 97

Soporte

En línea (Consulta:06/2005)

Resumen

El objetivo de este artículo es identificar recursos electrónicos válidos y de calidad para ingenieros, para lo cual define un conjunto de criterios para seleccionar dichos recursos, los localiza e identifica, proporcionando para cada uno de ellos un resumen descriptivo de sus contenidos.

P. Clave

internet; recursos electrónicos; gestión del conocimiento; biblioteca virtual; resumir; organización de la información.

Valoración

Mostrando la página 3 de 3
Anterior 1 2 3 Siguiente

Dirección: © Maria Pinto (UGR)

Fecha creación 31/07/2005 | Fecha actualización 11/04/2011 | Tutorial | Mapa | Sugerencias