Número de registros encontrados: 11
|
MARCU, Daniel |
|
The Rhetorical Parsing, Summarization, and Generation of Natural Language Texts.
|
|
PhD thesis, University of Toronto, 1997. |
|
Archivo PDF |
|
Esta tesis es una investigación sobre la naturaleza de la retórica en textos de lenguaje natural ilimitados, los medios informáticos para posibilitar su derivación y dos aplicaciones (de sumarización automática y generación de lenguaje natural) que resultan de la capacidad de construir esas estructuras automáticamente. La tesis propone la formalización en primer lugar de la estructura retórica de alto nivel del texto. La formalización asume que el texto puede ser secuenciado en unidades elementales, que las relaciones del discurso se mantienen entre unidades textuales de varios tamaños, que algunas unidades del texto son más importantes para el propósito del escritor que otras y que los árboles son una buena aproximación para conocer la estructura abstracta del texto. La formalización también introduce un criterio composicional incentivado lingüísticamente que se pone de relieve para almacenar las estructuras del texto que son válidas. La tesis propone, analiza teóricamente y compara empíricamente cuatro algoritmos para determinar las estructuras válidas del texto de una secuencia de unidades entre las que se mantienen algunas relaciones retóricas. Dos algoritmos aplican técnicas del modelo teórico y los otros dos aplican técnicas de teorías de pruebas. La formalización y los algoritmos mencionados hasta ahora corresponden a la faceta teórica de la tesis. Un corpus preliminar de análisis del indicio de frases proporciona los instrumentos para aplicar la formalización a los textos de lenguaje natural sin limitaciones. Un grupo de algoritmos empíricamente motivados fueron diseñados para determinar las unidades textuales elementales de un texto, hipotetizar las relaciones retóricas que se mantienen entre estas unidades y, finalmente, obtener las estructuras del discurso del texto. El proceso que encuentra la estructura del discurso de un texto de lenguaje natural sin limitaciones se llama análisis gramatical retórico. Esta tesis analiza dos posibles aplicaciones de la teoría del texto propuesta. La primera aplicación concierne al sistema de sumarización basado en el discurso, que se muestra para superar de manera significativa tanto al algoritmo de base como al sistema comercial. Un experimento empíricamente psicolingüístico no sólo ofrece una evaluación objetiva del sistema de sumarización sino que además confirma la idoneidad de utilizar la teoría del texto aquí propuesto para determinar las unidades más importantes de un texto. La segunda aplicación concierne a un grupo de algoritmos de planificación de un texto que pueden ser usados por los sistemas de generación de lenguaje natural para construir proyectos de texto en los casos en que la meta comunicativa de alto nivel sea trazar el mapa de una fuente completa de conocimiento del texto. |
|
estructura retórica; sumario; automatización ; procesamiento natural del lenguaje |
Valoración |
|
|
|
|
MARCU, Daniel |
|
The Automatic Construction of Large-Scale Corpora for Summarization Research.
|
|
In HEARST, M., GEY. F., TONG, R., (Eds), Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp 137-144, University of California, Berkely, August 1999. |
|
En línea (consulta: 07/2005) SOLO UGR |
|
La investigación en sumarización es conocida por la falta de un corpus adecuado. En la actualidad existen sólo unas pocas colecciones de textos reducidas cuyas secciones han sido manualmente comentadas por su importancia textual. Dado el coste y la pesadez del proceso, es poco probable que se comente manualmente la importancia textual de corpus de textos bastante extensos. Para evitar este problema, se ha desarrollado un algoritmo que construye este corpus automáticamente. Este algoritmo toma como entrada una abstracción-h, Texti tuple y genera el extracto correspondiente, por ejemplo, un grupo de oraciones en el texto que se usan para escribir la abstracción. La actuación del algoritmo se pone de manifiesto para ser lo más parecida a la de los humanos por medio de un experimento empírico. El experimento también sugiere estrategias de extracción que podrían mejorar la actuación de sistemas de sumarización automáticos. |
|
sistema de información; documento; sumario |
Valoración |
|
|
|
|
CONNAWAY, Lynn Silipigni; LOGAN, Rochelle; BROWN, Chistopher |
|
Identifying and Representing Electronic Engineering Resources: A Case Study in Knowledge Management
|
|
International Symposium on Research Development and Practice in Digital Libraries, vol 97 |
|
En línea (Consulta:06/2005) |
|
El objetivo de este artículo es identificar recursos electrónicos válidos y de calidad para ingenieros, para lo cual define un conjunto de criterios para seleccionar dichos recursos, los localiza e identifica, proporcionando para cada uno de ellos un resumen descriptivo de sus contenidos. |
|
internet; recursos electrónicos; gestión del conocimiento; biblioteca virtual; resumir; organización de la información. |
Valoración |
|
|
|
Mostrando la página 3 de 3 Anterior 1 2 3 Siguiente
|