Descubrimiento de secuencias frecuentes y su aplicación a la clasificación de documentos

Dublin Core

Título

Descubrimiento de secuencias frecuentes y su aplicación a la clasificación de documentos

Materia

Ciencias matemáticas
Ciencias Técnicas

Descripción

La presente investigación aborda, en una primera etapa, el problema de la minería de secuencias frecuentes sobre conjuntos de datos estáticos. En esta tesis se propone un nuevo algoritmo para la obtención de todas las secuencias frecuentes, siguiendo como estrategia principal la generación de las secuencias candidatas a partir de las secuencias frecuentes de tamaño dos. Además, este algoritmo introduce una nueva estrategia de poda que permite reducir la cantidad de secuencias candidatas, lo cual coadyuva a la eficiencia del algoritmo. En una segunda etapa se propone un nuevo clasificador basado en secuencias frecuentes, el cual, sin pérdida de generalidad, se evalúa en colecciones de documentos. Para ello, se propone un nuevo algoritmo para el cálculo de reglas de clasificación basadas en secuencias, que utiliza la medida de calidad Netconf. Todas las propuestas se validaron a través de experimentos sobre conjuntos de datos sintéticos y conjuntos de datos internacionales utilizados en los trabajos reportados. En los experimentos se utilizaron algoritmos del estado del arte, algunos de ellos proporcionados por sus autores.

Autor

Febrer Hernández, José Kadir
Hernández Palancar, José (Director)

Editor

Editorial Universitaria

Fecha

2016

Colaborador

Cuba, Ministerio de Educación Superior

Derechos

Formato

pdf Interactivo (0,82 Mb)

Idioma

Español

Tipo

Texto

Identificador

isbn:9789591635082

Cobertura

Santa Clara

Colección

Citación

Febrer Hernández, José Kadir y Hernández Palancar, José (Director), “Descubrimiento de secuencias frecuentes y su aplicación a la clasificación de documentos,” Catálogo EDUNIV, consulta 22 de noviembre de 2024, http://repositorio.eduniv.cu/items/show/1253.

Formatos de Salida