Descubrimiento de secuencias frecuentes y su aplicación a la clasificación de documentos
Dublin Core
Título
Descubrimiento de secuencias frecuentes y su aplicación a la clasificación de documentos
Materia
Ciencias matemáticas
Ciencias Técnicas
Descripción
La presente investigación aborda, en una primera etapa, el problema de la minería de secuencias frecuentes sobre conjuntos de datos estáticos. En esta tesis se propone un nuevo algoritmo para la obtención de todas las secuencias frecuentes, siguiendo como estrategia principal la generación de las secuencias candidatas a partir de las secuencias frecuentes de tamaño dos. Además, este algoritmo introduce una nueva estrategia de poda que permite reducir la cantidad de secuencias candidatas, lo cual coadyuva a la eficiencia del algoritmo. En una segunda etapa se propone un nuevo clasificador basado en secuencias frecuentes, el cual, sin pérdida de generalidad, se evalúa en colecciones de documentos. Para ello, se propone un nuevo algoritmo para el cálculo de reglas de clasificación basadas en secuencias, que utiliza la medida de calidad Netconf. Todas las propuestas se validaron a través de experimentos sobre conjuntos de datos sintéticos y conjuntos de datos internacionales utilizados en los trabajos reportados. En los experimentos se utilizaron algoritmos del estado del arte, algunos de ellos proporcionados por sus autores.
Autor
Febrer Hernández, José Kadir
Hernández Palancar, José (Director)
Editor
Editorial Universitaria
Fecha
2016
Colaborador
Cuba, Ministerio de Educación Superior
Derechos
Relación
Formato
pdf Interactivo (0,82 Mb)
Idioma
Español
Tipo
Texto
Identificador
isbn:9789591635082
Cobertura
Santa Clara
Colección
Citación
Febrer Hernández, José Kadir y Hernández Palancar, José (Director), “Descubrimiento de secuencias frecuentes y su aplicación a la clasificación de documentos,” Catálogo EDUNIV, consulta 22 de noviembre de 2024, http://repositorio.eduniv.cu/items/show/1253.