Evento Informática 2022 starts on 31 de diciembre de 2024, 15:00:00 -0500
HERRAMIENTA PARA LA CLASIFICACIÓN DE ARCHIVOS DIGITALES SEGÚN SU CORPUS TEXTUAL
31/12/24 20:00 - 31/12/24 21:30 (UTC) (1 hora 30 minutos)

HERRAMIENTA PARA LA CLASIFICACIÓN DE ARCHIVOS DIGITALES SEGÚN SU CORPUS TEXTUAL
Roberto Antonio Infante Milanés Profesor rainfantem@uci.cu



La recuperación de información es el área del conocimiento mediante la cual se localiza y accede a los recursos de información que son pertinentes para la resolución de un problema determinado. Incluye la representación, el almacenamiento, la organización y el acceso a elementos de información. Uno de los problemas actuales en la recuperación de información es la necesidad de realizar actividades de clasificación de archivos digitales para la identificación y el agrupamiento de documentos semejantes con características comunes. En este trabajo se tiene como objetivo presentar los principales elementos de la implementación de una solución informática para la clasificación del corpus textual de archivos digitales textuales en contribución a la recuperación de información. La herramienta utiliza como técnica de aprendizaje no supervisado para el agrupamiento de los datos, el algoritmo de agrupamiento particional k-means. Basado en este algoritmo se diseña y desarrolla un modelo de clasificación, lo que es necesario para la etapa de organización y clasificación automática de archivos digitales textuales, así como tareas que incluyan la organización, clasificación, indexación y búsqueda en sistemas informáticos de recuperación de información.