Please use this identifier to cite or link to this item: http://monografias.ufrn.br/handle/123456789/8347
Title: Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
Authors: Tavares, Alan de Medeiros
Keywords: Classification of data;Semi-supervised learning;FlexCon-G method.;Classificação de Dados;Aprendizado Semissupervisionado;Método FlexCon-G
Issue Date: 6-Dec-2018
Publisher: Universidade Federal do Rio Grande do Norte
Citation: TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.
Portuguese Abstract: A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.
Abstract: The construction of data learning models is an important aspect of Machine Learning. However, the difficulty encountered in the data classification process is still a problem related to this area, mainly due to the limited number of examples in the databases and the complexity of choosing the examples to be used during the training phase. On the other hand, semi-supervised learning enables the construction of learning models from a small set of labeled examples. Within this type of learning there is the self-training algorithm, which, iteratively, performs data classification in the semi-supervised model. Several studies have been developed with the purpose of improving the classification of the data of this algorithm, among them one that proposes a modification in the original algorithm, in order to update the inclusion rate of new examples to the training set gradually, reaching a greater number of examples . In this context, this study aims to study the influence of the confidence threshold reduction parameter in the cited method (called FlexCon-G). To evaluate this study, experiments were performed using 30 different databases and with different values to reduce the confidence threshold. Each one was set up with a different percentage of the standards initially labeled and trained using the naive-bayes and decision tree classifiers. The obtained results showed that the evaluated values obtained better performance than the original proposal.
URI: http://monografias.ufrn.br/handle/123456789/8347
Other Identifiers: 2015082267
Appears in Collections:CERES - Sistemas de Informação

Files in This Item:
File Description SizeFormat 
UmEstudoSobreAVariaçãoDolimiar_Tavares_20187.29 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons