Please use this identifier to cite or link to this item: http://monografias.ufrn.br/handle/123456789/8349
Title: Uma proposta de estratificação de dados para seleção de instâncias em aprendizado de máquina semissupervisionado
Authors: Alves, Cainan
Keywords: Aprendizado semissupervisionado;FlexCon-C;Estratificação de dados
Issue Date: 12-Dec-2018
Publisher: Universidade Federal do Rio Grande do Norte
Citation: ALVES, Cainan Teixeira. Uma proposta de estratificação de dados para seleção de instâncias em aprendizado de máquina semissupervisionado. 2018. 79 f. TCC (Graduação) - Curso de Sistemas de Informação, Departamento de Computação e Tecnologia, Universidade Federal do Rio Grande do Norte, Caicó, 2018.
Portuguese Abstract: Algoritmos e métodos capazes de aprender por meio de poucos exemplos rotulados são de grande necessidade em aplicações reais, devido a dificuldade para conseguir conjuntos com dados relevantes e corretamente rotulados para a tarefa de classificação. Estes algoritmos normalmente complementam suas bases de dados com uma quantidade maior de instâncias até então sem rótulo, de forma que os classificadores possam gerar predições mais precisas. Contudo, é necessário que haja uma automatização do processo de rotulação dos exemplos sem rótulo. O Flexible Confidence with Classifier (FlexCon-C), método baseado no algoritmo self-training, utiliza um limiar flexível que rotula de acordo com a confiança das instâncias previstas. No entanto, a escolha dos rótulos se concentra apenas na confiabilidade pertinente aos exemplos, demonstrando uma falta de controle com relação as classes inseridas. Com base nisso, este estudo teve como objetivo adaptar o FlexCon-C para o uso de estratificação durante a inclusão dos exemplos no conjunto de treinamento. Para a realização de experimentos, a fim de obter resultados propícios a uma avaliação, foram elencadas trinta e uma bases de dados e atribuídas cinco configurações para dados rotulados inicialmente, onde foram aplicados quatro classificadores para obtenção de resultados relacionados ao desempenho. Os resultados mostraram que o método proposto obteve melhor desempenho quando os experimentos foram aplicados a poucos dos dados rotulados inicialmente, evidenciando que a estratificação é mais eficaz quando se tem pouquíssimos exemplos rotulados.
URI: http://monografias.ufrn.br/handle/123456789/8349
Other Identifiers: 2015076386
Appears in Collections:CERES - Sistemas de Informação

Files in This Item:
File Description SizeFormat 
UmaPropostaDeEstratificaçãoDeDados_Alves_2018.pdf863.15 kBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons