Please use this identifier to cite or link to this item: http://monografias.ufrn.br/handle/123456789/9615
Title: Assessing irace for automated machine learning
Authors: Vieira, Carlos Eduardo Morais
Keywords: machine learning;algorithm configuration;computer vision;natural language processing;time series analysis
Issue Date: 19-Nov-2019
Publisher: Universidade Federal do Rio Grande do Norte
Citation: VIEIRA, Carlos Eduardo Morais. Assessing irace for automated machine learning. 2019. 54 f. TCC (Graduação) - Curso de Ciência da Computação, Departamento de Informática e Matemática Aplicada, Universiade Federal do Rio Grande do Norte, Natal, 2019.
Portuguese Abstract: Ferramentas automáticas de engenharia de algoritmos têm se tornado um recurso importante tanto para a academia quanto para a indústria. Em geral, essas ferramentas funcionam com o uso de certos configuradores de algoritmos demonstravelmente eficientes, dentre estes, o irace. Nessa prova de conceito, avaliamos a aplicação do irace ao campo de aprendizado de máquina (AM). Para isso, propomos um template composto de componentes do framework algorítmico sklearn, que nomeamos isklearn. Além disso, definimos formalmente um espaço de configuração e um setup experimental que permitem que o irace trate conjuntos de dados de AM como instâncias de um problema de otimização, fazendo do isklearn um sistema funcional de aprendizado de máquina automatizado. Resultados preliminares demonstram que irace é capaz de produzir modelos efetivos para três dos maiores domínios de aplicação de AM: visão computacional, processamento de linguagens naturais, e análise de séries temporais.
Abstract: Automated algorithm engineering tools have become an important asset for both academia and industry. In general, these tools are powered by a few, provenly effective algorithm configurators, among which is irace. In this proof-of-concept investigation, we assess the application of irace to the field of machine learning (ML). To do so, we propose a template built on top of the scikit-learn algorithmic framework, dubbed isklearn, comprising many preprocessing, feature engineering, and prediction algorithms. Furthermore, we formally define a configuration space and an experimental setup that allow irace to treat machine learning datasets as instances of an optimization problem, making isklearn a fully functional automated machine learning (AutoML) system. Preliminary results demonstrate that irace is able to engineer effective algorithms for three of the major ML application domains, namely computer vision, natural language processing, and time series analysis.
URI: http://monografias.ufrn.br/handle/123456789/9615
Other Identifiers: 20180153371
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
thesis-final.pdf3.31 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.