Glossary
Supervised Machine Learning

Aprendizagem automática supervisionada: O Guia Completo

Aprendizagem automática supervisionada: O Guia Completo

O aprendizado de máquina supervisionado usa dados rotulados para treinar modelos para fazer previsões. Nesta publicação, ficará a saber o que é a aprendizagem supervisionada, os componentes, os tipos de algoritmos e os casos de utilização.

Resumo

O aprendizado supervisionado usa dados rotulados para treinar [modelos de aprendizado de máquina para classificação] (https://zilliz.com/glossary/classification) e regressão para fazer previsões.
Os componentes da aprendizagem supervisionada são caraterísticas de entrada que descrevem os dados e rótulos de saída que são os resultados desejados para o modelo aprender.
Os desafios da aprendizagem supervisionada, como o sobreajuste e o subajuste, exigem um tratamento cuidadoso dos dados e técnicas de validação para garantir que os modelos se generalizam bem a novos dados.

O que é a aprendizagem automática supervisionada

Uma infografia que apresenta várias aplicações da aprendizagem supervisionada

A aprendizagem supervisionada é a base da aprendizagem automática supervisionada e utiliza dados rotulados para treinar modelos. Funciona alimentando a máquina com um conjunto de dados de entrada juntamente com a saída correspondente dados e o modelo aprende e prevê resultados. É como ensinar a um aluno um conjunto de perguntas e respectivas respostas para que ele compreenda os conceitos da aprendizagem automática não supervisionada.

A aprendizagem automática supervisionada é eficaz para várias tarefas, especialmente a classificação e a regressão. As tarefas de classificação envolvem a categorização de dados em classes predefinidas, como a deteção de spam em e-mails, e as tarefas de regressão prevêem resultados contínuos, como os preços das casas.

O esforço manual envolvido na rotulagem dos dados garante que os modelos aprendem a partir de relações exactas entre entradas e saídas, tornando a aprendizagem supervisionada uma ferramenta poderosa no arsenal da aprendizagem automática.

Aprendizagem automática supervisionada

No centro da aprendizagem automática supervisionada estão os conjuntos de dados etiquetados, que são caraterísticas de entrada emparelhadas com etiquetas de saída. Estes conjuntos de dados são cuidadosamente elaborados para treinar algoritmos para classificar dados e fazer previsões. O processo de formação envolve a recolha de dados de formação rotulados representativos juntamente com as saídas correspondentes para dar ao modelo algo para procurar e relacionar.

As caraterísticas de entrada são os atributos ou caraterísticas dos dados de entrada e de saída que são necessários para efetuar previsões. Por exemplo, num modelo de previsão do preço de uma casa, as caraterísticas podem ser a metragem quadrada, o número de quartos e a localização.

As etiquetas de saída são os resultados desejados que o modelo está a tentar prever, por exemplo, o preço real da casa. Uma parte fundamental deste processo é a forma de representar eficazmente estas caraterísticas de entrada para a função de aprendizagem.

Tipos de algoritmos de aprendizagem automática supervisionada

A aprendizagem supervisionada inclui muitos algoritmos, cada um para resolver tipos específicos de problemas, incluindo a aprendizagem supervisionada e a não supervisionada. Geralmente, estes algoritmos são classificados em algoritmos de classificação e algoritmos de regressão. Os algoritmos de classificação são utilizados para atribuir dados de entrada a categorias predefinidas, enquanto os algoritmos de regressão são utilizados para prever resultados contínuos.

Vamos aprofundar estas categorias para compreender os seus métodos e aplicações.

Algoritmos de classificação

Os algoritmos de classificação são o coração da aprendizagem automática supervisionada, utilizados para encontrar padrões e atribuir dados de entrada a categorias específicas. A regressão logística é um algoritmo popular para classificação binária, por exemplo, para detetar e-mails de spam. A regressão logística prevê se uma mensagem de correio eletrónico é spam, analisando caraterísticas como a presença de determinadas palavras-chave.

As máquinas de vectores de suporte (SVM) adoptam uma abordagem diferente, criando um hiperplano ótimo que separa as classes de dados. Isto torna a SVM adequada para tarefas que requerem uma distinção clara entre categorias, como a classificação de imagens de dígitos manuscritos.

Por outro lado, as redes neuronais, incluindo as Redes Neuronais Convolucionais (CNNs), são mais complexas. Imitam a conetividade do cérebro humano através de múltiplas camadas de transformações matemáticas, o que as torna adequadas para tarefas de classificação de imagens, como a deteção de tumores em imagiologia médica.

O algoritmo K-Nearest Neighbors (KNN) prevê a classe de uma determinada amostra com base na classe maioritária entre os seus k vizinhos mais próximos. Esta simplicidade torna o KNN adequado para aplicações como o software de reconhecimento facial, que identifica indivíduos comparando novas imagens com uma base de dados de imagens marcadas.

Cada um destes algoritmos tem pontos fortes únicos, o que os torna adequados para diferentes tarefas de classificação.

Algoritmos de regressão

Os algoritmos de regressão são utilizados para prever resultados contínuos, encontrando relações entre variáveis. A regressão linear é um algoritmo básico nesta categoria para prever valores numa escala contínua. Por exemplo, uma regressão linear simples pode prever os preços das casas com base no tamanho e na localização. Trata-se de encontrar uma relação linear entre as variáveis de entrada e o resultado pretendido.

As árvores de decisão são outra ferramenta de regressão que utiliza uma estrutura semelhante a uma árvore de instruções if-else para prever resultados. Cada ramo é uma regra de decisão e cada nó folha é um resultado. É intuitiva e fácil de visualizar, sendo útil para tarefas como a previsão de resultados de doentes com base no historial médico.

Tanto a regressão linear como as árvores de decisão fazem parte da aprendizagem automática supervisionada, para prever valores contínuos. São utilizadas em muitos domínios, desde as finanças aos cuidados de saúde.

Processo de formação em aprendizagem automática supervisionada

O processo de formação na aprendizagem automática supervisionada envolve várias etapas críticas para garantir que os modelos podem prever resultados com precisão. Começa com o pré-processamento dos dados, seguido da formação do modelo e termina com a avaliação do modelo. Cada fase é importante para transformar os dados em bruto num modelo fiável de aprendizagem automática capaz de fazer previsões precisas.

Pré-processamento de dados

O pré-processamento de dados é o primeiro passo no processo de formação, em que o conjunto de formação são os pontos de dados rotulados juntamente com as saídas corretas. Este passo assegura que os dados de entrada estão limpos e prontos para serem treinados, o que muitas vezes inclui o tratamento de valores em falta e caraterísticas de escala. O escalonamento das caraterísticas é muito importante, pois normaliza a gama de variáveis independentes para que nenhuma caraterística domine a aprendizagem.

A etapa de pré-processamento também envolve a análise exploratória dos dados para compreender os padrões e as relações entre os dados. Esta etapa ajuda a identificar quaisquer anomalias ou valores atípicos que possam distorcer a formação. Ao efetuar o pré-processamento dos dados, estabelecemos as bases para as etapas seguintes da formação do modelo.

Treinamento do modelo

Na fase de treinamento do modelo, os algoritmos processam os dados rotulados para encontrar os padrões que mapeiam as entradas para as saídas. Isso envolve o ajuste de parâmetros, que é muito importante para aumentar a precisão preditiva do modelo treinado. As árvores de decisão podem ser utilizadas tanto para tarefas de classificação como de regressão, modelando as decisões através de uma estrutura semelhante a uma árvore e ajudando o modelo a aprender com os dados.

O processo de formação também envolve ajustes iterativos para minimizar os erros e melhorar o desempenho. O refinamento contínuo ajuda a encontrar o equilíbrio entre o ajuste correto dos dados de treino e a generalização a novos dados não vistos.

Avaliação do modelo

A avaliação do modelo é o último passo em que avaliamos o modelo treinado utilizando várias métricas de desempenho. Métricas como a exatidão e a precisão são utilizadas para ver o desempenho do modelo nos dados de teste. Este passo garante que o modelo pode ser generalizado para novos dados e fornecer previsões fiáveis em aplicações do mundo real.

As técnicas de validação cruzada são utilizadas para validar ainda mais o desempenho do modelo. A divisão dos dados de treino em subconjuntos para teste ajuda a compreender a capacidade do modelo para lidar com novos dados e evitar o sobreajuste.

Aplicações da aprendizagem supervisionada

Uma infografia que apresenta várias aplicações da aprendizagem supervisionada

A aprendizagem supervisionada tem um amplo espetro de aplicações em vários sectores. Desde a agricultura, onde avalia a saúde das culturas, até aos automóveis autónomos que identificam sinais de trânsito, o seu impacto é de grande alcance.

Vamos explorar algumas aplicações específicas para compreender o seu significado prático.

Classificação de imagens

Na classificação de imagens, os algoritmos de aprendizagem supervisionada são treinados em imagens rotuladas para identificar com precisão os objectos nelas contidos. Este processo envolve alimentar o modelo com milhares de imagens rotuladas, permitindo-lhe aprender e categorizar novas imagens com precisão. Por exemplo, na imagiologia médica, as Redes Neuronais Convolucionais (CNN) são utilizadas para detetar tumores, melhorando significativamente a precisão do diagnóstico.

A aprendizagem automática supervisionada na classificação de imagens estende-se a vários domínios, incluindo a segurança, onde ajuda nos sistemas de reconhecimento facial. Estes sistemas aumentam a segurança e simplificam os processos em aeroportos, escritórios e outras áreas de alta segurança, identificando e categorizando imagens.

Deteção de spam

A deteção de spam é uma aplicação clássica de aprendizagem supervisionada e processamento de linguagem natural, em que os modelos são treinados utilizando conjuntos de dados rotulados de spam e e-mails legítimos. Ao analisar caraterísticas como informações do remetente, conteúdo do e-mail e linhas de assunto, esses modelos podem classificar os e-mails recebidos como spam ou não-spam com alta precisão.

Esta aplicação não só melhora a filtragem de correio eletrónico, como também melhora a experiência do utilizador, reduzindo a confusão nas caixas de entrada. A aprendizagem contínua a partir de dados rotulados garante que os sistemas de deteção de spam se mantêm actualizados com novas tácticas de spam, mantendo a sua eficácia ao longo do tempo.

Diagnóstico médico

Nos cuidados de saúde, a aprendizagem automática supervisionada desempenha um papel no diagnóstico de doenças através de análises preditivas. Ao analisar imagens médicas e dados de pacientes, os modelos podem prever a probabilidade de doenças como o cancro e as doenças cardiovasculares com uma precisão notável. As Redes Neuronais Convolucionais (CNN) e a regressão logística são normalmente utilizadas para estas tarefas, tirando partido de vastos conjuntos de dados de imagens médicas e registos de pacientes.

A integração de técnicas de aprendizagem automática supervisionada nos cuidados de saúde melhorou significativamente os resultados dos doentes, permitindo diagnósticos mais rápidos e mais fiáveis. Este avanço não só aumenta a exatidão dos diagnósticos médicos, como também acelera o processo de tomada de decisões, conduzindo a melhores cuidados para os doentes.

Desafios da aprendizagem automática supervisionada

Uma ilustração concetual dos desafios enfrentados na aprendizagem supervisionada

Apesar das suas inúmeras vantagens, a aprendizagem supervisionada enfrenta vários desafios. O sobreajuste ocorre quando um modelo aprende demasiado bem os dados de treino, captando ruído em vez de padrões genuínos. Isto é especialmente problemático no caso de modelos complexos com muitos parâmetros, uma vez que podem refletir demasiado fielmente os dados de treino. Para atenuar este problema, é essencial utilizar um conjunto de dados rotulados maior e mais diversificado.

Por outro lado, a subadaptação ocorre quando um modelo é demasiado simplista para compreender os padrões de dados subjacentes, resultando num fraco desempenho tanto nos dados de treino como nos novos dados. As técnicas de validação cruzada ajudam a garantir que o modelo se generaliza bem a dados não vistos, equilibrando assim os riscos de sobreajuste e subajuste.

Além disso, a exatidão dos modelos de aprendizagem supervisionada pode ser comprometida por erros humanos na rotulagem dos dados de formação.

Aprendizagem Semi-Supervisionada: Uma abordagem híbrida

Uma representação visual da aprendizagem semi-supervisionada como uma abordagem híbrida

A aprendizagem semi-supervisionada combina o melhor da aprendizagem supervisionada e não-supervisionada, utilizando dados marcados e não marcados. Inicialmente, um algoritmo é treinado num pequeno conjunto de dados rotulados e, em seguida, este modelo é utilizado para prever rótulos num conjunto de dados maiores não rotulados. Estas etiquetas previstas são adicionadas ao conjunto de dados etiquetados e o processo é repetido para melhorar a precisão do modelo iterativamente.

Esta abordagem híbrida é particularmente útil em situações em que os dados etiquetados são escassos mas os dados não etiquetados são abundantes. A aprendizagem semi-supervisionada melhora significativamente o desempenho do modelo ao utilizar grandes quantidades de dados não etiquetados, reduzindo o esforço manual necessário para a etiquetagem de dados.

Ferramentas e estruturas para aprendizagem supervisionada

Uma ilustração de ferramentas e estruturas populares utilizadas na aprendizagem supervisionada

Existe uma variedade de ferramentas e estruturas disponíveis para facilitar a aprendizagem supervisionada. O Scikit-learn, uma biblioteca Python, é conhecido pela sua simplicidade e eficiência na análise de dados, o que o torna um favorito entre os cientistas de dados. O TensorFlow, desenvolvido pela Google, é uma plataforma de código aberto conhecida pelas suas capacidades de aprendizagem profunda, ideal para criar e implementar modelos complexos.

PyTorch, uma das estruturas mais recentes, ganhou popularidade recentemente e oferece aceleração de GPU e é favorecida pela sua flexibilidade e gráficos de computação dinâmica, tornando-a particularmente adequada para projectos orientados para a investigação. Estas ferramentas e estruturas são indispensáveis no domínio da aprendizagem supervisionada, simplificando o processo de construção, formação e implementação de modelos de aprendizagem automática.

Resumo

O aprendizado supervisionado é a espinha dorsal do aprendizado de máquina, para previsões precisas e classificação de dados. Desde a compreensão dos conceitos básicos até à exploração de algoritmos e aplicações do mundo real, este guia aborda tudo o que é necessário para dominar a aprendizagem supervisionada. Ultrapassar o sobreajuste e utilizar abordagens híbridas, como a aprendizagem semi-supervisionada, torna-a ainda mais poderosa.

A viagem pela aprendizagem supervisionada mostra o seu impacto em todos os sectores, desde os cuidados de saúde à cibersegurança. À medida que se aprofunda nesta matéria, os conhecimentos e as ideias aqui apresentados permitir-lhe-ão desbloquear todo o poder da aprendizagem supervisionada e obter resultados surpreendentes nos seus projectos.

Perguntas frequentes

O que é a aprendizagem supervisionada e como é que ela difere da aprendizagem não supervisionada?

Este tipo de aprendizagem é definido pela utilização de dados de formação etiquetados para fazer previsões exactas, enquanto a aprendizagem não supervisionada consiste em encontrar padrões sem dados etiquetados. Esta diferença mostra a abordagem diferente que cada método adopta na formação de modelos.

Quais são os principais tipos de algoritmos de aprendizagem supervisionada?

Os principais tipos são os algoritmos de classificação que atribuem os dados de entrada a categorias predefinidas e os algoritmos de regressão que prevêem valores contínuos. Conhecê-los é importante para escolher a abordagem correta para a sua análise de dados.

Como é que o pré-processamento de dados afecta o processo de formação na aprendizagem supervisionada?

O pré-processamento de dados afecta a formação na aprendizagem supervisionada, garantindo que os dados de entrada são exactos e bem estruturados para que o modelo possa aprender. O tratamento dos valores em falta e das caraterísticas de escala pode melhorar o desempenho do modelo e fornecer previsões mais exactas.

Quais são alguns desafios comuns na aprendizagem supervisionada?

Overfitting e underfitting são os desafios comuns na aprendizagem supervisionada; overfitting é quando um modelo é demasiado especializado para os dados de treino e underfitting é quando um modelo é demasiado simples. A validação cruzada pode resolver estes problemas.

Que ferramentas e frameworks são populares para implementar modelos de aprendizagem supervisionada?

Scikit-learn, TensorFlow, PyTorch são as ferramentas e bibliotecas populares para usar na aprendizagem supervisionada, cada uma tem suas próprias vantagens, como simplicidade, recursos de aprendizagem profunda e flexibilidade. Escolha a que melhor se adequa ao seu projeto e à sua experiência.

Conteúdo

Comece grátis, escale facilmente

Experimente o banco de dados totalmente gerenciado, construído para seus aplicativos GenAI.

Experimente o Zilliz Cloud grátis

Compartilhar este artigo

Recursos relacionados

Como obter os Embeddings Vectoriais corretos

Uma introdução abrangente aos embeddings vectoriais e à forma de os gerar com modelos populares de código aberto.

Pesquisa de semelhanças vectoriais com Milvus

Saiba como criar um motor de pesquisa de semelhança semântica

Comparação entre o Llama 2 Chat e o ChatGPT: como se comportam na resposta a perguntas

O que é o Llama 2 e qual é o seu desempenho na resposta a perguntas em comparação com o ChatGPT?