Glossary
Neural Networks

O que é uma rede neural? Um guia para desenvolvedores

O que é uma rede neural? Um guia para desenvolvedores

O que são redes neurais?

As redes neurais são modelos computacionais inspirados na estrutura do cérebro humano. Elas consistem em neurónios organizados em camadas. Os neurônios são funções de dados de entrada, x, e variáveis tensoras aprendidas (pesos e vieses). Pense numa rede neuronal como um grande F(x) ou modelo. Ou seja, uma função complexa e não linear treinada para se ajustar aos dados de entrada. Esta tecnologia de mudança de paradigma permite que as máquinas compreendam padrões e resolvam problemas complexos.

Arquitetura da rede neural

Uma rede neural é organizada em camadas: entrada, oculta e saída.

Camada de entrada**: É aqui que os dados são introduzidos na rede.
Camadas ocultas**: Estas camadas intermédias processam os dados através de múltiplas transformações sequenciais. Cada camada oculta extrai caraterísticas cada vez mais abstractas e complexas dos dados de entrada.
Camada de saída**: A camada final produz o resultado com base nas informações processadas das camadas ocultas.

Importância das redes neurais

As redes neurais são vitais por várias razões.

Reconhecimento de padrões**: As redes neuronais são excelentes no reconhecimento de padrões complexos nos dados, o que as torna altamente eficazes em tarefas como o reconhecimento de imagens e de voz.
Adaptabilidade**: Ao treinar com grandes conjuntos de dados, as redes neuronais podem adaptar-se e melhorar o seu desempenho ao longo do tempo.
Não linearidade**: As redes neuronais podem modelar relações complexas entre entradas e saídas, incluindo relações não lineares.
Processamento paralelo**: As redes neuronais podem processar dados em paralelo, acelerando a computação para tarefas de grande escala.

Princípio de funcionamento das redes neurais

As redes neurais podem ser usadas em dois modos: treinamento e inferência. Durante o treinamento, a rede ajusta seus pesos de conexão processando os dados de entrada e comparando suas previsões com os resultados esperados. Esse processo minimiza as diferenças entre as previsões e os resultados reais usando algoritmos de otimização, como o gradiente descendente. Uma vez treinada, a rede está pronta para fazer previsões usando dados novos e não vistos. O uso de uma rede neural treinada dessa forma é chamado de inferência.

Tipos de redes neurais

Redes neurais artificiais (RNAs)

As redes neurais artificiais (RNAs), também conhecidas como redes neurais feedforward, são um tipo fundamental de tecnologia de rede neural. São constituídas por neurónios de entrada, ocultos e de saída, reflectindo a estrutura interligada do cérebro humano. As RNAs são excelentes no reconhecimento de padrões, ajustando os pesos entre os neurónios.

Quando uma RNA incorpora várias camadas ocultas, é designada por DNN (rede neural profunda). Estas redes são excelentes na aprendizagem de hierarquias complexas de caraterísticas a partir de conjuntos de dados extensos.

Como funcionam as redes neurais artificiais

As RNAs usam processamento feedforward e backpropagation. Elas consistem em neurônios interconectados com pesos e vieses inicializados, usando métodos como inicialização zero ou constante, inicialização aleatória, inicialização Xavier ou Glorot. Os dados de entrada são introduzidos na camada de entrada e passados para as camadas ocultas através de arestas. Os neurónios nas camadas ocultas aplicam funções de ativação, introduzindo não linearidade, e a camada de saída gera previsões ou resultados com base nos dados processados.

Estas previsões são comparadas com os resultados reais para [cálculo do erro] (https://saturncloud.io/blog/how-to-calculate-error-for-a-neural-network/). Durante o treino, os sinais de erro são propagados para trás, ajustando os pesos através de algoritmos de otimização para minimizar as diferenças entre as previsões e os resultados reais.

Para saber mais, pode consultar este blogue sobre RNAs.

Aplicações

As RNAs desempenham um papel significativo numa variedade de tarefas de regressão e classificação que incluem análise de sentimentos, previsão de preços de acções, avaliação de risco de crédito, deteção de fraude, negociação algorítmica, deteção de anomalias, manutenção preditiva, etc. Para além destas, as RNAs são também a base de uma variedade de outras redes neuronais, como as CNNs e as RNNs.

Redes Neuronais Convolucionais (CNNs)

As RNAs tradicionais têm camadas totalmente conectadas que tratam cada unidade de entrada de forma independente. Esta arquitetura não é adequada para lidar com dados em grelha, como as imagens. As redes neurais convolucionais (CNN) são especializadas no processamento de dados em grelha, principalmente imagens e vídeos, uma vez que foram concebidas para tirar partido da estrutura espacial das imagens. Utilizam conetividade local, partilha de parâmetros, aprendizagem de caraterísticas hierárquicas, camadas convolucionais e camadas de agrupamento para extrair automaticamente caraterísticas hierárquicas dos dados de entrada.

Arquitetura e funcionamento

Camada de entrada**: A entrada para dados de imagem.
Camadas convolucionais**: Estas camadas detectam caraterísticas espaciais, criando padrões estruturados dentro das imagens. Para identificar diferentes caraterísticas, um conjunto de filtros aprendíveis (kernels) é aplicado às imagens de entrada. Uma CNN é normalmente constituída por várias camadas convolucionais empilhadas umas sobre as outras. As camadas mais profundas aprendem aspectos mais abstractos e complicados, enquanto as camadas anteriores captam informações simples, como arestas e texturas. Os resultados produzidos pelas camadas de convolução são designados por mapas de caraterísticas.
Camadas de agrupamento**: Estas camadas executam etapas de redução em que as dimensões dos dados são diminuídas, mantendo a informação essencial. Embora seja possível reduzir a amostragem das dimensões dos dados controlando o passo da convolução, uma forma eficiente de o fazer é utilizar as camadas de agrupamento. As operações comuns de agrupamento são o agrupamento máximo e o agrupamento médio.
Camadas totalmente ligadas**: Depois de obter as caraterísticas essenciais das imagens, as camadas totalmente conectadas são responsáveis por fazer a previsão final. Cada camada FC está densamente ligada à sua camada anterior e imediata e é frequentemente utilizada para produzir as pontuações e probabilidades para a tarefa de classificação.

Para saber mais, pode consultar este guia completo sobre [CNN] (https://saturncloud.io/blog/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way/).

Aplicações

As CNNs revolucionam a classificação de imagens, o reconhecimento de imagens, a deteção de objectos, a segmentação de imagens, a análise de imagens médicas, o reconhecimento de escrita manual, etc. Todas estas tarefas envolvem dados de imagem em que as CNNs são excelentes. Mas isso não é tudo. Devido à sua capacidade de processar dados em grelha, as CNNs também são aplicadas em muitas tarefas relacionadas com a fala, como o reconhecimento da fala, a tradução, etc.

Redes Neuronais Recorrentes (RNNs)

Embora as ANNs e as CNNs sejam boas para muitas tarefas, não são boas a lidar com dependências temporais e sequências de dados. As redes neurais recorrentes (RNNs) são excelentes na análise de dados seqüenciais, o que é vital para tarefas que envolvem dados de séries temporais e processamento de linguagem. As RNN mantêm a memória através de circuitos de feedback. As RNNs funcionam com base no esquema de memória inerente, que lhes permite processar a entrada atual enquanto recordam a anterior. Esta memória é conseguida através de um estado oculto que evolui à medida que a rede processa cada elemento da sequência.

Às vezes, as RNNs podem sofrer de um problema chamado [vanishing gradient] (https://www.engati.com/glossary/vanishing-gradient-problem), que limita sua capacidade de capturar dependências de longo alcance. Por esta razão, foram propostas algumas variações à arquitetura das RNN, que resultaram nas arquitecturas LSTM e GRU, as quais, ao manterem e actualizarem seletivamente a informação em contextos alargados, proporcionam melhores capacidades para modelar sequências complicadas.

Arquitetura e funcionamento

Camada de entrada: Esta camada recebe dados sequenciais como entrada, que podem ser uma sequência de palavras numa frase, dados de séries temporais, etc. Cada ponto de dados nestes dados sequenciais é representado através de um vetor frequentemente conhecido como vetor de entrada.
Camada recorrente**: Esta camada processa e memoriza dados sequenciais. Em cada passo de tempo (t), esta camada processa o vetor de entrada atual e o estado oculto anterior (saída) do passo de tempo anterior (t-1) para produzir um novo estado ou a saída para o estado atual.
Camada de saída**: Esta camada produz os resultados da análise sequencial. A arquitetura desta camada de saída depende da tarefa específica. Por exemplo, em tarefas de sequência para sequência (por exemplo, tradução de línguas), pode ser utilizada outra RNN ou uma rede neural feedforward para a camada de saída.

Para saber mais, pode consultar este blogue sobre [RNNs] (https://zilliz.com/blog/ANN-machine-learning).

Aplicações

As RNNs potencializam tarefas em que a sequência ou a dependência temporal são importantes, como tradução de idiomas, geração de fala, reconhecimento de fala, geração de música, previsão do tempo, previsão de tendências financeiras, etc.

Transformadores

Os RNNs são propensos ao problema do gradiente decrescente, que limita a sua capacidade de aprender e propagar informações em sequências longas. Além disso, eles são incapazes de entender a ordem da sequência. É aqui que uma arquitetura de transformador ajuda. Os transformadores empregam mecanismos de auto-atenção que lhes permitem pesar a importância de diferentes partes da sequência de entrada.

Este mecanismo é capaz de capturar dependências entre elementos numa sequência, independentemente das suas posições, tornando-o altamente eficaz para tarefas como a tradução de línguas, a análise de sentimentos e a geração de texto. Também fornece capacidades de processamento paralelo, o que significa que pode processar os dados em paralelo para gerir sequências longas e grandes conjuntos de dados de forma eficiente.

Arquitetura e funcionamento

Incorporação de entrada: A sequência de entrada, por exemplo, uma sequência de texto, é convertida em embeddings. Estes embeddings são a representação vetorial numérica do texto, que pode ser gerada utilizando um modelo pré-treinado como Word2vec ou GloVe.

Codificação posicional: Os modelos de transformação não compreendem intrinsecamente a ordem dos elementos numa sequência. Assim, a codificação posicional é adicionada aos embeddings de entrada que fornecem informações sobre a posição de cada elemento na sequência, o que é feito com a ajuda de uma combinação de funções trigonométricas.
Camadas de codificação e de descodificação de transformadores**: As camadas codificadoras e descodificadoras são os blocos de construção dos transformadores, repetidos várias vezes na rede. Cada uma delas é composta por três componentes principais: Atenção de várias cabeças: Calcula as pontuações de atenção para cada par de posições na sequência de entrada. Capta as dependências entre elementos, independentemente das suas posições. O resultado da auto-atenção multi-cabeças é um conjunto de representações conscientes do contexto para cada posição de entrada.
- Rede de alimentação**: As representações obtidas a partir da auto-atenção multi-cabeças são passadas para uma rede feedforward que aplica uma série de transformações lineares e funções de ativação não-lineares a cada posição independentemente.
- Ligações residuais e normalização de camadas**: As ligações residuais (ligações de salto) são adicionadas em torno das camadas de auto-atenção e de avanço de várias cabeças, seguidas de [normalização de camadas] (https://zilliz.com/learn/layer-vs-batch-normalization-unlocking-efficiency-in-neural-networks). Estes componentes ajudam a estabilizar o treino e permitem que o gradiente flua mais eficazmente. Camada de saída: A parte superior do descodificador é uma saída posterior que gera previsões ou classificações.

Para saber mais, confira este blogue sobre Modelo de transformador.

Aplicações

As redes neurais, particularmente os transformadores, melhoraram drasticamente o processamento de linguagem, permitindo a tradução precisa, o resumo e a análise de sentimentos.

Conclusão

Depois de ler este artigo, você agora sabe sobre redes neurais, sua arquitetura e funcionamento. Viu diferentes tipos de redes neurais e por que elas são a escolha certa para um caso de uso específico. Este artigo foi apenas um ponto de partida, portanto, sinta-se à vontade para explorar cada tipo em detalhes para entender melhor.

Conteúdo

Comece grátis, escale facilmente

Experimente o banco de dados totalmente gerenciado, construído para seus aplicativos GenAI.

Experimente o Zilliz Cloud grátis

Compartilhar este artigo

Recursos relacionados

Como obter os Embeddings Vectoriais corretos

Uma introdução abrangente aos embeddings vectoriais e à forma de os gerar com modelos populares de código aberto.

O que é uma base de dados vetorial?

Uma base de dados vetorial é uma solução totalmente gerida e simples para armazenar, indexar e pesquisar num conjunto de dados maciço de dados não estruturados que tira partido do poder dos embeddings dos modelos de aprendizagem automática.

Avaliação de desempenho Milvus 2023

Neste tutorial, ficará a saber mais sobre dados não estruturados baseados em texto.

O que é a GPTCache

A GPTCache é uma ferramenta de código aberto concebida para melhorar a eficiência e a velocidade das aplicações baseadas em GPT.