A dopamina promove a plasticidade da direção da cabeça durante os movimentos de orientação
Nature volume 612, páginas 316–322 (2022) Citar este artigo
12k acessos
5 Citações
35 Altmétrico
Detalhes das métricas
Uma correção do autor para este artigo foi publicada em 24 de maio de 2023
Este artigo foi atualizado
Em redes neurais que armazenam informações em seus pesos de conexão, existe um tradeoff entre sensibilidade e estabilidade1,2. As conexões devem ser plásticas para incorporar novas informações, mas se forem muito plásticas, as informações armazenadas podem ser corrompidas. Uma solução potencial é permitir a plasticidade apenas durante as épocas em que as informações específicas da tarefa são ricas, com base em um sinal de 'quando aprender'3. Nós raciocinamos que a dopamina fornece um sinal de quando aprender que permite que os mapas espaciais do cérebro sejam atualizados quando novas informações espaciais estão disponíveis - isto é, quando um animal está se movendo. Aqui mostramos que os neurônios dopaminérgicos que inervam a rede de direção da cabeça da Drosophila são especificamente ativos quando a mosca se vira para mudar a direção da cabeça. Além disso, sua atividade escala com flutuações momento a momento na velocidade de rotação. O emparelhamento da liberação de dopamina com uma sugestão visual fortalece persistentemente a influência da sugestão nas células de direção da cabeça. Por outro lado, inibir esses neurônios dopaminérgicos diminui a influência da sugestão. Esse mecanismo deve acelerar o aprendizado durante os momentos em que os movimentos de orientação fornecem um fluxo rico de informações de direção da cabeça, permitindo que as taxas de aprendizado sejam baixas em outros momentos para proteger as informações armazenadas. Nossos resultados mostram como o aprendizado espacial no cérebro pode ser compactado em épocas discretas nas quais altas taxas de aprendizado são combinadas com altas taxas de ingestão de informações.
Em redes neurais artificiais, o aprendizado é geralmente restrito a épocas específicas quando a rede é apresentada com uma rica fonte de dados de treinamento; em seguida, as conexões são congeladas fora dessas épocas, para evitar a perda das informações armazenadas4. Por outro lado, em redes neurais biológicas, o aprendizado é frequentemente assumido como contínuo e não restrito a épocas específicas5. No entanto, durante o aprendizado de recompensa biológica, os neurônios dopaminérgicos são ativados seletivamente por erros de predição de recompensa, e a liberação de dopamina promove o aprendizado de recompensa em resposta a esses erros6. Assim, a dopamina comprime o aprendizado de recompensa em épocas específicas quando as informações específicas da tarefa são ricas. No entanto, não está claro se um sinal semelhante de quando aprender também governa outras formas de aprendizado, como o aprendizado espacial não supervisionado.
Durante o aprendizado espacial, as informações relevantes para a tarefa vêm do movimento pelo espaço, o que pode fornecer um sinal útil de quando aprender. De fato, alguns neurônios dopaminérgicos estão bloqueados no tempo para o movimento7,8,9,10,11,12,13,14 e até mesmo para variáveis cinemáticas específicas, como aceleração para frente do corpo ou velocidade de rotação da cabeça15,16,17 ,18. A atividade de bloqueio de movimento também foi observada em certos neurônios dopaminérgicos no cérebro de Drosophila melanogaster19,20,21,22,23. Estes incluem os neurônios ExR222, que fornecem entrada dopaminérgica24,25,26 para as células de direção da cabeça27, também conhecidas como neurônios EPG (Fig. 1a e Extended Data Fig. 1). Neurônios EPG podem aprender rapidamente novas configurações de pistas visuais quando a mosca entra em um novo ambiente, provavelmente através da plasticidade Hebbiana nas sinapses de neurônios visuais ER para neurônios EPG28,29; no entanto, esse tipo de aprendizado espacial deve ser permitido apenas quando a mosca está mudando ativamente a direção da cabeça, para evitar a criação de vieses no mapa de direção da cabeça quando o olhar da mosca está parado - em essência, para evitar o "aprendizado excessivo" de qualquer instantâneo específico da cena visual29. Nós nos perguntamos se os neurônios ExR2 são seletivamente ativos quando a mosca está mudando a direção da cabeça e, em caso afirmativo, se esses neurônios dopaminérgicos promovem associações entre pistas visuais e direções da cabeça.
a, Esquema do mapa de direção da cabeça. b, Imaging jGCaMP7f em neurônios ExR2 enquanto mede a velocidade rotacional e de caminhada para a frente. c, Média ExR2 ΔF/F versus velocidade de rotação (uma linha por mosca, n = 13 moscas). O sombreado cinza indica transições entre repouso e movimento; fora desta faixa, ΔF/F e velocidade de rotação são linearmente relacionados. d, ExR2 médio ΔF/F agrupado por velocidade rotacional e de avanço, agregado em 13 moscas e média ao longo dos pontos de tempo. As caixas cinzas estão vazias. e, Variância explicada (R2 ajustado) para modelos de regressão linear que usam a velocidade para prever a atividade ExR2. Cada par de pontos é uma mosca (n = 13). Os modelos foram ajustados separadamente para cada mosca. A velocidade de rotação sozinha produziu um alto R2; adicionar velocidade de avanço produziu um pequeno aumento adicional (***P = 5,3 × 10−5, teste t pareado bilateral). f, respostas ExR2 ao fluxo óptico. Uma grade vertical estacionária começa a girar e o início do fluxo óptico leva a um aumento sustentado na atividade ExR2 (média ± sem entre moscas; ΔF/F é significativamente diferente de zero com P = 0,0012, teste t bilateral de uma amostra , n = 13 moscas). Aqui analisamos apenas tentativas quando a mosca estava parada. g, Dados de exemplo usados como entrada do modelo. As moscas caminharam em um ambiente virtual com uma indicação visual de direção da cabeça. h, Conectividade esquemática de ER para EPG. Os neurônios adjacentes do RE no esquema têm campos receptivos adjacentes no espaço azimutal. Os pesos de conexão são indicados por tamanhos de círculo. Os pesos são inicializados aleatoriamente, e então evoluem através da plasticidade Hebbiana. i, Pesos de um modelo típico executado. j, Correlação circular média entre a média do vetor populacional dos pesos de saída de ER e pesos de entrada de EPG; média (n = 117 simulações treinadas em dados embaralhados) ± intervalo de confiança de 95%. No final da simulação, a correlação é maior com a taxa de aprendizagem adaptativa (P = 6,2 × 10−21, teste de postos de sinais de Wilcoxon bilateral).