A dopamina promove a plasticidade da direção da cabeça durante os movimentos de orientação

Nature volume 612, páginas 316–322 (2022) Citar este artigo

12k acessos

5 Citações

35 Altmétrico

Detalhes das métricas

Uma correção do autor para este artigo foi publicada em 24 de maio de 2023

Este artigo foi atualizado

Em redes neurais que armazenam informações em seus pesos de conexão, existe um tradeoff entre sensibilidade e estabilidade1,2. As conexões devem ser plásticas para incorporar novas informações, mas se forem muito plásticas, as informações armazenadas podem ser corrompidas. Uma solução potencial é permitir a plasticidade apenas durante as épocas em que as informações específicas da tarefa são ricas, com base em um sinal de 'quando aprender'3. Nós raciocinamos que a dopamina fornece um sinal de quando aprender que permite que os mapas espaciais do cérebro sejam atualizados quando novas informações espaciais estão disponíveis - isto é, quando um animal está se movendo. Aqui mostramos que os neurônios dopaminérgicos que inervam a rede de direção da cabeça da Drosophila são especificamente ativos quando a mosca se vira para mudar a direção da cabeça. Além disso, sua atividade escala com flutuações momento a momento na velocidade de rotação. O emparelhamento da liberação de dopamina com uma sugestão visual fortalece persistentemente a influência da sugestão nas células de direção da cabeça. Por outro lado, inibir esses neurônios dopaminérgicos diminui a influência da sugestão. Esse mecanismo deve acelerar o aprendizado durante os momentos em que os movimentos de orientação fornecem um fluxo rico de informações de direção da cabeça, permitindo que as taxas de aprendizado sejam baixas em outros momentos para proteger as informações armazenadas. Nossos resultados mostram como o aprendizado espacial no cérebro pode ser compactado em épocas discretas nas quais altas taxas de aprendizado são combinadas com altas taxas de ingestão de informações.

Em redes neurais artificiais, o aprendizado é geralmente restrito a épocas específicas quando a rede é apresentada com uma rica fonte de dados de treinamento; em seguida, as conexões são congeladas fora dessas épocas, para evitar a perda das informações armazenadas4. Por outro lado, em redes neurais biológicas, o aprendizado é frequentemente assumido como contínuo e não restrito a épocas específicas5. No entanto, durante o aprendizado de recompensa biológica, os neurônios dopaminérgicos são ativados seletivamente por erros de predição de recompensa, e a liberação de dopamina promove o aprendizado de recompensa em resposta a esses erros6. Assim, a dopamina comprime o aprendizado de recompensa em épocas específicas quando as informações específicas da tarefa são ricas. No entanto, não está claro se um sinal semelhante de quando aprender também governa outras formas de aprendizado, como o aprendizado espacial não supervisionado.

Durante o aprendizado espacial, as informações relevantes para a tarefa vêm do movimento pelo espaço, o que pode fornecer um sinal útil de quando aprender. De fato, alguns neurônios dopaminérgicos estão bloqueados no tempo para o movimento7,8,9,10,11,12,13,14 e até mesmo para variáveis cinemáticas específicas, como aceleração para frente do corpo ou velocidade de rotação da cabeça15,16,17 ,18. A atividade de bloqueio de movimento também foi observada em certos neurônios dopaminérgicos no cérebro de Drosophila melanogaster19,20,21,22,23. Estes incluem os neurônios ExR222, que fornecem entrada dopaminérgica24,25,26 para as células de direção da cabeça27, também conhecidas como neurônios EPG (Fig. 1a e Extended Data Fig. 1). Neurônios EPG podem aprender rapidamente novas configurações de pistas visuais quando a mosca entra em um novo ambiente, provavelmente através da plasticidade Hebbiana nas sinapses de neurônios visuais ER para neurônios EPG28,29; no entanto, esse tipo de aprendizado espacial deve ser permitido apenas quando a mosca está mudando ativamente a direção da cabeça, para evitar a criação de vieses no mapa de direção da cabeça quando o olhar da mosca está parado - em essência, para evitar o "aprendizado excessivo" de qualquer instantâneo específico da cena visual29. Nós nos perguntamos se os neurônios ExR2 são seletivamente ativos quando a mosca está mudando a direção da cabeça e, em caso afirmativo, se esses neurônios dopaminérgicos promovem associações entre pistas visuais e direções da cabeça.

a, Esquema do mapa de direção da cabeça. b, Imaging jGCaMP7f em neurônios ExR2 enquanto mede a velocidade rotacional e de caminhada para a frente. c, Média ExR2 ΔF/F versus velocidade de rotação (uma linha por mosca, n = 13 moscas). O sombreado cinza indica transições entre repouso e movimento; fora desta faixa, ΔF/F e velocidade de rotação são linearmente relacionados. d, ExR2 médio ΔF/F agrupado por velocidade rotacional e de avanço, agregado em 13 moscas e média ao longo dos pontos de tempo. As caixas cinzas estão vazias. e, Variância explicada (R2 ajustado) para modelos de regressão linear que usam a velocidade para prever a atividade ExR2. Cada par de pontos é uma mosca (n = 13). Os modelos foram ajustados separadamente para cada mosca. A velocidade de rotação sozinha produziu um alto R2; adicionar velocidade de avanço produziu um pequeno aumento adicional (***P = 5,3 × 10−5, teste t pareado bilateral). f, respostas ExR2 ao fluxo óptico. Uma grade vertical estacionária começa a girar e o início do fluxo óptico leva a um aumento sustentado na atividade ExR2 (média ± sem entre moscas; ΔF/F é significativamente diferente de zero com P = 0,0012, teste t bilateral de uma amostra , n = 13 moscas). Aqui analisamos apenas tentativas quando a mosca estava parada. g, Dados de exemplo usados como entrada do modelo. As moscas caminharam em um ambiente virtual com uma indicação visual de direção da cabeça. h, Conectividade esquemática de ER para EPG. Os neurônios adjacentes do RE no esquema têm campos receptivos adjacentes no espaço azimutal. Os pesos de conexão são indicados por tamanhos de círculo. Os pesos são inicializados aleatoriamente, e então evoluem através da plasticidade Hebbiana. i, Pesos de um modelo típico executado. j, Correlação circular média entre a média do vetor populacional dos pesos de saída de ER e pesos de entrada de EPG; média (n = 117 simulações treinadas em dados embaralhados) ± intervalo de confiança de 95%. No final da simulação, a correlação é maior com a taxa de aprendizagem adaptativa (P = 6,2 × 10−21, teste de postos de sinais de Wilcoxon bilateral).

10 min; Fig. 3c,d). This result indicates that a burst of dopamine neuron activity can persistently strengthen the influence of a visual cue on head direction neurons. We also observed that ExR2 activation increased the bump amplitude, although this effect was more transient (Fig. 3e,f), mirroring the relatively transient increase we observed in single-cell visual response amplitude (Fig. 2e,f). None of these effects occurred in control experiments in which ATP was washed into the bath but ExR2 neurons did not express P2X2 receptors (Fig. 3c–f)./p>

1 M NaCl) in the exact same manner that ATP or dopamine solutions were normally delivered. The first deviation in current signal measured by the electrode was used to estimate the entry of the new solution. For data display, measurements are plotted relative to the earliest time when the drug (ATP or dopamine) entered the recording chamber (t = 0)./p> 0.05; *P < 0.05; **P < 0.01; ***P < 0.0005./p>15° s−1 or forward speed >2 mm s−1) were included in the analysis. The plots in Extended Data Fig. 3b were generated using data from two different 5-min epochs during a single recording, with a 5-min gap between them. The correlation between rotational speed and ExR2 activity was calculated as described above, and the resulting coefficients were smoothed with a 2D Gaussian kernel (σ = 1.5) and manually thresholded to show only the pixels with the strongest positive and negative correlations. Background (greyscale) images in Extended Data Fig. 3b show trial-averaged fluorescence from these same five imaging planes./p>10 mV) and a stereotyped time course. They are followed by a prolonged period of depolarization when the variance of the voltage trace is also diminished. These inhibitory events interfered with visual tuning measurements, and so for Fig. 2 and Extended Data Figs. 6–8, if an event occurred it was clipped out. Such clipping was required for 12% of trials. For one cell (fly 543, cell 1), the first 12 s of the first baseline trial had too much holding current applied. Those 12 s were also excluded from the analysis./p>

0 in blue and R < 0 in red, with stronger absolute correlations having more saturated color values. Correlation values are only shown for the pixels with the strongest correlations (top 15% of absolute correlation values). Note that many pixels have consistent tuning across the two trials. Pixels with positive and negative correlations are likely to arise from the right and left copies of ExR2, respectively. This analysis demonstrates that the direction-selectivity we see in the LAL arbors is preserved in the EB and BU arbors of these cells. If dopamine release from each ExR2 neuron is proportional to the fly's ipsilateral rotational velocity, then total (summed) dopamine release in the EB should be proportional to the fly's rotational speed./p>30°/sec), with one data point per fly. In the epochs with the visual cue, slopes were significantly smaller and intercepts were larger, compared to epochs of darkness in the same experiments (slope: p = 6.3 × 10−5, intercept: p = 0.0004, two-sided paired t-tests with Bonferroni correction, n = 29 flies). This indicates that the visual cue boosts ExR2 activity for low rotational speeds; however, the magnitude of this effect is very small. These results are consistent with the fact that ExR2 neurons respond to optic flow (Fig. 1f), and the movements of the cue produce a small amount of optic flow. b) We also tested the effect of jumping the visual cue by 90° during these closed-loop epochs; we found that this produced a very small and transient ExR2 response, which is likely due to the small transient increase in optic flow that the cue jump produces (compare with Fig. 1f). Shown here is the average response from a typical example fly (mean of 11 trials ± SEM). To assess the effect of the cue jump, we analyzed only those trials where the fly happened to be standing immobile for several seconds before and after the jump, in order to avoid confounds associated with jump-induced behaviors. c) Here we compare epochs of walking in darkness with epochs of open-loop cue rotation at constant velocity (with the same cue velocity used in Figs. 2, 3, and 4, i.e. ~18°/s). Left: mean ExR2 ΔF/F versus the fly's rotational speed for 8 example flies. Data are binned by rotational speed and averaged across time points. Right: slope and y-intercept of lines fit to the data for each fly in the linear portion of the curves (rotational speeds >30°/s). Visual cue rotation at constant velocity had no significant effect on the relationship between ExR2 activity and the fly's rotational speed (slope: p = 0.87, y-intercept: p = 0.15, two-sided paired t-tests with Bonferroni correction, n = 11 flies). However, this data set shows a small trend in the same direction as what we observed in the closed-loop case; because there are fewer replicates here, there is less statistical power. The main result of this experiment is simply that we find no evidence that open-loop cue movement produces any larger response than closed-loop cue movement does. The flies in this panel are the same as those shown in Fig. 1c–f./p> 0.05 criterion for significance). Changes in preferred cue position tuning were assessed using parametric Watson-Williams multi-sample tests with Bonferroni correction./p>