banner
Lar / blog / Codificação neural com rede neural convolucional de pico não supervisionado
blog

Codificação neural com rede neural convolucional de pico não supervisionado

Dec 10, 2023Dec 10, 2023

Biologia das Comunicações, volume 6, número do artigo: 880 (2023) Citar este artigo

2 Altmétrico

Detalhes das métricas

Prever com precisão as respostas cerebrais a vários estímulos representa um desafio significativo na neurociência. Apesar dos recentes avanços na codificação neural usando redes neurais convolucionais (CNNs) em estudos de fMRI, ainda existem lacunas críticas entre as regras computacionais dos neurônios artificiais tradicionais e dos neurônios biológicos reais. Para resolver esse problema, uma estrutura baseada em CNN (SCNN) é apresentada neste estudo para obter a codificação neural de uma maneira mais biologicamente plausível. A estrutura utiliza SCNN não supervisionado para extrair características visuais de estímulos de imagem e emprega um algoritmo de regressão baseado em campo receptivo para prever respostas de fMRI a partir dos recursos SCNN. Resultados experimentais em caracteres manuscritos, dígitos manuscritos e imagens naturais demonstram que a abordagem proposta pode alcançar um desempenho de codificação notavelmente bom e pode ser utilizada para tarefas de “leitura cerebral”, como reconstrução e identificação de imagens. Este trabalho sugere que o SNN pode servir como uma ferramenta promissora para codificação neural.

O objetivo da codificação neural é prever a resposta do cérebro a estímulos externos, fornecendo um meio eficaz para explorar o mecanismo do cérebro para processar informações sensoriais e servindo como base para sistemas de interface cérebro-computador (BCI). A percepção visual, sendo uma das principais formas pelas quais recebemos informações externas, tem sido um foco importante da pesquisa sobre codificação neural. Com o avanço das técnicas de imagem cerebral não invasivas, como a ressonância magnética funcional (fMRI), os cientistas fizeram progressos notáveis ​​na codificação neural baseada na visão1,2,3,4 nas últimas duas décadas, tornando-a um tema quente em neurociência.

O processo de codificação baseada em visão normalmente envolve duas etapas principais: extração de características e previsão de resposta5. A extração de características visa produzir características visuais dos estímulos, estimulando o córtex visual. Um extrator de recursos preciso que se aproxime de mecanismos visuais reais é crucial para uma codificação bem-sucedida. A previsão de resposta visa prever respostas de fMRI baseadas em voxel com base nas características visuais extraídas. A regressão linear6 é comumente usada para esta etapa, pois a relação entre as características e as respostas deve ser a mais simples possível. Estudos anteriores mostraram que o córtex visual inicial processa informações de maneira semelhante às wavelets de Gabor7,8,9. Com base nesta descoberta, modelos de codificação baseados em filtros Gabor foram propostos e aplicados com sucesso em tarefas como identificação de imagens e reconstrução de filmes . Nos últimos anos, as redes neurais convolucionais (CNNs) têm atraído atenção significativa devido às suas impressionantes realizações no campo da visão computacional. Vários estudos10,11 utilizaram análise de similaridade representacional12 para comparar os padrões de dissimilaridade das representações CNN e fMRI, revelando que o córtex visual humano compartilha representações hierárquicas semelhantes às CNNs. Como resultado, os modelos de codificação baseados em CNN tornaram-se amplamente utilizados e demonstraram excelente desempenho2,4,13,14. No entanto, é importante notar que apesar do sucesso das CNNs nas aplicações de codificação, as diferenças entre as CNNs e o cérebro no processamento da informação visual não podem ser ignoradas15.

Em termos de mecanismos computacionais, existe uma distinção fundamental entre os neurônios artificiais nas CNNs e os neurônios biológicos, sendo que os primeiros propagam valores digitais contínuos, enquanto os últimos propagam potenciais de ação (picos). A introdução de redes neurais spiking (SNNs), consideradas a terceira geração de redes neurais16, reduziu significativamente essa diferença. Ao contrário das redes neurais artificiais (RNAs) tradicionais, as SNNs transmitem informações por meio de tempo de pico. Nos SNNs, cada neurônio integra picos da camada anterior e emite picos para a próxima camada quando sua tensão interna ultrapassa o limite. O algoritmo de plasticidade dependente do tempo de pico (STDP), que é um método não supervisionado para atualização de peso e foi descoberto no córtex visual de mamíferos, é o algoritmo de aprendizagem mais comumente usado para SNNs. Estudos recentes aplicaram SNNs baseados em STDP ao reconhecimento de objetos e alcançaram um desempenho considerável . A plausibilidade biológica dos SNNs proporciona-lhes uma vantagem na codificação neural.

 0.12, two-tailed two-sample t-test) for V2 and V3. For the colorful natural image dataset, we compared the encoding performance of SCNN with CNN and GWP and selected 500 voxels with the highest encoding performance for each subject for comparison. As depicted in Fig. 2f, the accuracies of SCNN were significantly higher than those of CNN (p < \({10}^{-36}\), one-tailed two-sample t-test) for all subjects. Moreover, SCNN demonstrated comparable results to GNet for subject1 (SCNN higher than GNet, \({{{{{\rm{p}}}}}}=1.58\times {10}^{-19}\), one-tailed two sample t-test) and subject4 (no significant difference, p = 0.725, two-tailed two-sample t-test)./p>