banner
Lar / blog / Aprendizado de máquina
blog

Aprendizado de máquina

Jun 02, 2024Jun 02, 2024

Dados científicos volume 10, número do artigo: 558 (2023) Citar este artigo

301 Acessos

1 Altmétrico

Detalhes das métricas

Em nosso estudo, pretendemos coletar um conjunto de dados anotados multimodais para sensoriamento remoto da arqueologia maia, que seja adequado para aprendizagem profunda. O conjunto de dados cobre a área ao redor de Chactún, um dos maiores centros urbanos maias antigos na península central de Yucatán. O conjunto de dados inclui cinco tipos de registros de dados: visualizações raster e modelo de altura do dossel a partir de dados de varredura a laser aerotransportada (ALS), dados de satélite Sentinel-1 e Sentinel-2 e anotações manuais de dados. As anotações manuais (usadas como máscaras binárias) representam três tipos diferentes de estruturas maias antigas (rótulos de classe: edifícios, plataformas e aguadas – reservatórios artificiais) dentro da área de estudo, suas localizações exatas e limites. O conjunto de dados está pronto para uso com aprendizado de máquina, incluindo redes neurais convolucionais (CNNs) para reconhecimento de objetos, localização (detecção) de objetos e segmentação semântica. Gostaríamos de fornecer este conjunto de dados para ajudar mais equipes de pesquisa a desenvolver seus próprios modelos de visão computacional para investigações da arqueologia maia ou melhorar os existentes.

Os levantamentos aéreos de varredura a laser (ALS) provaram ser cruciais para o avanço do conhecimento na distribuição de “sítios” arqueológicos, particularmente nas regiões florestais dos antigos maias1,2,3, pois aceleraram e expandiram enormemente os levantamentos de paisagens arqueológicas tradicionais. O uso de pesquisa de ALS em arqueologia paisagística normalmente envolve a identificação, localização, registro e investigação de características naturais e culturais para uma variedade de contextos, geralmente inter-relacionados, incluindo, mas não se limitando ao mapeamento e análise de assentamento, urbanismo, produção agrícola e gestão da água4,5,6,7,8,9,10,11.

Os arqueólogos normalmente inspecionam os dados do ALS na forma de visualizações raster, que melhoram a percepção das características da superfície12,13,14. A análise visual humana e a digitalização são demoradas e o exame de centenas de quilômetros quadrados pode levar meses, dependendo do nível de detalhe, do número de estruturas e do método de registro. Apesar da falta de conjuntos de dados de ALS em grande escala, de alta resolução e publicamente disponíveis da antiga região maia, o financiamento público e privado disperso tornou possível realizar não apenas estudos paisagísticos específicos do local ao longo de alguns quilómetros quadrados, por exemplo,7,15,16 ,17,18, mas também estudos em grande escala ao longo de várias centenas ou mesmo vários milhares de quilómetros quadrados, por exemplo3,5,11,19,20,21,22,23. O volume de dados torna difícil anotar conjuntos de dados inteiros, especialmente se não apenas a localização dos objetos, mas também sua forma for indicada. A subjetividade da inspeção visual humana e da digitalização e a variabilidade entre intérpretes humanos também são um problema24. Há, portanto, uma necessidade premente de empregar métodos de visão computacional que possam encontrar objetos arqueológicos e delinear seus limites automaticamente25,26. Entre as diversas abordagens de aprendizado de máquina, as redes neurais convolucionais profundas (CNNs) são o estado da arte atual para visão computacional, mas geralmente requerem um grande número de amostras já rotuladas27 para treinamento. Isso torna os conjuntos de dados rotulados cruciais para o desenvolvimento e teste dos métodos.

Num dos nossos estudos anteriores, já demonstrámos que as CNNs podem classificar antigos objetos arqueológicos maias a partir de visualizações DEM, alcançando até 95% de precisão28. No entanto, os modelos de classificação não têm potencial para substituir a inspeção e rotulagem manuais, para as quais é necessária a segmentação semântica. A segmentação semântica é prontamente aplicada em sensoriamento remoto, uma revisão é feita por27, mas ainda mais em imagens médicas, onde as CNNs geralmente superam os especialistas29,30,31,32,33,34.

A intenção original de coletar os dados do ALS na área ao redor de Chactún, um dos maiores centros urbanos maias antigos conhecidos até agora nas terras baixas centrais da Península de Yucatán, era compreender melhor a gestão da água, a agricultura, a dinâmica de assentamento e a situação sócio-política. organização dos antigos maias que viviam nesta área11,35.

_.tif, where the data source can specify a mask, ALS visualisations (lidar), CHM, or Sentinel data (S1 or S2). The sequential number is a unique identifier of a data record; all files with the same sequential number represent the same geographical area, but differ in the number of pixels (480 × 480 pixels, 240 × 240 pixels or 24 × 24 pixels) and bit depth (8-bit integer or 32-bit float) (Table 7)./p>