Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial

Exportar este item:

Use este identificador para citar ou linkar para este item: http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514

Tipo do documento:	Tese
Título:	Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial
Título(s) alternativo(s):	Deep Learning in Semantic Segmentation of Rivers in High Spatial Resolution Images
Autor:	PINHEIRO, MAYARA MAEZANO FAITA
Primeiro orientador:	Ramos, Ana Paula Marques
Primeiro coorientador:	Alves, Marcelo Rodrigo
Primeiro membro da banca:	Osco, Lucas Prado
Segundo membro da banca:	Marcato Júnior, José
Terceiro membro da banca:	Mendes, Tatiana Sussel Gonçalves
Resumo:	O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.
Abstract:	Mapping rivers is essential for diagnosis and environmental planning, and remote sensing has helped in research related to this water resource. A method that has gained attention and helped in the task of mapping rivers is the deep learning method. The most used deep learning methods in the mapping task (semantic segmentation) are based on convolutional network architectures (CNN - Convolutional Neural Networks) and, more recently, Vision Transformers. They are robust methods that have shown good performance for this type of task, however, there are still challenges to be overcome when mapping features of narrow rivers. In this sense, considering the diversity of river features and the absence of an approach that goes deeper into their characteristics such as their width, the objective of this study is to map rivers with different sizes in RGB aerial images of high spatial resolution using deep segmentation networks semantics. For this, the present work sought to evaluate the performance of deep semantic segmentation networks when identifying large rivers (width greater than 10 m) in RGB images of high spatial resolution; characterize the capabilities and limits of deep semantic segmentation networks to identify narrow rivers (width less than 10 m) in high spatial resolution RGB images; and to evaluate the performance of deep semantic segmentation networks experimented in Vision Transformer to segment rivers, comparing them with traditional neural networks experimented in convolutions. The aerial images have 1 m of resolution and were trained and tested in a computational environment, using semantic segmentation methods based on convolution and Vision Transformer. Then, the results were compared qualitatively, visually, and quantitatively, using evaluation metrics (Accuracy, F1-Score, Precision, Recall, IoU). The results appreciated that the performance of deep semantic segmentation networks varies according to the width of the rivers. The best approach to segmenting large rivers (greater than 10 m) and narrow rivers (less than 10 m) is to use both river widths to train the deep semantic segmentation networks. Another finding is that the deep networks in Vision Transformers outperformed the deep networks in convolutions for the semantic segmentation task of large and narrow rivers in RGB images of 1 m resolution. SegFormer outperformed as evaluation indicators for river segmentation with an F1-Score above 98%. Future work should continue to investigate the aspiring deep networks in Vision Transformers, being able to explore multitemporal and multimodal images, in order to improve the monitoring of water resources.
Palavras-chave:	Mapeamento de corpos d’água Sensoriamento Remoto Redes de aprendizagem profunda Mapping of water bodies Remote sensing Deep learning networks
Área(s) do CNPq:	OUTROS::CIENCIAS
Idioma:	por
País:	Brasil
Instituição:	Universidade do Oeste Paulista
Sigla da instituição:	UNOESTE
Departamento:	Doutorado em Meio Ambiente e Desenvolvimento Regional
Programa:	Doutorado em Meio Ambiente e Desenvolvimento Regional
Citação:	PINHEIRO, M. M. F. Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial. 2023. 102 f. Tese (Doutorado em Meio Ambiente e Desenvolvimento Regional)- Universidade do Oeste Paulista, Presidente Prudente, 2023.
Tipo de acesso:	Acesso Aberto
Endereço da licença:	http://creativecommons.org/licenses/by-nc-nd/4.0/
URI:	http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514
Data de defesa:	24-Fev-2023
Aparece nas coleções:	Doutorado em Meio Ambiente e Desenvolvimento Regional

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Mayara Maezano Faita Pinheiro.pdf	Documento principal	5,04 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons

Unoeste

Biblioteca Digital de Teses e Dissertações