@PHDTHESIS{ 2023:1047657641, title = {Aprendizagem profunda na segmentação semântica de rios em imagens de alta resolução espacial}, year = {2023}, url = "http://bdtd.unoeste.br:8080/jspui/handle/jspui/1514", abstract = "O mapeamento de rios é fundamental para o diagnóstico e planejamentos ambiental e o sensoriamento remoto tem auxiliado em investigações relacionadas a este recurso hídrico. Um método que tem ganhado atenção e auxiliado na tarefa de mapear rios é o método de aprendizagem profunda. Os métodos de aprendizagem profunda mais utilizados na tarefa de mapeamento (segmentação semântica) são baseados em arquiteturas de rede em convolução e, mais recentemente, Vision Transformers. São métodos robustos que tem apresentado uma boa performance para esse tipo de tarefa, porém, ainda existem desafios a serem superados ao mapear feições de rios estreitos. Nesse sentido, considerando a diversidade de feições de rios e ausência de uma abordagem que se aprofunde em suas características como a largura dos mesmos, o objetivo deste estudo é mapear rios com diferentes tamanhos em imagens aéreas RGB de alta resolução espacial utilizando redes profundas de segmentação semântica. Para isso, o presente trabalho buscou avaliar o desempenho de redes profundas de segmentação semântica ao identificar rios largos (largura superior a 10 metros) em imagens RGB de alta resolução espacial; caracterizar as capacidades e limitações das redes profundas de segmentação semântica em identificar rios estreitos (largura inferior a 10 metros) em imagens RGB de alta resolução espacial; e avaliar o desempenho de redes profundas de segmentação semântica baseadas em Transformers para segmentar rios, comparando-as com as redes neurais profundas tradicionais baseadas em convoluções. As imagens aéreas possuem 1 m de resolução e foram treinadas e testadas em ambiente computacional, utilizando os métodos de segmentação semântica baseados em convolução e Vision Transformer. Em seguida, os resultados foram comparados qualitativamente, por meio visual, e quantitativamente, por meio de métricas de avaliação (Acurácia, F1-Score, Precisão, Recall, IoU). Os resultados mostraram que o desempenho das redes profundas de segmentação semântica varia conforme a largura dos rios. A melhor abordagem para segmentar rios largos (superior a 10 metros) e rios estreitos (inferior a 10 metros) é usar ambos os tipos de larguras de rios no treinamento das redes profundas de segmentação semântica. Outra descoberta é que as redes profundas baseadas em Vision Transformer superaram a performance das redes profundas baseadas em convoluções para a tarefa de segmentação semântica de rios largos e estreitos em imagens RGB de 1 m de resolução. O SegFormer superou as métricas de avaliação para segmentação de rios com um F1-Score cima de 98%. Os trabalhos futuros devem continuar investigando as redes profundas baseadas em Vision Transformer, podendo explorar imagens multi-temporais e multimodais, a fim de melhorar o monitoramento de recursos hídricos.", publisher = {Universidade do Oeste Paulista}, scholl = {Doutorado em Meio Ambiente e Desenvolvimento Regional}, note = {Doutorado em Meio Ambiente e Desenvolvimento Regional} }