TRADUÇÃO AUTOMÁTICA DE LINGUAGEM INFORMAL: UMA ANÁLISE DO IMPACTO DA SELEÇÃO E TRATAMENTO DE DADOS NA EFICÁCIA DE MODELOS DE APRENDIZADO DE MÁQUINA
Resumo
Com o crescente uso da internet para além dos fins comerciais, o ambiente virtual vem refletindo cada vez mais a comunicação informal e espontânea da vida real. O contexto global, no entanto, apresenta maiores desafios à medida que estamos mais expostos a conteúdos das mais diversas línguas, populares ou não, exigindo o uso de ferramentas de Tradução Automática cada vez mais precisas. Apesar de tantos avanços na área, o treinamento de modelos de Tradução Automática ainda enfrenta dificuldades para lidar com padrões da linguagem informal, como sarcasmo e expressões não literais. O presente trabalho busca analisar a eficácia de modelos de Aprendizado de Máquina de Tradução Automática para tradução de expressões não literais, porém com a estratégia de fornecer dados de treinamento gerados em contextos informais. No entanto, o modelo desenvolvido apresentou limitações, gerando algumas traduções literais indevidas e não distinguindo adequadamente diferentes traduções de palavras. O uso de modelos híbridos que combinam análises sintáticas e semânticas é sugerido para melhorar a compreensão e geração textual.