Text mining e NLP
Se compreendermos o texto como uma coleção de documentos não estruturados, e sendo usada para analisar textos e transformá-los em uma forma mais estruturada a fim de obter insights a partir dela, notaremos que Text Mining é uma área da Inteligência Artificial que conglomera Ciências da Linguagem e Ciências da Computação com técnicas estatísticas e Machine Learning, a qual, sendo outra área da Inteligência Artificial e intimamente relacionada com a Matemática Aplicada e a Estatística, pode ser percebida como processo pelo qual um computador pode trabalhar com mais precisão à medida que recolhe e aprende com os dados que lhe são inseridos.
Por Processamento de Linguagem Natural pode entender-se a parte das Ciências da Computação e da Inteligência Artificial que lida com a linguagem humana.
Estas áreas do conhecimento, Text Mining e Processamento de Linguagem Natural, têm sido muito usadas para várias aplicações como identificação de entidades, deteção de plágio, topic identification, text clustering, tradução, automatic text summarization, deteção de fraude, spam filtering e sentiment analysis.
Aplicamos procedimentos de Text Mining e Processamento de Linguagem Natural, a qual, sendo uma vertente da inteligência artificial que ajuda os computadores a entender, interpretar e manipular a linguagem humana, resulta de diversas disciplinas, incluindo as ciências da computação e a linguística computacional, que buscam preencher a lacuna entre a comunicação humana e o entendimento dos computadores.
Em casos de volumes de dados textuais, o Processamento de Linguagem Natural coadjuva os computadores a comunicar com os seres humanos na sua própria linguagem e escala outras tarefas relacionadas com a linguagem. Assim, possibilita que os computadores leiam textos, ouçam, interpretem fala e indiquem sentimento.