
Um termo comum na área de ciência de dados são as classificações dos diversos tipos de dados utilizados em análises de dados. Mas como diria o Jack, vamos por partes. O que é dado? Dados são fatos que podem ser de alguma forma registrados. Traduzindo, se você está assistindo uma reunião do trabalho, tudo que você consegue registrar em algum lugar podem ser definido como dado.

Os dados possuem tipos de registros. Podemos guardar diversos tipos de dados, os principais são: números e letras ou símbolos. Mas você deve estar se perguntando que esses tipos são bem genéricos será que temos subtipos? Sim temos. Dentro de um grande grupo como por exemplo os dos números podemos armazenar números: inteiros, reais, binários, complexos e etc. A identificação e o como cada tipo desse se comporta no armazenamento de dados ou nos sistemas permitem ao profissional escolher o melhor forma de lidar com esse tipo de dados. Existe um livro que aborda de forma bem didática os principais tipos de dados trabalhados na computação, a obra “Lógica de Programação” dos autores Andre Luiz Villar Forbellone e Henri Eberspacher. Ele é um clássico para os iniciantes de programação e pode ser encontrado na Estante Virtual (https://www.estantevirtual.com.br/livros/andre-luiz-villar-forbellone/logica-de-programacao/3812729593).
Independente dos tipos dos dados eles vão precisar ser armazenados de alguma forma para uma posterior recuperação de dados ou realização de análises para entender e extrair informações mais complexas que relacionam os dados guardados. Neste caso, podemos classificar os dados em três formatos: estruturados, semi-estruturados e não estruturados. A estruturação é a forma que os dados são organizados para o armazenamento. Com os três formatos podemos deduzir que alguns dados conseguem ser armazenados de forma estruturada, outros não tão estruturados assim e outros não possuem estrutura ao ser armazenado.
REFERÊNCIAS
1. Eberspacher HF, Forbellone AL V. Lógica de Programação: A construção de algoritmos e estruturas de dados. Ed Pearson Prentice Hall [Disponível na rede Bibl da Unoeste e na BV Pearson] Celes, Waldemar. 2000;
2. Elmasri R, Navathe SB. Fundamentals of database systems. 6th ed. Seraphim E, de Faria Piola Seraphim T, editors. Georgia Institute of Technology: Pearson Education; 2011.
3. Amaral F. Introdução à Ciencia de Dados: mineração de dados e big data [Internet]. ALTA BOOKS; 2016. Available from: https://books.google.com.br/books?id=hAlVDQAAQBAJ
Publicado por