What makes Big Data, Big Data? Exploring the ontological characteristics of 26 datasets

De Governança Algoritmos
Ir para: navegação, pesquisa

O Big Data foi definido de várias formas na literatura. No geral, as definições sugerem que o Big Data possui um conjunto de características-chave: volume, velocidade e variedade (os 3Vs), mas também exaustividade, resolução, indexicalidade, relacionalidade, extensionalidade e escalabilidade. No entanto, essas definições carecem de clareza ontológica, com o termo agindo como um rótulo amorfo e abrangente para uma ampla seleção de dados. Neste artigo, consideramos a questão "O que faz Big Data, Big Data?", Aplicando a taxonomia de Kitchin de sete características de Big Data a 26 conjuntos de dados de sete domínios, cada um considerado na literatura como Big Data. Os resultados demonstram que apenas um punhado de conjuntos de dados possui todas as sete características, e algumas não possuem volume e / ou variedade. Em vez disso, existem várias formas de Big Data.Nossa análise revela que os principais marcadores de limites de definição são os traços de velocidade e exaustividade. Defendemos que o Big Data, como categoria analítica, precisa ser descompactado, com o gênero Big Data ainda mais delineado e suas várias espécies identificadas. É somente através desse trabalho ontológico que obteremos clareza conceitual sobre o que constitui o Big Data, formularemos a melhor maneira de entendê-lo e identificaremos como ele pode ser mais bem usado para dar sentido ao mundo.