UM ESTUDO DE MAPEAMENTO SISTEMÁTICO DA MINERAÇÃO DE DADOS PARA CENÁRIOS DE BIG DATA

Autores

  • Patricia Mariotto Mozzaquatro Chicon Unicruz
  • Fabricia Carneiro Roos-Frantz Unijuí- Ijuí
  • Rafael Zancan Frantz Unijuí- Ijuí
  • Sandro Sawicki Unijuí- Ijuí

DOI:

https://doi.org/10.33053/gedecon.v9i1.506

Palavras-chave:

Big Data, Mineração de Dados, Mapeamento Sistemático.

Resumo

O volume de dados produzidos tem crescido em larga escala nos últimos anos. Esses dados são de diferentes fontes e diversificados formatos, caracterizando as principais dimensões do Big Data: grande volume, alta velocidade de crescimento e grande variedade de dados. O maior desafio é como gerar informação de qualidade para inferir insights significativos de tais dados variados e grandes. A Mineração de Dados é o processo de identificar, em dados, padrões válidos, novos e potencialmente úteis. No entanto, a infraestrutura de tecnologia da informação tradicional não é capaz de atender as demandas deste novo cenário. O termo atualmente conhecido como Big Data Mining refere-se à extração de informação a partir de grandes bases de dados. Uma questão a ser respondida é como a comunidade científica está abordando o processo de Big Data Mining? Seria válido identificar quais tarefas, métodos e algoritmos vêm sendo aplicados para extrair conhecimento neste contexto. Este artigo tem como objetivo identificar na literatura os trabalhos de pesquisa já realizados no contexto do Big Data Mining. Buscou-se identificar as áreas mais abordadas, os tipos de problemas tratados, as tarefas aplicadas na extração de conhecimento, os métodos aplicados para a realização das tarefas, os algoritmos para a implementação dos métodos, os tipos de dados que vêm sendo minerados, fonte e estrutura dos mesmos. Um estudo de mapeamento sistemático foi conduzido, foram examinados 78 estudos primários. Os resultados obtidos apresentam uma compreensão panorâmica da área investigada, revelando as principais tarefas, métodos e algoritmos aplicados no Big Data Mining.

Referências

BONIDIA, R. P.; BRANCHER, J. D.; BUSTO, R. M. Data mining in sports: A systematic

review. IEEE Latin America Transactions, IEEE, v. 16, n. 1, p. 232–239, 2018.

CHEN, C. P., & ZHANG, C.-Y. Data-intensive applications, challenges, techniques and

technologies: A survey on big data. Information Sciences, 275 , 314–347, 2014.

CHEN, M.; MAO, S.; LIU, Y. Big data: A survey. Mobile Networks and Applications,

Springer US, v. 19, n. 2, p. 171–209, 2014.

DUTT, A.; ISMAIL, M. A.; HERAWAN, T. A systematic review on educational data

mining. IEEE Access, IEEE, v. 5, p. 15991–16005, 2017.

GARCÉS, R. et al. A systematic mapping on quality attributes and quality models

for ambient assisted living systems. Instituto de Ciências Matemáticas e Computacão,

Universidade de São Paulo (ICMC/USP), Brazil, 2016

HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data mining concepts and techniques third

edition. The Morgan Kaufmann Series in Data Management Systems, v. 5, n. 4, p. 83-124,

JALALI. S; WOHLIN. C. Systematic literature studies: database searches vs. backward

snowballing, in: Proceedings of the ACM-IEEE International Symposium on Empirical

Software Engineering and Measurement, ACM, 2012, pp. 29–38.

KAUR, G.; KAUR, E. H. Prediction of the cause of accident and accident prone location

on roads using data mining techniques. In: IEEE. Computing, Communication and

Networking Technologies (ICCCNT), 2017 8th International Conference on. [S.l.], 2017. p.

–7.

KEELE, S. et al. Guidelines for performing systematic literature reviews in software

engineering. [S.l.], 2007.

KHAN, N., YAQOOB, I., HASHEM, I. A. T., INAYAT, Z., MAHMOUD Ali, W. K.,

ALAM, M., SHIRAZ, M., & GANI, A. Big data: survey, technologies, opportunities, and

challenges. The Scientific World Journal , 2014 .

KHANNA, L.; SINGH, S. N.; ALAM, M. Educational data mining and its role in

determining factors affecting students academic performance: A systematic review. In:

IEEE. 2016 1st India International Conference on Information Processing (IICIP). [S.l.],

p. 1–7.

KITCHENHAM, B.; CHARTERS, S. Guidelines for Performing Systematic Literature

Reviews in Software Engineering, Tech. rep., Technical report, EBSE Technical Report

EBSE-2007-01, 2007

NAJAFABADI, M. M., VILLANUSTRE, F., KHOSHGOFTAAr, T. M., SELIYA, N., WALD,

R., & MUHAREMAGIC, E. Deep learning applications and challenges in big data

analytics. Journal of Big Data, 2, 1, 2015.

OUSSOUS, A. et al. Big data technologies: A survey. Journal of King Saud

UniversityComputer and Information Sciences, Elsevier, v. 30, n. 4, p. 431–448, 2018.

PETERSEN, Kai; VAKKALANKA, Sairam; KUZNIARZ, Ludwik. Guidelines for

conducting systematic mapping studies in software engineering: An update. Information

and Software Technology, v. 64, p. 1-18, 2015.

QIU, J. et al. A survey of machine learning for big data processing. EURASIP Journal on

Advances in Signal Processing, Springer, v. 2016, n. 1, p. 67, 2016.

SANGEETHA, J.; PRAKASH, V. Sinthu Janita. A survey on big data mining techniques.

International Journal of Computer Science and Information Security, v. 15, n. 1, p. 482, 2017.

WOHLIN. C. Guidelines for snowballing in systematic literature studies and a replication

in software engineering, in: 18th International Conference on Evaluation and Assessment in

Software Engineering, EASE ’14, 2014, p. 38.

YAN, Y. et al. A classifier ensemble framework for multimedia big data classification. In:

IEEE. 2016 IEEE 17th International Conference on Information Reuse and Integration (IRI).

[S.l.], 2016. p. 615–622.

Downloads

Publicado

2021-08-12

Como Citar

Mariotto Mozzaquatro Chicon, P., Carneiro Roos-Frantz, F. ., Zancan Frantz, R. ., & Sawicki, S. . (2021). UM ESTUDO DE MAPEAMENTO SISTEMÁTICO DA MINERAÇÃO DE DADOS PARA CENÁRIOS DE BIG DATA. Revista GEDECON - Gestão E Desenvolvimento Em Contexto, 9(1), 1 - 23. https://doi.org/10.33053/gedecon.v9i1.506

Edição

Seção

Artigos GEDECON