Informação
Este é o material do curso de big data ministrado no Centro Universitário Toledo Prudente em Março de 2015
Máquina Virtual
A fim de ilustrar e auxiliar o aprendizado foi preparada uma máquina virtual, baseada no VirtualBox, com Ubuntu e as instalações dos seguintes programas:
- Hadoop
- Hive
- HBase
- MongoDB
- Neo4j
- Solr
- R
- Octave
Download da imagem vdi compactada
https://www.dropbox.com/s/211dl2bog18f0z9/Bigdata.vdi.zip?dl=0
Trabalho
Os trabalhos devem ser entregues na secretaria de pós até o dia 10/04/2015 (quanto antes melhor).
Enunciado: evidenciar o uso das ferramentas Hadoop, Hive e HBase. Executar os programas e executar instruções de comandos no terminal. "Fotografe" as telas, organize e coloque em um arquivo .pdf a ser entregue na secretaria. (Verifique se os arquivos não estão corrompidos)
Slides
Material de apoio
- I.Robinson, J.Webber, E.Eifrem - Graph Databases, O'Reilly, 2013 (pdf)
- F.Chang, J.Dean, S.Ghemawat, W.C.Hsieh, D.A.Wallach, M.Burrows, T.Chandra, A.Fikes, R.E.Gruber - Bigtable: A Distributed Storage System for Structured Data, 2006 (pdf)
- A.Khurana - Introduction to HBase Schema Design, 2012 (pdf)
- Neural Networks with R – A Simple Example, http://gekkoquant.com/2012/05/26/neural-networks-with-r-simple-example/
- SOM {kohonen} with R, http://www.inside-r.org/packages/cran/kohonen/docs/som
- more...