CSV, Tranformação e Banco de Dados
Com tudo tudo certo, vamos até a pasta do Pentaho Data Integration (PDI) e execute o arquivo spoon.sh
.
Nesta parte iremos mostrar como carregar uma pequena base de filmes (arquivo CSV) para o banco de dados. Utilizaremos aqui o postgresql. Se você não o tem instalado em sua máquina ou não sabe como instalar e configurar, sugerimos este tutorial: instalando postgreSQL e pgAdmin.
Vamos começar!
Com o spoon.sh
aberto, a primeira coisa a se fazer é conectá-lo à base de dados que você configurou no tutorial acima. Fazemos o seguinte:
No Painel do lado esquerdo, vá na aba View (ao lado de Design). Clique com o botão direito em Conexões e depois Novo. Na tela que se abrirá, escolha:
Tipo de conexão:PostgreSL Host Name: localhost Database Name: [O nome do banco que você criou] User Name: [Seu login] Password: [Sua senha]
Clique em Test, se estiver tudo certo, clique em OK.
Sua base de dados estará listada em Conexões. Clique com o botão direito nela e entao clique em Share (Compartilhar), para que ela fique disponível para todos os seus futuros trabalhos no PDI.
Bom .. Apoś tudo isso, estamos pronto para começar brincar :D.
Neste exemplo, utilizaremos um arquivo CSV que contém alguns dados sobre filmes. Você pode baixá-lo em : [Colocar Link]
Vá em Arquivo > Novo > Transformação (Ou apenas Ctrl N). Na Aba Design, vá em Input e clique e arraste o item CSV Input File. Feito isso, dê duplo clique no ícone que você acabou de arrastar.
- No campo Step Name, você pode colocar o nome que você quiser para se lembrar do que é este passo.
- Em Filename busque o arquivo de filmes que você baixou.
- O resto pode deixar como está. Agora, clique em Obtém Campos e você verá todos os campos do arquivo. Seus campos devem se parecer como a imagem abaixo. Depois disso clique em OK.
Depois, escolha o componente Select Values e arraste-o também para a tela. Antes de começar a trabalhar com esta tranformação, temos que ligar o componente de entrada (A entrada CSV) com o componente de Selecionar Valores. Isso pode ser feito simplesmente segurando Shift, clicando no step CSV Input File que criamos e depois clicando em Select Values que colocamos na tela. Agora Sim!
- Duplo clique neste step, clique em Get Fields to Select e configure como mostra a imagem
Em seguida , escolha o componente Table Output, arraste-o também para a tela e conecte o Select Values criado ao input (da mesma forma que vimos antes)
Dê duplo clique em Table Output.
Em Connetion, escolha a base de dados que criamos no inicio do tutorial, lembra?
Em Target Table, devemos colocar a tabela alvo, ou seja, a tabela em que desejamos armazenar os dados. Mas nós não criamos uma, certo? É por isso que você irá preencher Target Table com o nome da tabela do banco em que você deseja criar (neste caso, o nome desta tabela será filmes), depois clicar em SQL (isso fará o PDI gerar o código sql para a criação da tabela), Execute e dê OK em tudo.
Pronto! Agora é so clicar no botão de play e conferir o resultado no Banco de Dados .. Simples, não? :D