Iniciando com Spoon ( Pentaho Data Intregation )

A ampla gama de informações recolhidas por uma empresa raramente é armazenado em um único banco de dados ou formato. No entanto, o software de análise é acusado de fornecer uma visão holística das operações de uma empresa com base nesses dados diversificados. A integração de dados é o processo pelo qual as informações de várias bases de dados são consolidadas para uso em uma única aplicação. Resumidamente, a integração de dados combina partes que normalmente não se encaixam.

Softwares de análise de negócios dependem da integração de dados para construir painéis, visualizações e relatórios que refletem informações precisas, consistentes. A falta de limpeza de dados resultaria em consultas que retornam as comparações inúteis. Os desafios de volume e diversidade criada por dados grandes tornam a integração ainda mais importante.

Aplicações desenvolvidas internamente podem ser utilizadas para traduzir dados de diversas fontes para um formato comum. No entanto, como o aumento de informação, as exigências de gestão de dados sobre uma aplicação podem tornar-se excessivas, sendo necessário uma codificação complexa e investimentos cada vez maiores podem ser necessários para manter tudo funcionando.

Um ETL (extração, transformação e carga) recebe e limpa os dados de uma base de dados origem, em seguida, envia a informação para o data warehouse (base de dados destino). Programas que acessam o data warehouse encontraram as informações prontas para análise.

Há vantagens e desvantagens para a integração de dados, a solução mais eficaz dependerá dos recursos e necessidades da sua empresa ou equipe de trabalho.

SPOON

Com uma interface gráfica arraste e solte intuitiva, ambiente de design e escalável, arquitetura baseada em padrões, o Spoon é uma ferramenta ETL, ótima para criação de um data warehouse ou para migração de dados entre diferentes bases de dados.

Preparação de ambiente (Instalação)

Por ser uma aplicação desenvolvida em Java, o Spoon não necessita de instalação. Porém é necessário realizar algumas configurações em seu computador para garantir que a ferramenta funcione corretamente.

Vamos mostrar como realizar a configuração da ferramenta em um ambiente Windows.

 

Onde baixar o Spoon ?

Para utilizar o Spoon você pode optar entre a versão paga e a versão gratuita (comunitária), vale ressaltar que com a versão gratuita você conseguira trabalhar com grande volume de informações sem problemas, independentemente do tamanho do seu projeto.

Para baixar a versão gratuita acesse: Download Spoon

Após realizar o download do Spoon você deve se atentar a algumas configurações que devem ser realizadas em seu sistema operacional.

Requisitos Windows:

  1. - JDK  instalado- recomendável 7 ou superior ( por questão de dependências de alguns pacotes, recomenda-se sempre possuir o JDK instalado).
  2. - Configurar variaveis de ambiente.
  3. - Bibliotecas  de conexão JDBC.

Configurando variáveis de ambiente para o Spoon

As configurações a seguir visam assegurar o funcionamento do Spoom.

 

Configurando Variáveis de Ambiente

Para configurar as variáveis de ambiente java acesse o link: Configurando Variáveis de Ambiente Java

Após configurar as variáveis Java, você deve configurar uma variável java pouco utilizada, mas de grande importância para o Spoon.

Na tela de configuração de variáveis de ambiente crie uma nova variável:

Variável: _JAVA_OPTIONS

Valor da Váriavel: –Xmx1g

Após criar a variável acima, vá até a pasta de instalação do Spoon e execute o arquivo “Spoon.bat”

Após  executar o arquivo BAT primeiro irá aparece uma tela do prompt de comando.

Após poucos segundos será a presentada a tela de Splash  do Pentaho Data Integration.

splash

Após mais alguns segundos a tela inicial do Spoon é apresentada.

Geralmente demora um pouquinho para que ele seja iniciado, então não se preocupe.

2. telaPrincipa

 

Bibliotecas JDBC

Para conseguir conectar-se a alguns bancos de dados é necessário baixar algumas bibliotecas e coloca-las na pasta \lib que há no diretório de instalação do Spoon.

Por exemplo, para realizarmos uma conexão MySql precisamos baixar a biblioteca JDBC.

0 comentários:

Postar um comentário