<p> </p>
<p><img src="images/artigos/2013/gleen_magic.jpg" border="0" width="65" height="78" style="float: left; margin: 5px;" /></p>
<p>Glenn Johnson (*) <br /><br />Parte do grande volume de metadados é criado por middlewares que são usados para integração de sistemas. Os middlewares são responsáveis pela geração do Big Metadata, pois quando os processos de negócios englobam aplicações é necessário manter um Armazenamento de Dados Operacionais (ODS – Operational Data Store) para todos os dados que fluem pelo sistema. Os metadados são logados no ODS antes dos dados serem manipulados, depois ou ambos momentos. </p>
<p><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Com a tendência atual de abordagem de dados de “manter tudo”, o ODS está crescendo em tamanho e tornando-se difícil de gerenciar. Além disso, as mensagens que fluem entre a API de uma aplicação e o servidor do middleware contém metadados que consomem processamento, memória e banda larga.</span></p>
<p>Em muitas situações, reduzir o tempo que se leva para extrair valor de todos estes dados é um requisito essencial para o sucesso. Por exemplo, o AppNexus, um ad exchange online, processa entre 200 e 275 mil ofertas de publicidade online por segundo com um tempo de resposta esperado de menos de 100 milissegundos. Devido a grandes volumes de dados, algumas vezes pode-se levar três minutos para atualizar o cache. De acordo com Brian O’Kelley, CEO da Appnexus, a latência na rede pode custar USD 10.000 por minuto.</p>
<p><strong><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Reduza a Latência, aumente a eficiência</span></strong><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Uma abordagem tecnológica comum para redução de latência é a utilização da computação em memória. Processar os dados assim que chegam, sem ter que gravá-los antes em uma base de dados pode trazer benefícios de performance e redução de dados. Evitar a necessidade de gravar valores intermediários em disco elimina outra fonte de latência introduzida.</span></p>
<p>Instituições financeiras têm usado computação em memória para detecção de fraudes de cartões de crédito e de atividades comerciais realizadas por robôs. Enquanto isso o Google utiliza abordagens em memória para buscar grandes quantidades de dados. Os metadados também podem ser usados para potencializar as funções em tempo real da plataforma.</p>
<p><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Além disso, melhorar o gerenciamento de dados pode incrementar a eficiência no processamento de metadados. Quando os dados são recebidos por uma camada de middleware por causa da integração de dados, isto pode ter diversos destinos: podem ser transferidos para outra aplicação ou fila de mensagens, convertidos para outros formatos, salvos em uma ou mais tabelas ou bases de dados, ou até usados para determinar outras ações. Todos estes processos podem ser examinados e melhorados para uma maior eficiência.</span></p>
<p><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Por exemplo, uma maior eficiência pode ser conquistada usando declarações diretas para atualizar apenas informações que tenham sido alteradas, ao invés de atualizar a tabela toda. Em cenários baseados em eventos ou em tempo real, um simples fluxo pode ser criado para atualizar apenas um campo ou dado. Para cortar os volumes de metadados, mais comandos eficientes podem ser usados, tais como Replicate_Last_Updates para atualizar apenas as mudanças ou Multicast para atualizar simultaneamente múltiplos clientes.</span></p>
<p><span style="font-size: 12.1599998474121px; line-height: 1.3em;"><strong>Visualizando Fluxos de Dados</strong><br /></span><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Para analisar os processos mais eficientes para manipular metadados, é de grande ajuda utilizar ferramentas de design que ajudem a visualizar fluxos de dados. Um dos meios mais poderosos e eficientes de visualizar as instruções para manuseio de dados e metadados é através do uso de um serviço de mapeamento de dados.</span></p>
<p><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Um serviço de mapeamento de dados normalmente mostra a fonte de dados na esquerda e o destino na direita e fornece ferramentas para conectar visualmente linhas de dados entre campos de fonte e destino, enquanto aplica funções de negócios ou expressão lógica para fins de transformação. Passos antes e depois de utilizar um serviço de mapeamento de dados também pode conter lógica de manipulação e pode ser visualizado através de um fluxograma de integração.</span></p>
<p><span style="font-size: 12.1599998474121px; line-height: 1.3em;">A Linguagem de Execução de Processos de Negócios (BPEL) é um exemplo de abordagem de visualização muito útil. Como a lógica de um fluxograma de integração ou serviço de BPEL podem ser alinhados para conectar outros fluxos de integração ou serviços BPEL, os recursos são extremamente versáteis e poderosos. Administrações adequadas destes recursos podem conduzir a uma melhor manipulação de dados e eficiência de metadados.</span></p>
<p><span style="font-size: 12.1599998474121px; line-height: 1.3em;">Se preparar para o Big Metadata significa se certificar que você tem uma estratégia para adoção de técnicas de computação em memória para ter poder de processamento disponível. Tomar medidas adicionais para avaliar seu uso atual de práticas ultrapassadas e ineficientes de ETL, gerenciamento de dados, armazenamento de dados operacionais, e dados de integração e práticas de gerenciamento de metadados também ajudarão a deixar seu big metadata sob controle.</span></p>
<p><em><span style="font-size: 12.1599998474121px; line-height: 1.3em;">(*) Vice presidente da Magic Software Americas</span></em></p>
<p> </p>