SAP Predictive Analysis

SAP Predictive Analysis

Neste blog procuramos fazer  um resumo sobre Predictive Analysis, Predictive Analysis Libraries e alguns exemplos de algorítimos que são utilizados pelo PA, sua arquitetura, algumas definições, em uma  visão bem resumida, mas será possível ter uma ideia do que é o PA e nos próximos blogs, faremos alguns exemplos passo a passo de como isso é feito.

Data Mining

Mineração de Dados é o processo de explorar grandes quantidades de dados a procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. Essa pesquisa é feita por algoritmos matemáticos classificados por diversas áreas de pesquisas, e alguns deles mostraremos abaixo.

O que SAP Predictive Analysis?

Uma definição simples de Predictive Analysis: é uma capacidade de se fazer previsões através de um quantidades e volumes de dados ( Big Data ). Exemplos, previsões de produtos vendidos, custos, analises de créditos, anomalias e possibilidades de fraudes, medições de desempenho de linhas de produção, dados métricos, classificação de produtos, analise de respostas de campanha de marketing.
A SAP fez relevantes investimentos para criar o banco de dados em memória o SAP Hana , que significa High Performance ANalytic Appliance , e com ele uma poderosa ferramenta que possibilita analise de grandes volumes de dados, essa ferramenta se chama SAP Predictive Analysis, e também PAL – Predictive Analysis Libraries, composta por algoritmos de mercados e algoritmos de estatísticas na linguagem R ,que são capazes de analisar grandes volumes de dados, com fins específicos e com resultados que levariam dias ou horas, e agora, em poucos minutos ou segundos, nesse blog, mostraremos alguns exemplos bem conhecidos e do são capazes de fazer.

Arquitetura do Predictive Analysis

Para desenvolver aplicação com Predictive Analysis é utilizado o Hana Studio que é uma versão customizada do Eclipse para as aplicações Hana que pode ser baixado do SDN. Ele é um client que acessa o banco de dados Hana, que esta em Instance Hana chamada Hana Business Suite, dentro dessa Plataforma contem os seguintes componentes:

Hana Studio

O Hana Studio é uma ferramenta IDE baseada no Eclipse para construção de códigos XS, criação de tabelas, analytical view, Store Procedures e acesso a PAL.

HanaStudio

Hana Business Suite

É a plataforma que prove a plataforma do Banco de Dados Hana, tabelas, visões, store procedures, Algoritmos para Predictive, grupo de autorizações, Administração da Instance, logs, etc.

BusinessSuite

Aplicativo Predictive Analysis

É um aplicativo que a SAP criou para apoiar na analise de dados antes de definir qual será o algoritmo apropriado para definir qual poderá ser criado o código XS utilizando o PAL dentro do Servidor Hana.

PA

Predictive Analysis Libraries

O PAL são um conjunto de Store Procedures que representam os algoritmos que fazem a analise de dados na base Hana e suportados pelos algoritmos na linguagem R também, a execução do PAL é feita pela linguagem XS, que permite execução de scripts em alta velocidades em banco de dados.

 

A linguagem XS

É a linguagem de desenvolvimento do Hana para acesso de dados em grandes velocidades, ela processa utilizando XS Engine. Abaixo um exemplo de execução de algorítimo em XS Hana.

XS
Categorias de Algoritmos

Os algoritmos executados no Hana são classificados conforme as 5 categorias abaixo, vamos fazer um breve resumo de cada e suas aplicações:

Time Series Analysis

Este grupo de algoritmos tem a características analisar dados do passado e projetar dados no futuro, os dados podem ser vendas, consumos de produtos, telemetrias, etc. Ou seja,qualquer tipo de dados que se tenha um histórico e se queira projetar dados no futuro.

Esse é um exemplo de um Smooth Regression Analysis com a previsão futura.

TimeSeriesAnalysis

Classification Analysis

Este é o maior grupo do Predictive Analysis , em termos gerais,
Ele pode prever uma variável usando os dados de outras variáveis que acreditamos afetar
os valores da variável que estamos a tentar prever, com isso, podemos fazer a classificações de dados. Além de podem fazer analise de decisões com base nos dados classificados, abaixo um exemplo de Classification Analysis com Decisão.

Com base nos históricos de respostas de email, o algoritmo de Classification Analysis com Decisão, ajuda determinar qual grupo de emails tem mais respostas e com isso atuar de forma diferente com outras ações como promoções ou campanhas de marketing.

ClassificationAnalysis

Cluster Analysis

É um algoritmo utilizado para criar agrupamentos de dados em clusters ou segmentos de dados. Ele é frequentemente usado para subdividir um grande volume de dados definido, para ser capazes de entender melhor os atributos dos subconjuntos menores. Com grandes conjuntos de dados, os relacionamentos em que os dados podem ser mais difíceis de encontrar e podem
mesmo anular-se mutuamente. Considerando, concentrando-se em subconjuntos podemos mais facilmente encontrar padrões nos dados e explicações para qualquer relacionamento. Também podemos agrupar dados para que possamos concentrar em grupos específicos dentro de um conjunto de dados. O melhor exemplo  é a segmentação de clientes, onde queremos desenvolver estratégias de vendas específicas para determinados grupos de clientes. Ou um mais simples é a análise de curva ABC, conforme figura abaixo.

ClusterAnalysis

Association Analysis

Esta classe de aplicações olha para as associações entre as coisas, um exemplo dos mais conhecidos é a análise de cestas de compras e a previsão de compras, onde  pessoas que
compraram um determinado produto são mais propensos a adquirir esses outros produtos juntos. É o famoso Apriori, em resumo ele exibe quais produtos são comprados e podem ser potencialmente comprados juntos. Ele é bem simples de ser utilizado, com a primeira coluna que representa os IDs de transação ( exemplo o Cupom), e a segunda coluna os itens. As associações não necessariamente precisam ser produtos em cestas de compras, seja em uma loja de varejo ou uma aplicação de comércio eletrônico. Eles poderiam estar entre as pessoas em uma rede social. Em geral, é a análise é de uma coleção de coisas em alguns recipientes. Outros exemplos, incluem a análise dos serviços de telecomunicações adquiridos por assinantes; telefone chamando padrões; visitantes e caminhos através de um site.

Resultado do Algoritmo Apriori, indicando a lista de produtos que tem mais probabilidades de serem comprados juntos, neste gráfico quanto maior,  mais probabilidade.

AssocioationAnalysis

Outlier Analysis

Esta classe de aplicação da análise preditiva olha para o inusitado ou inesperado, o
incomum no sentido de que os valores em um conjunto de dados são muito diferentes de outros valores, e inesperados, no sentido de que os valores são muito diferentes do que
foi previsto. Os valores extremos podem ser como um resultado de erros nos dados ou genuíno
de variações nos dados, que o modelo de previsão precisa de ter em conta. Um bom exemplo para ele ser aplicado  é para analise de fraudes, de cartões de créditos.

Um exemplo simples é do algoritmo Outlier Analysis , esta abaixo, onde ele  mostra o que esta fora da linha de regressão, esta pode ser considerada uma anomalia, perante os outros dados.

OutlierAnalysis

One thought on “SAP Predictive Analysis

  1. Diego dos Santos

    Olá, já tens algum exemplo de Time Series Analysis? Estou tentando trabalhar com alguns algoritmos e estou tendo problemas.
    Abraço!

Leave a Reply

Your email address will not be published. Required fields are marked *