Identificar as pessoas com maior desempenho na companhia, buscar o perfil mais adequado à uma vaga entre milhares de candidatos e prever se alguém irá sair da empresa são algumas das informações que sistemas de People Analytics pretendem responder após analisar seus dados de Recursos Humanos.
Como o próprio nome diz, People Analytics refere-se às informações, insights, previsões e análises que são realizadas com dados de pessoas, ou que podem ser desdobrados em um nível individual. O resultado é utilizado tanto para tomada de ações específicas à um indivíduo quanto de equipes ou na definição de políticas internas.
Contratar Pedro, enviar a equipe de Contabilidade para um treinamento, promover Vanessa, mudar Carlos de equipe, alterar o valor do ticket-refeição são alguns exemplos do que um People Analytics pode sugerir para você.
Aplicações como Gupy, Kenoby, Qualtrics – para citar poucas – estão entre as mais conhecidas nesta arena. Mas o propósito desde post é explicar como iniciar com uma análise de People Analytics sem a necessidade de investir muito capital.
Como começar
Um projeto de Analytics inicia com dados. (Se quiser saber mais sobre o ciclo de um projeto veja esse outro post), portanto melhor arregaçar as mangas:
A quantidade e a variedade de dados faz uma diferença significativa, e isso não significa usar apenas dados muito recentes. Na tabela abaixo há exemplos do que pode ser obtido em diferentes áreas.
| Fonte dos dados | Categoria | Dados |
|---|---|---|
| Operações | Resultados do indivíduo | Produtividade, Qualidade, Erros, satisfação de cliente |
| RH | Folha de pagamento e Ponto | Salário, Grupo Salarial, faltas e ausências |
| Desempenho | avaliações da chefia, medidas disciplinares, auto-avaliações, avaliação 360°, desligamentos, resultado de entrevista de desligamento | |
| Comportamental | Perfil psicológico e comportamental, testes de aptidão, lógicos, etc. | |
| Demográficos | Idade, educação, estado civil, localização geográfica. |
O segundo passo é fazer um ‘saneamento’ nos dados e organizá-los para a análise. Isso pode significar eliminar dados não-significativos ou extremos (outliers) e preencher dados faltantes baseado em premissas. Nessa etapa é essencial o envolvimento de alguém com conhecimento da área, para evitar tomar direções erradas.
Organizando para a análise
É nessa etapa que acontece o famoso ‘cruzamento de dados’: juntamos informações de origens diferentes em uma única tabela. Mas para isso acontecer os dados devem estar organizados de maneira individualizada, em uma escala de tempo similar – se aplicável – e as diferentes bases de dados devem possuir uma “chave” para cruzarmos umas com as outras. Esta chave, por exemplo, pode ser a matrícula ou CPF, que são dados únicos por indivíduo.
O resultado é uma grande tabela com todos esses dados juntos, agrupados por indivíduo e por período, que pode parecer com isso.

Esta tabela terá tantas colunas quanto as diferentes variáveis que estiverem disponíveis e o número de linhas será grande: no mínimo o número de pessoas X o número de períodos analisados. Ex.: Uma operação de 50 pessoas analisada durante um ano em períodos mensais terá 50 x 12 = 600 linhas.
Primeiro explorar os dados
Com dados devidamente organizados, pode-se iniciar uma análise exploratória da base. A Análise Exploratória procura mostrar o comportamento das variáveis que coletamos tanto de maneira isolada quanto associada à outras. Informações e insights desta análise são importantes para conhecimento do comportamento dos dados – e também das pessoas e processos – e também para o refinamento da base de dados. Pode-se desconsiderar, por exemplo, uma das variáveis pois ela tem um comportamento errático e não está influenciando nenhuma outra.

Para especialistas: Para um modelamento estatístico, é necessário muitas vezes recorrer à transformações de variáveis para que o algoritmo utilizado tenha melhor desempenho, e a Análise Exploratória é útil para identificar que tipo de transformações são necessárias
Agora o modelamento
O modelo estatístico é, simplificadamente, uma fórmula que foi construída baseada nos dados históricos que construímos. Há diferentes tipos de algoritmos para diferentes aplicações, mas em qualquer uma delas o resultado será tão bom quanto a qualidade dos dados que utilizados.
Há basicamente três tipos de algoritmos que podem ser aplicados à base de dados, e que baseiam-se no tipo de resultado pretendido:
Agrupamento ou Clustering: são algoritmos que irão separar seus dados em ‘famílias’, conforme similaridade entre os dados. Pode-se identificar, por exemplo, o que difere os grupos de pessoas de alto desempenho das demais.
Classificação: Quando é necessário separar ou prever o resultado de uma maneira categórica, geralmente obtendo uma resposta sim/não. Uma aplicação comum é prever se alguém irá deixar/permanecer na companhia.
Algoritmos de Regressão são usados para prever resultados numéricos. Prever qual será a produtividade de um indivíduo no próximo mês pode ser uma das aplicações.
Na tabela abaixo organizo alguns exemplo da aplicação dos algoritmos, conforme a necessidade:
| O que descobrir | Tipo de decisão | Algoritmos |
|---|---|---|
| – Alguém vai sair ou não da empresa – Pessoa deve ou não ser promovida – Contratar ou não contratar | Classificação (Sim/Não) | Regressão logística, Árvores de decisão, Bayes, K-neareast nighbors |
| – Produtividade no próximo mês – Quantas ausências terei na equipe | Regressão (resultado é um número) | Regressão linear |
| – Comportamento de grupos por similaridade (alta performance, experientes, novatos, etc) | Agrupamento (Famílias) | k-means |
Como seguir em frente
Posso fazer isso sem comprar uma solução? Sim, é possível. Contruir um protótipo utilizando uma base de dados de pequeno porte e Excel é uma opção viável. O Excel possui alguns poucos algoritmos de regressão/classificação que podem ser usados para começar.
Porém o Excel fica muito limitado para um desenvolvimento real, pois há limitações de velocidade, ferramentas e integração com outras aplicações.
Para um desenvolvimento completo, com uma base de dados extensa e flexibilidade para usar quaisquer algoritmos, pode-se usar uma construção em R ou Python, que são códigos abertos e possuem bibliotecas extensas para analisar, modelar e visualizar os resultados.
Na prática
Utilizar People Analytics na prática envolve alguns cuidados. Todo resultado proveniente de um modelo é baseado em um histórico passado e todo modelo tem uma margem de erro. Usar um resultado do modelo sem uma avaliação crítica é um risco muito grande.
Uma preocupação evidente é no aspecto ético. As variáveis utilizadas no modelo irão determinar o resultado, portanto selecionar as variáveis corretas passa por uma crítica ética. Para dar um exemplo prático: Mães com filhos pequenos e que moram longe do trabalho podem ter dificuldade em estar presente todos os dias do mês e sem atrasos. Utilizando o estado civil, distância do trabalho e número de filhos de uma funcionária e cruzando isso com outros dados de desempenho, o modelo pode classificá-la como um perfil de alto risco. Sem uma avaliação crítica o time de recrutamento rejeitará esses perfis sem nem se dar conta.