Consertando o People Analytics

Não ouvir todos os clientes e falta de transparência pode ser fatal para o People Analytics

Navegando pelo LinkedIn, quase diariamente observo críticas aos serviços de People Analytics focados em recrutamento, principalmente Gupy e Kenoby. As reclamações são de candidatos frustrados com processos seletivos longos, cheios de testes e sem feedback algum sobre o resultado.

Nas últimas semanas, em face ao aumento dessas reclamações, vejo que as plataformas estão ficando mais ativas em responder às reclamações nas redes sociais, porém na maioria das vezes apontando os clientes como os responsáveis pelas informações, feedbacks e configurações da plataforma.

Em um estudo recente de Harvard + Accenture (leia aqui), vê-se que isso é um problema que afeta trabalhadores em diversos mercados, deixando muitas pessoas em um limbo que não existiria quando os processos seletivos não eram gerenciados por algoritmos e sim por pessoas.

Mas a tecnologia veio para ficar e ajudar recrutadores a processar centenas de aplicações da maneira mais eficiente, selecionando os melhores candidatos para as vagas. Porém acredito que exista uma maneira de realizar essa façanha e ainda dar aos candidatos e candidatas uma experiência muito melhor.

Não existe apenas um cliente

Acreditar que apenas o cliente que paga a sua fatura é o que importa talvez seja o principal erro. Em um projeto de produto ou serviço deve-se envolver todos os tipos de clientes, conhecer suas histórias, seus desafios e a partir daí construir soluções. Vejamos um exemplo:

“Como candidata, gostaria de saber quais os pontos fortes – ou fracos – que me ajudariam a conseguir a vaga” .

Um time de desenvolvimento traduziria isso em um indicador ou insights para a candidata ter ideia de suas chances. Inovador? Nem tanto! O próprio LinkedIn já fornece esse tipo de informação para assinantes premium, do tipo “Você está entre os 25% melhores”.

Transparência

Há regras nas contratações – traduzidas para os algoritmos – que não são explícitas, seja por intenção (design) ou não.

O contratante pode ter uma vaga na cidade do Rio de Janeiro e receber aplicações de pessoas de todo o Brasil. Ele pode não dizer explicitamente que não aceita candidaturas de outras regiões, porém o sistema pode dar preferência aos candidatos geograficamente mais próximos e deixar alguém disposto a se realocar ao Rio de Janeiro no final da fila. Um exemplo que mostra que a máquina simplesmente reflete o que aconteceria numa análise manual.

Algo menos explícito seria preterir uma candidata por ter ficado 2 anos fora do mercado. O sistema não perguntará o motivo para isso – uma gravidez? problemas de saúde? período de estudo ou sabático? – ele simplesmente empurrará para o final da fila.

Essas regras não são transparentes para os candidatos mas são para os desenvolvedores de algoritmos e para os clientes. E qual o problema em dar transparência às regras?

O exemplo da SerasaExperian

Um exemplo interessante é o score de crédito da SerasaExperian. Além de mostrar qual seu score numa escala de 0-1000, ele mostra exatamente o que está levando seus números para cima ou para baixo. Insights do tipo “Você pagou 90% do seu último empréstimo e isso é bom para seu score” mostram o que você está fazendo certo ou não e que podem não ser óbvias para o usuário comum.

Para beneficiar as empresas de crédito (que são os principais clientes da SerasaExperian) eles investiram na experiência do cliente final, dando informação e transparência nas regras.

Quem sabe no futuro uma plataforma de People Analytics pode mostrar para o candidato do tipo: “Você ficou menos de 6 meses em seus últimos 2 empregos e isso é negativo para sua candidatura”.

People Analytics: faça você mesmo

Realizar análises sofisticadas sobre sua equipe não requer investimentos significativos em aplicações. Veja como dar os primeiros passos em People Analytics.

Identificar as pessoas com maior desempenho na companhia, buscar o perfil mais adequado à uma vaga entre milhares de candidatos e prever se alguém irá sair da empresa são algumas das informações que sistemas de People Analytics pretendem responder após analisar seus dados de Recursos Humanos.

Como o próprio nome diz, People Analytics refere-se às informações, insights, previsões e análises que são realizadas com dados de pessoas, ou que podem ser desdobrados em um nível individual. O resultado é utilizado tanto para tomada de ações específicas à um indivíduo quanto de equipes ou na definição de políticas internas.

Contratar Pedro, enviar a equipe de Contabilidade para um treinamento, promover Vanessa, mudar Carlos de equipe, alterar o valor do ticket-refeição são alguns exemplos do que um People Analytics pode sugerir para você.

Aplicações como Gupy, Kenoby, Qualtrics – para citar poucas – estão entre as mais conhecidas nesta arena. Mas o propósito desde post é explicar como iniciar com uma análise de People Analytics sem a necessidade de investir muito capital.

Como começar

Um projeto de Analytics inicia com dados. (Se quiser saber mais sobre o ciclo de um projeto veja esse outro post), portanto melhor arregaçar as mangas:

A quantidade e a variedade de dados faz uma diferença significativa, e isso não significa usar apenas dados muito recentes. Na tabela abaixo há exemplos do que pode ser obtido em diferentes áreas.

Fonte dos dadosCategoriaDados
OperaçõesResultados do indivíduoProdutividade, Qualidade, Erros, satisfação de cliente
RHFolha de pagamento e PontoSalário, Grupo Salarial, faltas e ausências
Desempenhoavaliações da chefia, medidas disciplinares, auto-avaliações, avaliação 360°, desligamentos, resultado de entrevista de desligamento
ComportamentalPerfil psicológico e comportamental, testes de aptidão, lógicos, etc.
DemográficosIdade, educação, estado civil, localização geográfica.

O segundo passo é fazer um ‘saneamento’ nos dados e organizá-los para a análise. Isso pode significar eliminar dados não-significativos ou extremos (outliers) e preencher dados faltantes baseado em premissas. Nessa etapa é essencial o envolvimento de alguém com conhecimento da área, para evitar tomar direções erradas.

Organizando para a análise

É nessa etapa que acontece o famoso ‘cruzamento de dados’: juntamos informações de origens diferentes em uma única tabela. Mas para isso acontecer os dados devem estar organizados de maneira individualizada, em uma escala de tempo similar – se aplicável – e as diferentes bases de dados devem possuir uma “chave” para cruzarmos umas com as outras. Esta chave, por exemplo, pode ser a matrícula ou CPF, que são dados únicos por indivíduo.

O resultado é uma grande tabela com todos esses dados juntos, agrupados por indivíduo e por período, que pode parecer com isso.

Esta tabela terá tantas colunas quanto as diferentes variáveis que estiverem disponíveis e o número de linhas será grande: no mínimo o número de pessoas X o número de períodos analisados. Ex.: Uma operação de 50 pessoas analisada durante um ano em períodos mensais terá 50 x 12 = 600 linhas.

Primeiro explorar os dados

Com dados devidamente organizados, pode-se iniciar uma análise exploratória da base. A Análise Exploratória procura mostrar o comportamento das variáveis que coletamos tanto de maneira isolada quanto associada à outras. Informações e insights desta análise são importantes para conhecimento do comportamento dos dados – e também das pessoas e processos – e também para o refinamento da base de dados. Pode-se desconsiderar, por exemplo, uma das variáveis pois ela tem um comportamento errático e não está influenciando nenhuma outra.

Para especialistas: Para um modelamento estatístico, é necessário muitas vezes recorrer à transformações de variáveis para que o algoritmo utilizado tenha melhor desempenho, e a Análise Exploratória é útil para identificar que tipo de transformações são necessárias

Agora o modelamento

O modelo estatístico é, simplificadamente, uma fórmula que foi construída baseada nos dados históricos que construímos. Há diferentes tipos de algoritmos para diferentes aplicações, mas em qualquer uma delas o resultado será tão bom quanto a qualidade dos dados que utilizados.

Há basicamente três tipos de algoritmos que podem ser aplicados à base de dados, e que baseiam-se no tipo de resultado pretendido:

Agrupamento ou Clustering: são algoritmos que irão separar seus dados em ‘famílias’, conforme similaridade entre os dados. Pode-se identificar, por exemplo, o que difere os grupos de pessoas de alto desempenho das demais.

Classificação: Quando é necessário separar ou prever o resultado de uma maneira categórica, geralmente obtendo uma resposta sim/não. Uma aplicação comum é prever se alguém irá deixar/permanecer na companhia.

Algoritmos de Regressão são usados para prever resultados numéricos. Prever qual será a produtividade de um indivíduo no próximo mês pode ser uma das aplicações.

Na tabela abaixo organizo alguns exemplo da aplicação dos algoritmos, conforme a necessidade:

O que descobrirTipo de decisãoAlgoritmos
– Alguém vai sair ou não da empresa
– Pessoa deve ou não ser promovida
– Contratar ou não contratar
Classificação
(Sim/Não)
Regressão logística, Árvores de decisão, Bayes, K-neareast nighbors
– Produtividade no próximo mês
– Quantas ausências terei na equipe
Regressão
(resultado é um número)
Regressão linear
– Comportamento de grupos por similaridade (alta performance, experientes, novatos, etc)Agrupamento
(Famílias)
k-means

Como seguir em frente

Posso fazer isso sem comprar uma solução? Sim, é possível. Contruir um protótipo utilizando uma base de dados de pequeno porte e Excel é uma opção viável. O Excel possui alguns poucos algoritmos de regressão/classificação que podem ser usados para começar.

Porém o Excel fica muito limitado para um desenvolvimento real, pois há limitações de velocidade, ferramentas e integração com outras aplicações.

Para um desenvolvimento completo, com uma base de dados extensa e flexibilidade para usar quaisquer algoritmos, pode-se usar uma construção em R ou Python, que são códigos abertos e possuem bibliotecas extensas para analisar, modelar e visualizar os resultados.

Na prática

Utilizar People Analytics na prática envolve alguns cuidados. Todo resultado proveniente de um modelo é baseado em um histórico passado e todo modelo tem uma margem de erro. Usar um resultado do modelo sem uma avaliação crítica é um risco muito grande.

Uma preocupação evidente é no aspecto ético. As variáveis utilizadas no modelo irão determinar o resultado, portanto selecionar as variáveis corretas passa por uma crítica ética. Para dar um exemplo prático: Mães com filhos pequenos e que moram longe do trabalho podem ter dificuldade em estar presente todos os dias do mês e sem atrasos. Utilizando o estado civil, distância do trabalho e número de filhos de uma funcionária e cruzando isso com outros dados de desempenho, o modelo pode classificá-la como um perfil de alto risco. Sem uma avaliação crítica o time de recrutamento rejeitará esses perfis sem nem se dar conta.