Transparência de dados públicos: análise de licitações do Município de São Paulo

Em 2009, sob o Governo Lula, é sancionada a Lei Complementar 131 que obriga todas as esferas da máquina pública a divulgar na internet em tempo real e de maneira absolutamente transparente a descrição de seus gastos para que a população possa ter acesso e consultá-los. Em 2011, veio se somar a essa iniciativa a Lei de Acesso a Informação, Lei 12.257/2011. Esta, que entrou em vigor em maio de 2012, visava assegurar para qualquer pessoa física ou jurídica o acesso incondicional a dados oriundos de órgão públicos. 

Com esses avanços legislativos, buscava-se garantir aos cidadãos brasileiros um melhor entendimento sobre as despesas públicas possibilitando inclusive um monitoramento delas. A partir disso, esperava-se uma maior aproximação e conscientização da população sobre a questão política.

Dez anos após o início desta jornada pela transparência, como está a situação? Os dados públicos são de fato acessíveis aos contribuintes?

Este texto visa a responder essas questões dentro de um recorte da maior cidade brasileira, São Paulo. Longe de ser exaustivo, buscaremos analisar o quão pertinente são os meios desenvolvidos pelo município para oferecer adequado acesso a informação aos moradores e demais interessados.

Para isso, apresentaremos a análise de dados realizada em cima das informações divulgadas publicamente com base em técnicas e ferramentas de Analytics e Data Science como Excel, Python, SQL, NLP, API, Web Scraping e Data Visualization.


Coleta e análise inicial de dados públicos 

Para começar nosso trabalho, buscamos identificar por qual ângulo deveríamos abordar essa temática e, após algumas tentativas iniciais, foi definido que nossa análise seria desenvolvida com foco nas licitações do Município de São Paulo, cuja base de dados nos pareceu a mais completa e acessível. Em particular, foi consultado o Portal de Dados Abertos da Prefeitura de São Paulo que “reúne conjuntos de dados de todas as secretarias, subprefeituras e empresas públicas municipais”. 

Nossa jornada então se iniciou na busca de informações sobre licitações realizadas pela cidade de São Paulo através dessa plataforma onde as mesmas estão organizadas em documentos nos formatos “xls”, “csv”, e “xml” e por períodos de 2005 a 2010, 2011 a 2015, 2016, 2017, 2018 e 2019. 

Cada arquivo apresenta, em particular, as seguintes variáveos: 

  • O órgão que realizou a licitação – Educação, Assistência e Desenvolvimento Social, Subprefeituras, etc.
  • Modalidade – Pregão eletrônico, Inexigibilidade, Convênio, etc.
  • Objeto, onde está descrito o objetivo da licitação; 
  • Razão social e CNPJ da empresa vencedora (Fornecedor);
  • O valor do contrato fechado pela prefeitura com esta.

Com estas informações, procuramos desenvolver as primeiras visualizações a fim de simplificar a leitura e o entendimento dos dados recolhidos. Apresentamos abaixo algumas destas:


Quantidade de licitações por ano

Une image contenant capture d’écran

Description générée automatiquement

Podemos observar nesse gráfico que o processo de inclusão no sistema de dados abertos foi reforçado e sistematizado a partir de 2010, conforme entrada em vigor das Leis da Transparência e da Informação. Em 2016, identificamos uma queda da quantidade de licitações que coincide com uma mudança de gestão no Município, porém não obtivemos dados suficientes para concluir quanto à esta flutuação.


 Quantidade de licitações por modalidade

Une image contenant capture d’écran

Description générée automatiquement

 

Esta visualização mostra que as modalidades mais utilizadas pela cidade de São Paulo em suas licitações são Pregão eletrônico (17,65 %), Convênio (17,01 %) e Pregão Presencial (16,21 %).


Quantidade de licitações por órgão

Une image contenant capture d’écran

Description générée automatiquement

A maioria das licitações são realizadas pelas Secretarias de Educação (12,44 %), da Saúde (12,01 %) e de Assistência e Desenvolvimento Social (8,25 %).


Empresas vencedoras de licitações por Estado (fora Estado de São Paulo)

Une image contenant texte, carte

Description générée automatiquement

Se a maioria das empresas vencedoras das licitações estão localizadas no Estado de São Paulo, o mapa acima mostra que, fora este, os Estados que sediam a maior quantidade de empresas ganhadoras (quanto mais escuro, mais licitações vencidas) são Minas Gerais, Paraná e Rio de Janeiro. 


Análise aprofundada dos dados e coleta complementar

No decorrer dessa primeira etapa de análise exploratória básica dos dados, identificamos uma primeira dificuldade de averiguação de informações para tirar conclusões coerentes: a variável do valor de contrato apresentava uma quantidade significativa de observações atípicas, longe das demais (outliers). 

Em busca da realização de uma limpeza de dados que pudesse nos permitir explorar essa variável, percebemos algumas questões importantes para serem consideradas. Analisamos mais profundamente alguns destes outliers e, comparando com as atas de licitações oficiais, pudemos perceber que, de fato, certos valores aparentavam ter sido digitados equivocadamente (CNPJ no lugar do valor, valores duplicados, etc.). 

Uma forma de resolver essa questão seria de confirmar cada valor de contrato através da ata de licitação. Como estamos falando de mais de 100 mil observações, há de se considerar que esse tipo de limpeza demandaria um tempo considerável e que não foi possível realizar até a escrita deste artigo. Por isso e com uma preocupação ética, escolhemos não apresentar conclusões relacionadas a esta variável. Contudo, isso já mostra o quanto seria desafiador para um cidadão lambda confiar nos dados apresentados e, portanto, ter uma noção real dos gastos realizados pela sua Prefeitura, o que pode ser considerado uma falha importante no quesito transparência.

Outro ponto que resolvemos analisar, mas que não constava nas bases de dados originais é o tipo de licitação, ou seja, procuramos classificar as licitações por categorias. Para isso, tivemos que realizar uma análise da variável “objeto” ao aplicar uma técnica simples de NLP (Natural Language Processing). De fato, o objeto de licitação não apresentava nenhum tipo de padronização e precisávamos aplicar um modelo de interpretação de texto para poder tipificá-lo. Com isso, chegamos aos resultados abaixo. 


Quantidade de licitações por órgão e por tipo de objeto

Une image contenant capture d’écran

Description générée automatiquement

Essa visualização nos permite avaliar a coerência do método que usamos. Nela, destacamos, por exemplo, que a maioria das licitações das Secretaria de Assistência e Desenvolvimento Social e Educação estão tipificadas como atendimento, enquanto Cultura Lícita mais para eventos, Infra-estrutura Urbana e Obras para obras e saúde para insumos. Com essa classificação estabelecida, foi então possível organizar nossos dados conforme abaixo.


Quantidade de licitações por tipo de objeto

Une image contenant capture d’écran

Description générée automatiquement

Com isso, foi possível observar que a maioria das licitações estão relacionadas a obras (19,05 %), insumos (17,82 %) e atendimento (17,63 %).

Algumas outras informações que nos pareciam importantes não constavam nos dados recolhidos no portal de dados abertos. Quais foram as empresas participantes? De fato, os arquivos disponibilizados só apresentam as empresas vencedoras das licitações, mas precisamos entender quais foram as que participaram para nos ajudar a ter um entendimento mais aprofundado dos processos. E, por fim, precisaríamos cruzar essas informações com os dados dessas empresas (sócios, endereço, etc.). 

Para esta última finalidade, foi necessário o uso de uma API que busca essas informações a partir do CNPJ das empresas para posteriormente cruzar os bancos de dados.

A busca das empresas participantes representou o maior desafio dessa pesquisa porque não encontramos um local onde estas estão listadas de maneira sistemática. O que percebemos é que podem ser encontradas nas atas oficiais das licitações e estas, por sua vez, podem ser localizadas na plataforma e-negócios da cidade de São Paulo. Com base em uma técnica de Web Scraping que, basicamente, percorria essas atas e identificava números de CNPJ de empresas participantes, foi possível completar nossa base de dados de empresas. Contudo, como essas técnicas de análises ainda estão sendo aprimoradas, não apresentaremos conclusões referentes a elas, mas já que o objeto deste texto e a acessibilidade e transparência de dados públicos, isso não o afetará e estas conclusões serão o foco de um futuro artigo.


Conclusão

10 anos após o início da legiferação brasileira sobre transparência de dados públicos, é fundamental avaliar a qualidade dos dados apresentados pelas esferas políticas. Pelo estudo feito aqui, tomando como base as licitações realizadas pelo Município de São Paulo entre 2005 e 2019, pudemos perceber que a obtenção de certas informações relevantes para análise necessita o entendimento de técnicas de manuseio de dados que não são triviais para um cidadão.

Contudo, também observamos que a variável que pode ser considerada a mais importante de nosso estudo, o valor das licitações, apresenta muitos valores equivocados o que não permite conclusões relevantes a não ser após a realização de uma análise mais aprofundada e demorada. Com isso, podemos realmente nos perguntar.

Até que ponto dados públicos são realmente transparentes e acessíveis à população? Vale a pena ressaltar que a análise foi realizada em um município enorme como São Paulo, com a participação mais importante no PIB brasileiro. O que seria de municípios menores e com estrutura bem mais enxuta? De fato, parece que o país ainda tem muito para caminhar até efetivamente oferecer acesso a seus dados de maneira plural e universal.


Co-autores do artigo: Gabriel Izar, Gustavo Escudeiro, Mariana Nery, Ricardo Muniz

Leia também

16 setembro 2021
Desde o início, o Social Good Brasil buscou o pioneirismo: ao olhar para o que estava acontecendo no...
Ler Mais
16 setembro 2021
O Google é o maior site de buscas do mundo. A ideia veio a Larry Page e Sergey Brin nos anos 1990. Aí...
Ler Mais
10 agosto 2021
As inscrições para o SiSU (Sistema de Seleção Unificado) abriram no início de agosto. O sistema usa...
Ler Mais
28 julho 2021
Desde que iniciei a autoescola e toda a jornada para tirar a CNH, perdi as contas de quantas vezes coletaram...
Ler Mais
20 julho 2021
Eles estão em toda a parte, do despertador do celular ao nosso endereço, RG, CPF e tanto mais: os dados...
Ler Mais

Leia também

Coronavírus e governo digital: o que isso impacta na sua vida?
Como a inteligência de dados contribuiu para diminuir o tempo da fila de adoção de crianças e adolescentes em Santa Catarina
LGPD e Terceiro Setor: desafios e oportunidades
Como dados públicos de estupro no Brasil poderiam auxiliar na definição de locais para Atendimento Especializado a Mulheres

1 comentário

Deixe um comentário

Seu endereço de e-mail não será publicado. Campos obrigatórios estão marcados *

Postar Comentário

Page Reader Press Enter to Read Page Content Out Loud Press Enter to Pause or Restart Reading Page Content Out Loud Press Enter to Stop Reading Page Content Out Loud Screen Reader Support