Iniciar um projeto de ciência de dados é uma coisa. Conduzi-lo com sucesso até a conclusão pode ser algo bem diferente. Por quê? Porque uma variedade de problemas – alguns de natureza técnica, outros decorrentes de desafios de colaboração – pode fazer com que até as iniciativas de ciência de dados mais bem planejadas saiam dos trilhos.
O sucesso em ciência de dados depende, em parte, da capacidade de antecipar esses desafios e planejar como lidar com eles. Nesse sentido, veja a seguir sete causas comuns de fracasso em projetos de ciência de dados, além de dicas para evitar que esses obstáculos comprometam sua próxima iniciativa.
1. Dados de baixa qualidade
Problemas de qualidade de dados, como dados incompletos, inconsistentes ou redundantes, estão entre os desafios mais conhecidos em projetos de ciência de dados. Assim, vale reforçar: é impossível exagerar na importância de garantir a qualidade dos dados como primeiro passo em qualquer projeto que dependa da capacidade de processar, analisar e transformar informações.
Também é importante destacar que o fato de os dados apresentarem baixa qualidade no início de um projeto não significa que ele esteja fadado ao fracasso. Existem diversas técnicas eficazes para melhorar a qualidade dos dados, como limpeza e padronização. Quando projetos fracassam, geralmente não é porque os dados eram irrecuperáveis, mas porque a qualidade não foi devidamente avaliada e aprimorada quando necessário.
2. Não saber onde os dados estão
Outro desafio comum é não saber exatamente onde os dados estão armazenados. Grandes organizações podem possuir centenas de ativos de dados distribuídos por infraestruturas de TI amplas e complexas. A menos que contem com um catálogo de dados detalhado e continuamente atualizado que rastreie todos esses ativos, o que muitas não têm, apenas localizar as informações necessárias para um projeto pode se tornar um grande obstáculo.
Mas existem ferramentas e técnicas que ajudam a superar essa dificuldade. A principal solução é o uso de softwares de descoberta de dados, capazes de identificar automaticamente recursos de dados, inclusive aqueles que não estão documentados.
3. Dados de difícil acesso
Às vezes, você sabe onde os dados estão, mas enfrenta dificuldades para acessá-los. Isso pode ocorrer porque os dados residem em um sistema legado mal documentado ou que já não recebe suporte ativo. Ou ainda porque estão formatados de maneira que dificulta sua leitura ou processamento.
São desafios que podem ser superados, desde que sejam considerados desde o início do projeto e que os recursos necessários sejam alocados para resolvê-los. Por exemplo, pode ser preciso contar com especialistas que compreendam sistemas legados e consigam liberar o acesso aos dados armazenados neles.
4. Falta de objetivos claros
Até aqui, falamos de desafios técnicos. Agora, vamos abordar questões organizacionais ou comportamentais, começando por uma armadilha comum: a falta de objetivos claros.
Com frequência, empresas decidem que querem fazer algo com seus dados, mas não sabem exatamente o quê. Por exemplo, podem estabelecer um objetivo amplo, como usar insights derivados de dados para aumentar a receita, sem definir quais desafios específicos relacionados à receita desejam resolver com apoio dos dados.
Evitar esse erro é simples: é preciso definir entregáveis e resultados claros desde o início do projeto. Sempre haverá espaço para ajustes ao longo do caminho, mas os objetivos gerais devem estar bem definidos desde o começo.
5. Falta de colaboração entre TI e negócios
Existem dois stakeholders principais em qualquer projeto de ciência de dados: a área de TI, responsável por gerenciar os ativos de dados, e as áreas de negócios, que definem o que o projeto deve alcançar.
Infelizmente, a falta de colaboração entre esses grupos pode levar ao fracasso. Por exemplo, a TI pode impor restrições de acesso aos dados sem consultar os negócios, criando situações em que a empresa não consegue usar os dados como pretendia. Ou, por outro lado, a ausência de direcionamento claro por parte dos negócios pode dificultar que a TI compreenda como disponibilizar os recursos necessários para sustentar o projeto.
6. Roadmaps inflexíveis
Em projetos de ciência de dados de qualquer porte ou complexidade, problemas inevitavelmente surgirão, por mais cuidadoso que seja o planejamento. A equipe pode se deparar com questões inesperadas de qualidade de dados ou descobrir que faltam informações essenciais.
Resolver esses desafios exige flexibilidade para ajustar o plano original. Isso não significa abandonar metas ou métodos, mas sim adaptar-se às circunstâncias. Caso contrário, um planejamento rígido pode se tornar o maior inimigo do sucesso do projeto.
7. Compreensão equivocada dos objetivos da ciência de dados
Por fim, um desafio importante que pode comprometer o sucesso de um projeto é não compreender corretamente quais são os objetivos da ciência de dados e quais metodologias e recursos ela exige.
Por exemplo, uma empresa pode decidir que deseja adotar tecnologia de IA. A ciência de dados pode ser um caminho para isso, caso a organização opte por treinar ou customizar seu próprio modelo e invista na infraestrutura e nas ferramentas de gestão de dados necessárias para sustentar esse processo.
Mas, se o objetivo for simplesmente adotar uma aplicação ou serviço de IA de terceiros, a ciência de dados pode não ser necessária. É um uso incorreto do termo sugerir que tudo o que envolve dados seja, automaticamente, ciência de dados.
Em outras palavras: seu projeto de ciência de dados só terá sucesso se for, de fato, um projeto de ciência de dados. Caso contrário, você pode acabar investindo em ferramentas, recursos e processos que não trarão resultados, simplesmente porque não são a solução adequada para o seu objetivo.
Conclusão: como garantir o sucesso em projetos de ciência de dados
Não existe um truque simples ou fórmula mágica que garanta o sucesso de um projeto de ciência de dados. No entanto, práticas como a gestão cuidadosa da qualidade e do acesso aos dados, a definição de objetivos claros e a adoção de uma abordagem flexível aumentam significativamente as chances de êxito.

