
Os dados abertos de CNPJ da Receita são uma mina pra prospecção B2B e quase ninguém usa. Carreguei os 60M de empresas num SQLite local e filtrei pro meu nicho
Fala galera,
Faço um micro-SaaS de recepcionista IA pra clínicas e dentistas. Meu eterno problema sempre foi lead bom e barato. Raspar Google Maps até funciona, mas trava fácil em 100-120 resultados por busca e a qualidade cai rápido.
Aí resolvi testar uma coisa que tava olhando há um tempo: baixei o dump inteiro de dados abertos da Receita Federal (aquele de ~7GB, snapshot mensal da base toda de PJ do Brasil). Filtrei por CNAE de saúde, joguei num SQLite local e sobrou 964 mil clínicas ativas. Com dados que o Maps nunca te dá: CNAE detalhado, porte da empresa, se é MEI, situação cadastral etc.
Stack bem simples pra quem curte: Node + sqlite nativo (zero dependência extra), e usei unzip -p em streaming pra nem descompactar o CSV gigante no disco. Roda lisinho no MacBook em poucos minutos.
O insight que mais me surpreendeu: o email que vem na base da Receita é quase sempre gmail ou hotmail. No começo eu ia descartar tudo como "lixo". Mas na prática é o contrário — na maioria das vezes é o dono da clínica mesmo que cadastrou. E dono responde MUITO melhor que email institucional.
O que realmente é lixo são os emails de contabilidade/assessoria (tipo "xxx.assessoria.contabil@gmail.com", "contabilidade.xxx@gmail.com" etc). Filtrei isso e uns 81% da base virou contato aproveitável.
Ainda tô no começo de rodar isso de verdade no funil, mas já mudou completamente o jogo pra mim.
Alguém mais aqui já usou os dados da Receita pra aquisição de clientes? Qual CNAE ou nicho vocês exploram com isso? Quero muito ver como o pessoal tá usando e quais foram os resultados (bons e ruins).
Valeu!