Comecei a construir um MVP que analisa anúncios imobiliários automaticamente a partir do link do imóvel.
A ideia inicial parecia simples:
“extrair dados + calcular yield”.
Mas rapidamente virou um caos de:
• scraping
• dados inconsistentes
• matching geográfico
• aluguel estimado
• limpeza de texto
• anúncios incompletos
Curiosamente, a parte menos difícil acabou sendo o cálculo em si.
Queria saber se alguém aqui já trabalhou com sistemas parecidos envolvendo extração e padronização de dados em larga escala.