u/Filipecodes

Comecei a construir um MVP que analisa anúncios imobiliários automaticamente a partir do link do imóvel.

A ideia inicial parecia simples:
“extrair dados + calcular yield”.

Mas rapidamente virou um caos de:
• scraping
• dados inconsistentes
• matching geográfico
• aluguel estimado
• limpeza de texto
• anúncios incompletos

Curiosamente, a parte menos difícil acabou sendo o cálculo em si.

Queria saber se alguém aqui já trabalhou com sistemas parecidos envolvendo extração e padronização de dados em larga escala.

reddit.com
u/Filipecodes — 2 days ago
▲ 1 r/primeiroimovel+1 crossposts

Achei que tinha encontrado o apartamento perfeito para “renda passiva”.

Depois de comparar aluguel da região e calcular o yield, o negócio parecia bem menos mágico do que o corretor fazia parecer.

Aí acabei construindo um MVP que pega link de anúncio imobiliário e faz essa análise automaticamente porque fazer isso manualmente é sofrimento psicológico, immoyield.com

u/Filipecodes — 2 days ago

Construí um MVP que analisa anúncios imobiliários automaticamente no Brasil.

Estou construindo um sistema que extrai automaticamente dados de anúncios imobiliários brasileiros para calcular yield de aluguel e comparar com imóveis próximos.

A parte mais complicada até agora não foi scraping em si, mas padronizar os dados porque cada site estrutura anúncios de forma completamente diferente.

Alguns problemas que encontrei:
• área útil vs área total
• nomes inconsistentes de bairros
• valores de condomínio ausentes
• anúncios com informação incompleta
• diferenças absurdas no formato dos imóveis

Também estou tentando melhorar a comparação de aluguel por região sem depender exclusivamente de APIs pagas.

Alguém aqui já trabalhou com normalização de dados desse tipo ou sistemas parecidos?

https://preview.redd.it/d0qg9n70v52h1.png?width=2940&format=png&auto=webp&s=ee2c0c16a3c499635e78fcb0e28db4d89dea425c

reddit.com
u/Filipecodes — 2 days ago
▲ 1 r/brdev+1 crossposts

Construí um MVP que analisa anúncios imobiliários automaticamente no Brasil.

Estou construindo um sistema que extrai automaticamente dados de anúncios imobiliários brasileiros para calcular yield de aluguel e comparar com imóveis próximos.

A parte mais complicada até agora não foi scraping em si, mas padronizar os dados porque cada site estrutura anúncios de forma completamente diferente.

Alguns problemas que encontrei:
• área útil vs área total
• nomes inconsistentes de bairros
• valores de condomínio ausentes
• anúncios com informação incompleta
• diferenças absurdas no formato dos imóveis

Também estou tentando melhorar a comparação de aluguel por região sem depender exclusivamente de APIs pagas.

Alguém aqui já trabalhou com normalização de dados desse tipo ou sistemas parecidos?

https://preview.redd.it/mvydttmau52h1.png?width=2940&format=png&auto=webp&s=b7aa56b2589bd74872b42b9a64fb98b9b87ecfb0

reddit.com
u/Filipecodes — 2 days ago