Cariguanjeira
Lapa de bicha grande
Peguei video no reels do Instagram galera.
tiva_patativa_ o perfil
Lapa de bicha grande
Peguei video no reels do Instagram galera.
tiva_patativa_ o perfil
Bom dia, galera! Tudo certinho por ai?
Estou colocando a mão na massa para aprender algumas coisas em ciência de dados e travei numa parte aqui.
Coletei alguns dados públicos de saúde para fazer uma classificação binária, no sentido de praticar mais mesmo. Acontece que após rodar alguns modelos como Random Forest, GBM, e ate mesmo a Regressão Logística, a curva ROC não sai de ~69, mesmo usando Grid Search, o ganho é mínimo. Tentei caçar outras variáveis, mas os dados são escassos, e nada ajuda a aumentar.
Estou trabalhando com reclamações relacionadas a empresas de saúde. Será que o tema em si é complexo? Essa curva seria algo "aceitável"?
Fico agradecido por quaisquer recomendações, seja livros, qqr coisa. Valeus
Hi everyone!
Previously, I shared here that I was working on an initial data science project so I could learn a bit more. I'm a beginner here.
My idea was to find a dataset containing complaints registered with a Brazilian agency. These are complaints filed by clients against a healthcare company.
My goal is to classify the complaints that have a high risk of being assessed as "Unresolved".
I ran some models like Logistic Regression, Random Forest, and LightGBM, but my ROC isn't very strong, it doesn't go above 67.
The database doesn't have many good variables, only gender, sex, reason for complaint, number of clients... is there any way I can get a better ROC or metrics?
I tried using GridSearch, but my dataset is a bit heavy, it has 480k rows (where there are complaints already answered) and 68k complaints that are still awaiting a response (where I want to predict); and it takes a long time in Google Colab.
Não consegui gravar, mas vi quando a aranha deu o bote na mosca.