u/FingerHuman7407

Questo weekend ho voluto fare un esperimento: ho un Lenovo da gaming del 2018 sul quale ho installato Arch (btw) dal momento che non supporta W11 e con W10 va sempre più lento (lascio le spec nello screenshot allegato al post).

Ho pensato di installare LM Studio per provare qualche modello in locale, immaginando che dal momento che è troppo vecchio non ne avrei ricavato chissà che, e invece sono rimasto piacevolmente sorpreso.

Ci ho messo su un gemma4-e4b e gli ho chiesto di generarmi un JSON con dei dati anagrafici: all'inizio ci ha messo un minuto abbondante e pensavo che era già tanto, ma poi dopo un po' di tweak su context window e offloading della GPU sono arrivato ad ottenere lo stesso risultato in 32 secondi con la bellezza di 24 token al secondo, direi non male per un pc del 2018.

Qualcuno ha provato a spremere del vecchio hardware con gli LLM locali? Mi piacerebbe sapere i vostri risultati

https://preview.redd.it/c8fcdu1ok2zg1.jpg?width=484&format=pjpg&auto=webp&s=f5e079c44d6194aa1688856b7691407a35afb100

reddit.com
u/FingerHuman7407 — 18 days ago