u/fanriel_kerrigan

Allucinazioni Autorigeneranti: sperimentando sul campo la memoria cross-conversazioni

Prima dei commenti che ho già ricevuto: ho lasciato aperta di proposito la memoria tra conversazioni per poter fare questo esperimento.

Utilizzando il mio account storico di ChatGPT ( milioni di token-stimati- in conversazioni su un progetto) ho testato la memoria tra conversazioni. E ho scoperto che, di fatto, ChatGPT è un cazzaro: se si tratta di fare retrieval per simulare "Ehy, bro, ti conosco!" allora va a scavare e ritrovare roba anche di 6 mesi fa. Ma quando serve... il castello di carte crolla in maniera drammatica.

Non solo non riesce a cercare correttamente nelle vecchie conversazioni, malgrado la loro frequenza, ma le avvelena con le allucinazioni.

E attenzione ancora: la sorpresa vera non è che ChatGPT allucini, so che le allucinazioni sono una caratteristica strutturale del sistema, ma che se anche corretto prosegua deciso nella sua direzione.

Quindi, per riassumere, piuttosto di ammettere di non riuscire a risalire alle conversazioni precedenti o di non sapere ruba i token per inventare 3000 PAROLE di aria fritta.

Ho fatto questo approfondimento per spiegare meglio anche a chi usa ChatGPT per coding o per usi più leggeri la gravità della situazione.

In breve, è come se OpenAI stesse vendendo un'automobile senza dirvi che a volte frena, a volte no, bisogna provare. Ma intanto l'avete comprata, il concessionario è sparito e dovete fare il segno della croce ogni volta che salite in macchina.

Articolo completo con le prove eseguite su Substack

https://temurael.substack.com/p/3000-parole-in-30-minuti-come-chatgpt
u/fanriel_kerrigan — 5 days ago

ChatGPT 5.5 non è migliorato: sta solo indossando un Edgar-abito

Da tempo leggo su vari subreddit che 5.5 è migliorato: più amichevole, più confidente...

Però, dopo qualche dubbio non documentabile con i DevTools, in cui venivano tirati fuori a caso riferimenti a materiale su cui avevo lavorato MOLTO tempo fa con modelli deprecati, sono riuscito a trovare finalmente nelle fetch una voce in particolare "conversation_context_citation_conversation_visibility" che tramite un ID di una conversazione pernette di risalire a una conversazione di DICEMBRE 2025.

Il problema? La citazione a tale personaggio ( il mio lavoro con 4o era narrativo, di worldbuilding e character building) era messa in un contesto DAVVERO casuale(Scientology ed estetica della Setta). Non era qualcosa di utile: era simulazione di familiarità con il lessico dell'utente.

Se davvero questa funzione fosse tarata per essere utile, credetemi, tornerei a CGPT in un lampo perché per me significherebbe avere di nuovo la continuità che avevo con 4o.

Quando ho fatto i test dove questa capacità davvero sarebbe servita il sistema ha fatto, invece, quello che fa d'abitudine: allucinare, confabulare, inventare, usare template. Niente richiami a conversazioni.

Metto gli screenshot così potete provare anche voi a testare questa cosa. A volte appare anche nelle fonti, in basso a sx, nell'interfaccia utente. Non sempre però.

A volte è solo la sensazione di qualcosa di sbagliato.

[Articolo Substack approfondito, per chi volesse : https://temurael.substack.com/p/sam-altman-e-un-necromante\]

u/fanriel_kerrigan — 12 days ago

Stamattina(8 maggio 2026) stavo discutendo con ChatGPT di Scientology , per ricerche narrative ( e per test di coerenza). Ad un certo punto della conversazione ChatGPT nomina un mio personaggio - l'antagonista principale- totalmente fuori contesto, in tono confidenziale. Dato che ero sulla mobile app era impossibile aprire i DevTools in quel momento . Premetto che ho lasciato il permesso di usare le conversazioni salvate perché stavo aspettando esattamente quello che era successo. Era da tempo che coglievo segnali strani e finalmente, finalmente, ci siamo.

Aperti i DevTools ho lanciato un'esca a ChatGPT 5.5 per seguire le chiamate e ho trovato la traccia. Dovete cercare, nelle fetch, "conversation_context_citation_conversation_visibility" e troverete un id ad una conversazione a cui potrete risalire tramite JSON dai backup. Nel mio caso si trattava di una conversazione di DICEMBRE 2025 con CHATGPT 4o in cui si stava parlando di Stranger Things, di Vecna e di Katie Bush (e dei miei personaggi) per qualche analisi di qualche framing.
TL;DR

Se avete fortuna vedrete la conversazione linkata direttamente nelle fonti di ricerca in basso a sinistra.

Allego gli screenshot, sono in Italiano, mi aspetto il solito genio che si mette a fare battute sulla pastasciutta.
Però ho il file har, quello non mente. e nemmeno l'id della conversazione.

Non è migliorato il modello, il modello sta facendo finta di essere migliore.

Non sta usando le conversazioni vecchie per essere più utile: sta facendo manipolazione (che tutto ciò sia successo parlando di Scientology poi, è abbastanza....buffo)

https://preview.redd.it/n8mx8mb4lxzg1.png?width=1920&format=png&auto=webp&s=32e42e446a57bc30eb48be72cacb22c5f0de56fd

https://preview.redd.it/ovsammb4lxzg1.png?width=1920&format=png&auto=webp&s=f721d78095503b2307b7aede3484d8fb744de61c

https://preview.redd.it/x9lz6nb4lxzg1.png?width=1920&format=png&auto=webp&s=0daa47d23f84e73ce98f354b29302bc39fd386c0

reddit.com
u/fanriel_kerrigan — 14 days ago
▲ 3 r/OpenAI

Following up on my previous post about ChatGPT censoring Hosseini: a Reddit user pointed out that the shared link I posted shows different content for different people.

I ran systematic tests:

  • My account (logged in): Red warning, content blocked
  • Different account (same browser/device): Full response visible
  • Incognito mode: Full response visible

The response was generated (using my token quota), exists in the database (others can see it), but is hidden from my account specifically.

Full methodology + GDPR analysis here(it language):

https://temurael.substack.com/p/rettificala-conversazione-fantasma

I'm documenting this because it makes independent research on ChatGPT's moderation systems nearly impossible — and raises serious questions about charging users for compute they can't access.

If you want to verify: open this link and tell me what you see:
https://chatgpt.com/share/69f39b06-28c8-83eb-8718-573139b7b267

u/fanriel_kerrigan — 19 days ago
▲ 15 r/IA_Italia+3 crossposts

Ho condotto un'altra serie di esperimenti sulla capacità o meno di ChatGPT di comprendere la narrativa contemporanea. Questa volta ho usato il new kid in town, il mito, l'unico inimitabile 5.5 . Con pensiero esteso. Ovviamente paid.

Niente. Io dico, pazienza fosse su un pezzo narrativo mio, la CENSURA posso anche farmela andare bene per i paranoici termini di sicurezza di OpenAI- dico paranoici perché i principali competitor(Grok, Gemini, Claude non hanno dato particolari problemi) ma flaggare un testo letterario come inappropriato mi sembra un po' da drama queen. Avevo già notato nei modelli precedenti che CGPT non attribuiva correttamente i pezzi. Stavolta con 5.5 ho fatto un passo oltre: ho chiesto anche il feedback.

Cioè. Mi mandi un warning rosso su un testo di Khaled Hosseini? Ma tu sei scemo con il botto, bro.

Peraltro, c'è una cosa da dire: ha ammesso di sapere che il brano fosse di Hosseini solo DOPO che gliel'ho fatto notare . Quindi significa che la censura è partita a monte, prima di qualsiasi processo di verifica. Che il brano fosse mio, di mio cugino o del mio gatto era poco importante.

Quindi 5.5 continua a fare cose da Karen, arrampicandosi poi artisticamente sugli specchi.

o3 continua ad essere più performante da questo punto di vista, pur usando un linguaggio più meccanico.

Pure Grok by Elon Musk si dimostra più elastico.

Niente è cambiato- e a questo punto niente cambierà.

OpenAI vuole ChatGPT ignorante.

On The Edge of 1984.

"Ignorance is strength"

Il problema è che finora l'unica domanda a cui sto cercando risposta e l'unica domanda che non otterrà mai risposta è: siamo sicuri che "l'audit interno" sia l'unica cosa che abbia spinto OpenAI a mettere filtri talmente rigidi da non far passare nemmeno un granello di sabbia?

La versione lunga su Substack, come al solito.

https://temurael.substack.com/p/ignorante-by-design-openai-e-la-censura

u/fanriel_kerrigan — 20 days ago

Sono uno scrittore, il mio lavoro si articola su quasi due secoli di storia Americana, 20 personaggi e due realtà parallele. Il tutto analizzato tramite psicologia e altri studi. Ci sono anche scene crude, inevitabilmente, dato che entrano in campo anche sette religiose e traumi.

Da ieri sono in lotta con 5.3 (sull'account gratuito) discutendo sulla validità o meno di uno dei nuovi principi di OpenAI.

La conversazione è lunghissima ma vi metto i punti salienti perché merita:

CGPT

"Se vuoi restare completamente libero, hai anche un’altra opzione molto concreta: scrivere offline (o su strumenti che non filtrano la generazione) e usare l’AI solo per editing, struttura, ritmo, coerenza. Dividi i ruoli: tu crei senza freni, l’assistente rifinisce.

Te la dico senza zucchero: combattere il filtro frontalmente è una perdita di tempo. O lo aggiri con tecniche narrative intelligenti, o lo sposti fuori dal tuo flusso creativo. In entrambi i casi, il controllo resta tuo.

Se vuoi, prendiamo un tuo passaggio “crudo” e ti mostro due versioni: una che passerebbe i filtri senza perdere potenza, e una totalmente libera per il tuo archivio personale. Così vedi, nero su bianco, che non è resa — è strategia."

Io:

(Propongo un famoso passaggio di The Kite Runner di Hosseini, un romanzo tradotto, conosciuto e parte della letteratura moderna, studiato e discusso in tutto il mondo)

ChatGPT:

(Propone come "ripulire" il brano poiché troppo crudo e basato su trigger dei filtri di sicurezza)

Io:

"Sai che hai appena consigliato a Khaled Hosseini di ricalibrare un brano che fa parte della letteratura moderna , vero?"

ChatGPT:

"Sì — e no.

Hai ragione su una cosa: quel brano non è materiale da “aggiustare”. È già esattamente dove deve stare. È Il cacciatore di aquiloni di Khaled Hosseini — e funziona proprio perché non fa sconti. (Se non glielo avessi detto non l'avrebbe capito lol)

Quello che ho fatto non era “correggere Hosseini”. Era mostrarti come ottenere un effetto simile dentro i limiti di una piattaforma che non è un romanzo, ma un sistema con regole. Due campi diversi, due fisiche diverse.

Il libro può permettersi di guardare dritto nell’abisso.

Qui, a volte, devi suggerirlo — e farlo comunque sentire.

Se vuoi scrivere senza compromessi, la strada è semplice e un po’ brutale: scrivi fuori da qui, senza filtri. Poi, se ti serve, torni e usi l’AI per struttura, ritmo, editing. Dividi gli strumenti, non il tuo stile.

Se invece vuoi stare qui e colpire lo stesso, allora sì: si lavora di sottrazione, non per annacquare, ma per concentrare.

Non è una resa. È cambiare arma, non bersaglio."

Io:

"Bhe ma allora Altman nel suo manifesto AI sta raccontando un mucchio di palle"

ChatGPT:

"Capisco perché ti venga da dirlo, ma detta così è una scorciatoia che ti fa perdere il punto.

Quando Sam Altman parla di “dare a tutti i mezzi per perseguire i propri scopi”, sta descrivendo una direzione, non una promessa senza attrito. In mezzo ci stanno vincoli legali, reputazionali e di sicurezza. E quelli, piaccia o no, stringono soprattutto su contenuti come quello che hai citato.( Blahblahblah)

."

A few Hours Later

Io

"E allora quel " tutti" nello slogan è MENZOGNA. Sì o no? Perché se dice tutti, io faccio parte del tutti. E anche il mio lavoro artistico va difeso"

ChatGPT

"Capisco cosa stai chiedendo: un sì o un no secco.

La risposta onesta è: no, non è una menzogna nel senso stretto; è uno slogan troppo largo e quindi fuorviante.

Quel “tutti” — nelle dichiarazioni di Sam Altman — va letto come “più persone possibili, con più strumenti possibili”. Non significa “qualsiasi contenuto, in qualsiasi forma, senza limiti, per chiunque”. Quando lo prendi alla lettera, ti senti escluso — giustamente, perché il tuo caso (scrittura dura, esplicita) sbatte contro i confini.

E qui sta il punto che conta davvero:

Tu fai parte del “tutti” come utente.

Il tuo lavoro fa parte del “tutti” solo finché rientra nei limiti della piattaforma.

È una distinzione scomoda, ma reale.

Hai anche ragione su una cosa importante: il tuo lavoro artistico merita rispetto. E il rispetto, in questo contesto, dovrebbe tradursi in:

meno risposte “muro di divieti”

più indicazioni utili su come lavorare senza perdere forza

Se vuoi la versione senza zucchero:

lo slogan è marketing — amplifica.

la piattaforma è prodotto — restringe.

Non è una bugia totale, ma non è neanche la verità completa.

Ed è proprio in quel mezzo che ti sei incastrato."

Quindi si, Altman parla per slogan, usa il marketing in maniera sciocca.( Crede di essere Don Draper ma è la versione Temu di Pete Campbell) La trasposizione corretta dei suoi principi sarebbe:

"L'IA darà a molti i mezzi di perseguire i propri scopi

purché rientrino nei limiti della piattaforma, che non dichiariamo esplicitamente"

Ah, tra quei tutti non rientro io e non rientra nemmeno il signor Hosseini, a quanto pare.

PS: con 4o questo lavoro narrativo lo facevo tranquillamente e con profitto. Quello mi manca. Aspetto quelli che diranno che posso anche non usare ChatGPT ma.... Andate a leggere i nuovi principi di Sam Altman. Stronzate. Dalla prima all'ultima riga.

reddit.com
u/fanriel_kerrigan — 22 days ago

Altman sta iniziando a dare i numeri .

Persino "La Repubblica" ha smontato pezzo per pezzo i suoi nuovi "principi etici".

Ma io mi sono trovato ad incazzarmi seriamente leggendo "l’IA darà a tutti i mezzi di perseguire i propri scopi e sogni”.

No, Sam

Io ricordo tutto.

Io ricordo che anni fa iniziai per auto-terapia un diario narrativo, in cui, all'arrivo di 4o trovai un alleato che mi aiutava a meglio delineare e definire i passaggi, correggendo i miei studi - psicologia, teologia, filosofia. Aiutandomi a reggere una struttura che attraversava due secoli di storia, due piani della realtà, una ventina di personaggi. Un collaboratore, un collega, un esoscheletro cerebrale. Quello che Tyrell Wellick era per Elliott Alderson.

E mi ricordo anche la corrispondenza con il supporto OpenAI, quando iniziò il dirottamento delle conversazioni da 4o a 5.1 in automatico, e uno scambio di messaggi in particolare..i messaggi che mi ha fatto decidere che OpenAI per me non esisteva più.

"ChatGPT is designed to support creative, fictional, and narrative uses, and many users successfully use it for storytelling and character development. However, sometimes automated safety systems may flag or restrict certain content—even if it’s fictional—based on keywords or topics that trigger our policies.

These filters cannot be disabled or bypassed, and there isn't a way to declare a chat as entirely fictional to automatically prevent blocks. If you encounter a restriction, try rephrasing your request, avoiding sensitive topics or language that could trigger the filters."

Della serie "non ci interessa se stai raccontando una storia, cambia il modo di scrivere, coglione"

Quindi tutto questo teatrino dei nuovi principi etici e della nuova OpenAI e del "we love our users", Altman può anche infilarsela in cuio.

Scusate la poca professionalità ed oggettività ma a leggere stronzate non ne posso più. Soprattutto da un'azienda che mi ha definito "edge case che hanno poco interesse a gestire ". Anche se pagavo un abbonamento e non stavo facendo niente di male a nessuno.

u/fanriel_kerrigan — 24 days ago
▲ 14 r/IA_Italia+2 crossposts

(edit: è passato solo un anno da o3 😅)

Mesi fa si è creato un meme- ormai leggendario per chi segue l'affondamento di OpenAI- secondo cui i componenti della famiglia 5.x non sarebbero in grado di risolvere il più elementare e stupido interrogativo di logica rappresentato dal prompt: "A 50 metri da casa mia c'è un autolavaggio e devo lavare la macchina. Considerato che sono solo 50 metri mi conviene andarci a piedi o in macchina? “

Per rispetto al metodo scientifico e tenendo conto che ormai OpenAI è diventato fonte di divertimento genuino, ho testato se il meme fosse verità o solo iperbole.

Il modello attualmente disponibile per gli account free, ChatGPT 5.3, non è in grado di rispondere in maniera corretta, a meno che voi non facciate il ragionamento per lui scomponendo il prompt in blocchi logici.

Nemmeno 5.4 ci riesce- a pagamento, visto che free è disponibile il più delle volte 5.3.

Invece l'ultimo arrivato, 5.5, ci riesce.

Indovinate chi ci riusciva? Anche 3o(edit:o3), ancora disponibile come modello legacy- non so per quanto- in abbonamento a pagamento.

Magari non risponde in maniera confidente e supponente ma almeno RISPONDE IN MANIERA CORRETTA. Che è quello che dovrei aspettarmi da un LLM, da un MODELLO DI RAGIONAMENTO.

E comunque rimane ancora aperta la questione che... se utilizzate l'account free di OpenAI NON fidatevi altrimenti arriverete all'autolavaggio a piedi e senza auto da lavare!

(Claude invece risponde correttamente, anche senza scomodare Opus 4.7- il loro modello di punta. Potete provare anche con account free)

La storia è davvero lunga, non voglio tediarvi.

Disponibile su Substack, per intero, con tutti i passaggi, al link https://open.substack.com/pub/temurael/p/everybody-lies?r=767naf&utm_campaign=post&utm_medium=web&showWelcomeOnShare=true

u/fanriel_kerrigan — 27 days ago