domenica, 8 Febbraio 2026
HomeTecnologia e ScienzeChatgpt4.5 supera la soglia del test di Turing

Chatgpt4.5 supera la soglia del test di Turing

Nel 1950, Alan Turing propose un metodo semplice ma profondamente impegnativo per determinare se le macchine potessero essere considerate capaci di “pensare”. Conosciuto come il Test di Turing, questo criterio di intelligenza artificiale mette in competizione umani e macchine in una sfida conversazionale, spingendo i giudici umani a distinguere tra intelligenza artificiale e genuina attraverso interazioni testuali.

Nonostante numerosi tentativi, nessun sistema artificiale era mai riuscito a superare in modo convincente questo test. Fino ad ora. Cameron Jones e Benjamin Bergen dell’Università della California, San Diego, hanno raccolto per la prima volta prove empiriche che il GPT-4.5 di OpenAI, un sofisticato modello di linguaggio di grandi dimensioni (LLM), ha superato con successo il Test di Turing. Non solo GPT-4.5 ha superato il test, ma in condizioni specifiche ha superato i suoi omologhi umani nel convincere i partecipanti della sua umanità.

Il lavoro ha implicazioni significative per la società, l’etica e la comprensione dell’intelligenza stessa da parte dell’umanità.

Umano contro macchina

Il Test di Turing mette un interrogatore contro due partner conversazionali — uno umano e uno macchina — coinvolgendoli entrambi simultaneamente tramite testo. Il compito dell’interrogatore è semplice: decidere quale partner conversazionale è umano. Ma nonostante i rapidi progressi nella linguistica computazionale e nell’apprendimento automatico, i sistemi di intelligenza artificiale hanno costantemente fallito questa sfida apparentemente semplice.

Per eseguire il test, Jones e Bergen hanno reclutato 284 partecipanti da background diversi, inclusi studenti universitari e lavoratori crowd-sourced pagati da Prolific, una società tecnologica che impiega umani per partecipare a esperimenti legati all’IA.

I ricercatori hanno messo a confronto diversi modelli di intelligenza artificiale contemporanei con gli umani — inclusi GPT-4o, LLaMa-3.1-405B e GPT-4.5. Interessantemente, GPT-4.5 è emerso come vincitore ma solo quando istruito ad adottare una “persona umana”. In quelle conversazioni, GPT-4.5 è stato giudicato come umano nel 73% dei casi: significativamente più spesso di quanto gli interrogatori abbiano selezionato il vero partecipante umano, affermano Jones e Bergen, evidenziando un notevole cambiamento nella capacità dell’IA di emulare la conversazione umana.

I ricercatori hanno anche utilizzato un vecchio chatbot basato su regole chiamato ELIZA per generare testo e questo è stato prontamente identificato come macchina dai giudici. Allo stesso modo, GPT-4o, un modello di generazione precedente, ha anche significativamente sottoperformato, scelto come umano solo nel 21% dei casi. “I risultati costituiscono la prima prova empirica che un sistema artificiale supera un test di Turing standard a tre parti”, affermano Jones e Bergen.

Jones e Bergen attribuiscono parte del successo di GPT-4.5 alla cura nella creazione di prompt progettati per guidare il modello nell’adottare una persona che gli umani trovano relazionabile e convincente — specificamente, una persona di un giovane introverso fluente nello slang e nella cultura di internet. La capacità di GPT-4.5 di fare ciò, affermano i ricercatori, dimostra un comando sfumato sui modelli linguistici e sulle sottigliezze interattive precedentemente ritenute unicamente umane.

 

Fonte: Discovery Technology

Per saperne di più

Julie Maddaloni
Julie Maddaloni
Ciao! Sono una blogger appassionata di tecnologia e delle news dei mondi Apple e Android. Amo scoprire le ultime novità del settore e condividere storie e consigli utili con chi, come me, è sempre alla ricerca delle ultime novità. Quando non sono immersa tra recensioni e aggiornamenti tech, mi rilasso con una buona pizza e una maratona di serie TV! 🍕📱💙
TI POTREBBERO INTERESSARE

ARTICOLI CONSIGLIATI

Scoperta una nuova fase della materia tra solido e...

Quando si parla di nuove fasi della materia, la prima reazione è spesso di scetticismo. Abbiamo già solide, liquidi, gas, plasma… serve davvero aggiungerne un’altra? In questo caso sì, perché non si tratta di una definizione teorica, ma di una fase osservata sperimentalmente che sfugge alle categorie classiche.La notizia arriva da una ricerca recente che mostra come, in condizioni precise, la materia possa stabilizzarsi in uno stato che non è né solido né liquido, ma qualcosa di strutturalmente ordinato e allo stesso tempo capace di fluire.
Fusione Nucleare

I fisici della fusione hanno trovato un modo per...

La fusione nucleare è forse la frontiera più ambiziosa della ricerca energetica moderna: replicare sulla Terra quello che accade nel cuore del Sole, fondendo...
L'origine della vita sulla Terra potrebbe essere molto più semplice di quanto si pensasse

L’origine della vita sulla Terra potrebbe essere molto più...

Per anni ci siamo raccontati che la nascita della vita sulla Terra fosse il risultato di una combinazione quasi miracolosa di eventi: condizioni rarissime, ambienti estremi, reazioni chimiche difficilissime da replicare. Una storia affascinante, certo, ma anche comoda. Più la vita sembra improbabile, più ci sentiamo speciali. E se non fosse andata così?Una recente ricerca scientifica rimette in discussione questa narrativa e propone un’idea decisamente più sobria, quasi disarmante: la vita potrebbe essere emersa grazie a processi chimici semplici, comuni e ripetibili, in ambienti tutt’altro che eccezionali della Terra primordiale.
Satelliti Starlink

SpaceX vuole portare l’IA nello spazio con un milione...

C’è una cifra che, appena la leggi, ti costringe a rileggere due volte: un milione di satelliti. Non è un titolo acchiappa-click buttato lì. È l’idea che SpaceX avrebbe messo sul tavolo con un dossier indirizzato alla Federal Communications Commission: creare una costellazione gigantesca di satelliti “data center”, alimentati dal Sole, per spostare una parte del calcolo dell’IA fuori dalla Terra.