Allineare l’IA ai valori umani

0

La ricerca di Audrey Lorvo sulla sicurezza dell’IA

1 La ricerca di Audrey Lorvo sulla sicurezza dell’IA
2 Automazione della ricerca e sviluppo dell’IA
3 Impegno nel campo della sicurezza dell’IA
4 Valore dell’interazione umana

Audrey Lorvo, una ricercatrice senior, si dedica allo studio della safety dell’IA, un campo in crescita che mira a garantire che i modelli di intelligenza artificiale sempre più intelligenti siano affidabili e possano apportare benefici all’umanità. Questo settore si concentra su sfide tecniche come la robustezza e l’allineamento dell’IA con i valori umani, oltre a preoccupazioni sociali come la trasparenza e la responsabilità. I professionisti sono anche preoccupati per i potenziali rischi esistenziali associati a strumenti di IA sempre più potenti.

“Assicurarsi che l’IA non venga utilizzata in modo improprio o agisca contrariamente alle nostre intenzioni è sempre più importante man mano che ci avviciniamo all’intelligenza artificiale generale (AGI),” afferma Lorvo, una figura di spicco nel settore. L’AGI descrive il potenziale dell’intelligenza artificiale di eguagliare o superare le capacità cognitive umane.

Automazione della ricerca e sviluppo dell’IA

Presso il MIT Schwarzman College of Computing, Lorvo esamina da vicino come l’IA potrebbe automatizzare i processi e le pratiche di ricerca e sviluppo dell’IA stessa. Come membro di un team dedicato, sta indagando sulle implicazioni sociali ed economiche associate al potenziale dell’IA di accelerare la ricerca su se stessa e su come comunicare efficacemente queste idee e i potenziali impatti a un pubblico generale, inclusi legislatori e consulenti strategici.

Lorvo sottolinea la necessità di valutare criticamente i rapidi progressi dell’IA e le loro implicazioni, garantendo che le organizzazioni abbiano quadri e strategie adeguati per affrontare i rischi. “Dobbiamo assicurarci che gli esseri umani traggano beneficio dall’IA e che non perdiamo il controllo della tecnologia,” afferma. “Dobbiamo fare tutto il possibile per svilupparla in modo sicuro.”

Impegno nel campo della sicurezza dell’IA

La partecipazione di Lorvo a iniziative come il fellowship riflette il suo impegno a comprendere gli aspetti tecnici della sicurezza dell’IA. La fellowship offre opportunità per esaminare la ricerca esistente sull’allineamento dello sviluppo dell’IA con considerazioni sull’impatto umano potenziale. “La fellowship mi ha aiutato a comprendere le domande e le sfide tecniche della sicurezza dell’IA, così posso proporre strategie di governance dell’IA migliori,” afferma. Secondo Lorvo, le aziende all’avanguardia dell’IA continuano a spingere i confini, il che significa che dovremo implementare politiche efficaci che diano priorità alla sicurezza umana senza ostacolare la ricerca.

Valore dell’interazione umana

Quando è arrivata al MIT, Lorvo sapeva di voler intraprendere un percorso di studi che le permettesse di lavorare all’intersezione tra scienza e discipline umanistiche. La varietà di offerte dell’Istituto ha reso le sue scelte difficili, tuttavia. “Ci sono così tanti modi per contribuire a migliorare la qualità della vita per individui e comunità,” dice, “e il MIT offre così tanti percorsi diversi per l’indagine.”

Iniziando con l’economia — una disciplina che apprezza per il suo focus sulla quantificazione dell’impatto — Lorvo ha esplorato matematica, scienze politiche e pianificazione urbana prima di scegliere il Corso 6-14. “Le lezioni di econometria del professore mi hanno aiutato a vedere il valore di concentrarmi sull’economia, mentre gli elementi di data science e computer science mi hanno attratto per la loro capacità di integrare diverse aree di studio,” conclude Lorvo.

Photo: Allegra Boverman

Ricevi le ultime attualità sul mondo tech!