Il progresso delle reti neurali negli ultimi anni è stato significativo, a partire dallo sviluppo iniziale di trasformatori generativi pre-addestrati. Con il continuo miglioramento delle schede grafiche e dei Tensor Core di NVIDIA, le capacità di queste reti sono notevolmente aumentate. In passato, queste reti venivano utilizzate principalmente per input basati su testo, ma ora NVIDIA ha incorporato TensorRT per il deep learning e l’elaborazione audio. Durante due dimostrazioni interattive con la tecnologia AI Inworld alla GDC 2024, abbiamo potuto testare le capacità sia dei NEO NPC di Ubisoft che del Covert Protocol di NVIDIA.
Chiedi a qualsiasi DM che abbia condotto una sessione di Dungeons & Dragons a cui ho partecipato negli ultimi dieci anni: l’aspetto più divertente è superare i limiti della campagna (e la propria bussola morale). In entrambe le demo, mi è stato dato il pieno controllo dell’esperienza tramite comandi vocali, mentre il mio gestore osservava da bordocampo, eventualmente prendendo appunti o valutando se terminare la sessione. Quando ho potuto provare il programma NEO NPC di Ubisoft, avevo già consumato la mia seconda tazza di caffè prima delle 10:00 ed ero pieno di idee classificate PG-13.
Durante la mia esperienza pratica con la dimostrazione Inworld di Ubisoft Paris, ho avuto l’opportunità di testare la potente combinazione dell’AI Character Engine di Inworld e delle animazioni facciali automatiche Audio2Face di NVIDIA. Il concetto di “autenticità” è stato enfatizzato più volte durante la mia sessione e ho scoperto che era per lo più accurato. Gli sviluppatori avevano avuto cura di mantenere l’illusione di essere reclutati da un cittadino che indossava un berretto di nome Bloom nella “resistenza” attraverso l’uso di guardrail.
Ubisoft ha utilizzato un elenco popup per incorporare la gamification nell’esperienza dell’intelligenza artificiale di Inworld. Questo elenco raccomandava varie attività, come conoscere i megacorpi e la resistenza, da intraprendere a livello olistico. Nonostante i miei tentativi di indirizzare la conversazione altrove, Bloom faceva costantemente emergere quelle barriere invisibili e offriva osservazioni spiritose sulle mie domande prima di reindirizzare l’attenzione sulla resistenza. Le mie azioni, o meglio le mie parole, hanno avuto una risposta persistente durante tutta la manifestazione. Quando ho menzionato le mie abilità uniche come barista e appassionato di criptovalute, preferendo chiamarmi Poncho piuttosto che Nelson, Bloom è stato felice di accontentarmi e ci siamo scambiati aneddoti prima di concludere con il mio obiettivo finale di ottenere informazioni sullo scopo della demo.
La seconda parte della demo si è trasformata in una sessione di brainstorming aperta con Iron, un membro femminile di spicco della resistenza che sembrava ricoprire un rango più alto di Bloom. Il mio obiettivo questa volta era definire una strategia per infiltrarmi in un caveau. Mentre navigavo nella sala briefing virtuale con un controller in mano, Ubisoft mi ha presentato elenchi e parole chiave per stimolare la discussione e incoraggiare la collaborazione con Iron nella ricerca di una soluzione per un’irruzione discreta dopo il brunch.
Pur avendo a disposizione tutti gli strumenti necessari, ho cercato di assemblarli in modi meno convenzionali. Sebbene una scala fosse un’opzione pratica per accedere a un edificio al secondo piano, mi sono sfidato a pensare fuori dagli schemi e usarla per raggiungere una telecamera di sicurezza nel corridoio. Appendendo una foto Polaroid del corridoio sorvegliato, sono riuscito a ingannare la telecamera e ad entrare. Abbattere la guardia che bloccava il mio percorso dal balcone d’ingresso all’ufficio era un compito facilmente realizzabile da qualsiasi giocatore di Metal Gear Solid, ma trasmettere il mio piano tramite comandi vocali si è rivelato una sfida. I miei tentativi di convincere Iron a caricare un rampino in un fucile o ad affidarsi alla tattica abusata di intrufolarsi in una scatola di cartone sono stati inutili. Ero determinato a farlo
La demo Covert Protocol presentata da NVIDIA era un’esperienza meno strutturata, con l’obiettivo di scoprire il numero della camera di una persona di interesse che soggiornava in un lussuoso hotel a cinque stelle. La storia di copertina che ho scelto era quella di un corriere che trasportava merci illecite che richiedevano una firma diretta per il rilascio. Ho trovato il primo personaggio non giocabile che ho incontrato, un fattorino, molto più ricettivo ai miei suggerimenti rispetto a Bloom e Iron. Sebbene le nostre conversazioni fossero per lo più reazionarie, sembrava aperto all’idea di un massaggio ai piedi o di uscire per il karaoke una volta completata la mia missione. Nonostante i miei tentativi, non sono riuscito a convincere l’IA a cantare sul posto la musica dello spettacolo, ma ha detto che la sua canzone preferita per il karaoke era
Gli altri due PNG IA non erano così flessibili nelle loro risposte e non sembravano interessati a interagire con qualcuno al di fuori della storia. Tuttavia, tutto è cambiato quando mi sono imbattuto in un distintivo di lavoro a lato. Una volta ottenuto, entrambe le personalità dell’IA sono diventate più ricettive alle mie richieste e hanno fornito preziose informazioni relative al mio obiettivo. Questo improvviso cambiamento nel comportamento è stato un po’ stridente e ha tolto l’esperienza coinvolgente. Anche se capisco la necessità di obiettivi nel gameplay, mi è sembrato restrittivo essere costretti a svolgere compiti specifici invece di avere la libertà di interpretare un ruolo e fare delle scelte.
Nonostante l’apparente assurdità delle mie richieste, fintanto che mantenevo le mie domande entro i limiti del PG-13 ed evitavo qualsiasi cosa veramente oscena, i modelli linguistici erano più che disposti a conformarsi e spesso rispondevano con osservazioni intelligenti e stimolanti. La qualità complessiva dell’esperienza con questi personaggi e modelli linguistici dipende in ultima analisi dalla formazione che ricevono e dalla potenza di elaborazione necessaria per interpretare richieste non convenzionali. Sia Ubisoft che NVIDIA hanno dimostrato i loro approcci unici nel creare conversazioni realistiche con i giocatori pur mantenendo i limiti, il che potrebbe rivelarsi vantaggioso per la futura integrazione dei giochi. Resta da vedere se questi strumenti verranno implementati prima della fine dell’attuale generazione di console, ma il mio scetticismo iniziale è stato sostituito dalla curiosità e dall’entusiasmo per il potenziale degli NPC basati sull’intelligenza artificiale.
Lascia un commento