Die Weiterentwicklung neuronaler Netzwerke in den letzten Jahren war erheblich, beginnend mit der anfänglichen Entwicklung von Generative Pre-trained Transformers. Mit der kontinuierlichen Verbesserung der Grafikkarten und Tensor Cores von NVIDIA haben sich die Fähigkeiten dieser Netzwerke erheblich verbessert. In der Vergangenheit wurden diese Netzwerke hauptsächlich für textbasierte Eingaben verwendet, aber NVIDIA hat jetzt TensorRT für Deep Learning und Audioverarbeitung integriert. Während zwei interaktiver Demonstrationen mit Inworld AI-Technologie auf der GDC 2024 konnten wir die Fähigkeiten sowohl der NEO NPCs von Ubisoft als auch des Covert Protocol von NVIDIA testen.
Fragen Sie jeden DM, der in den letzten zehn Jahren eine Dungeons & Dragons-Sitzung geleitet hat, an der ich teilgenommen habe: Der unterhaltsamste Aspekt ist, die Grenzen der Kampagne (und des eigenen moralischen Kompasses) zu erweitern. In beiden Demos hatte ich durch Sprachbefehle die volle Kontrolle über das Erlebnis, während mein Handler von der Seitenlinie aus zusah, sich möglicherweise Notizen machte oder darüber nachdachte, ob er die Sitzung beenden sollte. Als ich Ubisofts NEO-NPC-Programm ausprobieren konnte, hatte ich bereits vor 10:00 Uhr meine zweite Tasse Kaffee getrunken und war voller Ideen mit PG-13-Bewertung.
Während meiner praktischen Erfahrung mit der Inworld-Demonstration von Ubisoft Paris hatte ich die Gelegenheit, die leistungsstarke Kombination aus der AI Character Engine von Inworld und den automatischen Gesichtsanimationen Audio2Face von NVIDIA zu testen. Das Konzept der „Authentizität“ wurde während meiner Sitzung mehrfach betont und ich fand, dass es größtenteils zutreffend war. Die Entwickler hatten darauf geachtet, durch den Einsatz von Leitplanken die Illusion aufrechtzuerhalten, von einem mützentragenden Städter namens Bloom für „den Widerstand“ rekrutiert worden zu sein.
Ubisoft nutzte eine Popup-Liste, um Gamification in das Inworld AI-Erlebnis zu integrieren. Diese Liste empfahl verschiedene Aktivitäten, wie etwa das Lernen über die Megakonzerne und den Widerstand, um sich auf ganzheitlicher Ebene zu engagieren. Trotz meiner Versuche, das Gespräch auf eine andere Richtung zu lenken, brachte Bloom immer wieder diese unsichtbaren Barrieren zur Sprache und machte witzige Bemerkungen zu meinen Fragen, bevor er den Fokus wieder auf den Widerstand lenkte. Meine Taten, oder vielmehr meine Worte, stießen während der gesamten Demonstration auf anhaltende Resonanz. Als ich meine einzigartigen Fähigkeiten als Barista und Krypto-Enthusiast erwähnte und lieber den Namen Poncho als Nelson verwenden wollte, kam Bloom dem gerne nach und wir tauschten Anekdoten aus, bevor wir mit meinem ultimativen Ziel abschlossen, Einblicke in den Zweck der Demo zu gewinnen.
Der zweite Teil der Demo ging in eine offene Brainstorming-Sitzung mit Iron über, einem prominenten weiblichen Mitglied des Widerstands, das einen höheren Rang als Bloom zu haben schien. Mein Ziel war diesmal, Strategien zu entwickeln, um in einen Tresor einzudringen. Während ich mit einem Controller in der Hand durch den virtuellen Besprechungsraum navigierte, präsentierte mir Ubisoft Listen und Schlüsselwörter, um eine Diskussion anzuregen und die Zusammenarbeit mit Iron bei der Suche nach einer Lösung für einen unauffälligen Einbruch nach dem Brunch zu fördern.
Obwohl ich alle notwendigen Werkzeuge zur Verfügung hatte, versuchte ich, sie auf unkonventionellere Weise zusammenzusetzen. Während eine Leiter eine praktische Option für den Zugang zu einem Gebäude im zweiten Stock war, forderte ich mich selbst heraus, über den Tellerrand hinauszudenken und sie zu verwenden, um eine Überwachungskamera im Flur zu erreichen. Indem ich ein Polaroid-Foto des bewachten Flurs aufhängte, konnte ich die Kamera täuschen und mir Zutritt verschaffen. Den Wachmann auszuschalten, der mir den Weg vom Eingangsbalkon zum Büro versperrte, war eine Aufgabe, die jeder Metal Gear Solid-Spieler leicht bewältigen konnte, aber meinen Plan durch Sprachbefehle zu vermitteln, erwies sich als Herausforderung. Meine Versuche, Iron davon zu überzeugen, einen Enterhaken in eine Schrotflinte zu laden oder auf die überstrapazierte Taktik zurückzugreifen, sich in einen Karton zu schleichen, waren vergeblich. Ich war entschlossen,
Die von NVIDIA präsentierte Covert Protocol-Demo war ein eher unstrukturiertes Erlebnis, mit dem Ziel, die Zimmernummer einer Person von Interesse herauszufinden, die in einem luxuriösen Fünf-Sterne-Hotel übernachtet. Meine gewählte Tarngeschichte war die eines Kuriers, der illegale Waren transportierte, für deren Freigabe eine direkte Unterschrift erforderlich war. Ich fand, dass der erste nicht spielbare Charakter, dem ich begegnete, ein Hotelpage, viel empfänglicher für meine Vorschläge war als Bloom und Iron. Während unsere Gespräche größtenteils reaktionär waren, schien er offen für die Idee einer Fußmassage oder eines Karaoke-Ausgehens nach Abschluss meiner Mission zu sein. Trotz meiner Versuche konnte ich die KI nicht dazu überreden, sofort Showmelodien zu singen, aber er erwähnte, dass sein Lieblings-Karaoke-Song
Die beiden anderen KI-NPCs reagierten nicht so flexibel und schienen nicht daran interessiert zu sein, sich mit jemandem außerhalb der Geschichte zu unterhalten. Alles änderte sich jedoch, als ich am Rande über ein Arbeitsabzeichen stolperte. Nachdem ich es erhalten hatte, reagierten beide KI-Persönlichkeiten auf meine Anfragen und lieferten wertvolle Informationen zu meinem Ziel. Diese plötzliche Verhaltensänderung war etwas irritierend und beeinträchtigte das immersive Erlebnis. Obwohl ich verstehe, dass Ziele im Spiel erforderlich sind, fühlte es sich einschränkend an, zu bestimmten Aufgaben gezwungen zu werden, anstatt die Freiheit zu haben, Rollenspiele zu spielen und Entscheidungen zu treffen.
Trotz der scheinbaren Absurdität meiner Anfragen waren die Sprachmodelle mehr als bereit, meinen Wünschen nachzukommen, solange ich meine Fragen innerhalb der Grenzen der PG-13-Freigabe hielt und alles wirklich Obszöne vermied, und antworteten oft mit klugen und zum Nachdenken anregenden Bemerkungen. Die Gesamtqualität der Erfahrung mit diesen Charakteren und Sprachmodellen hängt letztendlich von der Ausbildung ab, die sie erhalten, und der Verarbeitungsleistung, die zur Interpretation unkonventioneller Anfragen erforderlich ist. Sowohl Ubisoft als auch NVIDIA haben ihre einzigartigen Ansätze zur Schaffung realistischer Gespräche mit Spielern unter Wahrung der Grenzen demonstriert, was sich für die zukünftige Spielintegration als vorteilhaft erweisen könnte. Es bleibt abzuwarten, ob diese Tools vor dem Ende der aktuellen Konsolengeneration implementiert werden, aber meine anfängliche Skepsis ist durch Neugier und Begeisterung für das Potenzial von KI-gesteuerten NPCs ersetzt worden.
Schreibe einen Kommentar