El avance de las redes neuronales en los últimos años ha sido significativo, comenzando con el desarrollo inicial de transformadores generativos preentrenados. Con la mejora continua de las tarjetas gráficas y Tensor Cores de NVIDIA, las capacidades de estas redes han aumentado considerablemente. En el pasado, estas redes se usaban principalmente para entradas basadas en texto, pero NVIDIA ahora ha incorporado TensorRT para aprendizaje profundo y procesamiento de audio. Durante dos demostraciones interactivas con la tecnología Inworld AI en GDC 2024, pudimos probar las capacidades de los NEO NPC de Ubisoft y del Covert Protocol de NVIDIA.
Pregúntale a cualquier DM que haya dirigido una sesión de Dungeons & Dragons en la que haya participado en los últimos diez años: el aspecto más divertido es superar los límites de la campaña (y la propia brújula moral). En ambas demostraciones, se me dio control total de la experiencia a través de comandos de voz, mientras mi manejador observaba desde el margen, posiblemente tomando notas o contemplando si debía finalizar la sesión. Cuando pude probar el programa NEO NPC de Ubisoft, ya había consumido mi segunda taza de café antes de las 10:00 a. m. y estaba lleno de ideas clasificadas para menores de 13 años.
Durante mi experiencia práctica con la demostración de Inworld de Ubisoft Paris, tuve la oportunidad de probar la poderosa combinación del AI Character Engine de Inworld y las animaciones faciales automáticas Audio2Face de NVIDIA. El concepto de «autenticidad» se enfatizó varias veces durante mi sesión y descubrí que era en su mayor parte exacto. Los desarrolladores se habían ocupado de mantener la ilusión de ser reclutados por un urbanita con gorro llamado Bloom para «la resistencia» mediante el uso de barandillas.
Ubisoft utilizó una lista emergente para incorporar la gamificación en la experiencia de Inworld AI. Esta lista recomendaba diversas actividades, como aprender sobre los megacuerpos y la resistencia, para participar a un nivel holístico. A pesar de mis intentos de llevar la conversación a otra parte, Bloom constantemente sacaba a relucir esas barreras invisibles y ofrecía comentarios ingeniosos sobre mis investigaciones antes de redirigir la atención a la resistencia. Mis acciones, o más bien mis palabras, encontraron una respuesta persistente durante toda la manifestación. Cuando mencioné mis habilidades únicas como barista y entusiasta de las criptomonedas, prefiriendo usar el nombre de Poncho en lugar de Nelson, Bloom estuvo feliz de hacerlo e intercambiamos anécdotas antes de concluir con mi objetivo final de obtener una idea del propósito de la demostración.
La segunda parte de la demostración pasó a ser una sesión abierta de intercambio de ideas con Iron, una destacada miembro femenina de la resistencia que parecía tener un rango más alto que Bloom. Mi objetivo esta vez era idear estrategias para infiltrarme en una bóveda. Mientras navegaba por la sala de reuniones virtual con un controlador en la mano, Ubisoft me presentó listas y palabras clave para iniciar la discusión y fomentar la colaboración con Iron para encontrar una solución para un robo discreto después del brunch.
A pesar de tener todas las herramientas necesarias a mi disposición, intenté ensamblarlas de formas menos convencionales. Si bien una escalera era una opción práctica para acceder a un edificio del segundo piso, me desafié a pensar fuera de lo común y usarla para alcanzar una cámara de seguridad en el pasillo. Al colgar una fotografía Polaroid del pasillo vigilado, pude engañar a la cámara y entrar. Derribar al guardia que bloqueaba mi camino desde el balcón de entrada a la oficina fue una tarea fácil de realizar por cualquier jugador de Metal Gear Solid, pero transmitir mi plan a través de comandos de voz resultó ser un desafío. Mis intentos de convencer a Iron de que cargara un gancho de agarre en una escopeta o confiara en la táctica usada en exceso de esconderse dentro de una caja de cartón fueron inútiles. Estaba decidido a
La demostración de Covert Protocol presentada por NVIDIA fue una experiencia menos estructurada, con el objetivo de descubrir el número de habitación de una persona de interés alojada en un lujoso hotel de cinco estrellas. La tapadera que elegí fue la de un mensajero que transportaba mercancías ilícitas que requerían una firma directa para su liberación. Descubrí que el primer personaje no jugable que encontré, un botones, era mucho más receptivo a mis sugerencias en comparación con Bloom y Iron. Si bien nuestras conversaciones fueron en su mayoría reaccionarias, él parecía abierto a la idea de un masaje en los pies o salir a karaoke una vez que mi misión estuviera completa. A pesar de mis intentos, no pude convencer a la IA para que cantara melodías en el acto, pero sí mencionó que su canción favorita en el karaoke era
Los otros dos NPC de la IA no fueron tan flexibles en sus respuestas y no parecían interesados en interactuar con alguien fuera de la historia. Sin embargo, todo cambió cuando me topé con una insignia de trabajo a un lado. Una vez que lo obtuve, ambas personalidades de IA se volvieron más receptivas a mis solicitudes y brindaron información valiosa relacionada con mi objetivo. Este cambio repentino de comportamiento fue un poco discordante y le quitó la experiencia de inmersión. Si bien entiendo la necesidad de objetivos en el juego, me pareció restrictivo verse obligado a realizar tareas específicas en lugar de tener la libertad de interpretar y tomar decisiones.
A pesar de lo aparentemente absurdo de mis solicitudes, siempre y cuando mantuviera mis preguntas dentro de los límites PG-13 y evitara cualquier cosa verdaderamente obscena, los modelos de lenguaje estaban más que dispuestos a cumplir y a menudo respondían con comentarios inteligentes y estimulantes. La calidad general de la experiencia con estos personajes y modelos de lenguaje depende en última instancia de la capacitación que reciben y del poder de procesamiento necesario para interpretar solicitudes no convencionales. Tanto Ubisoft como NVIDIA han demostrado sus enfoques únicos para crear conversaciones realistas con los jugadores manteniendo los límites, lo que podría resultar beneficioso para la futura integración de juegos. Queda por ver si estas herramientas se implementarán antes de que finalice la generación actual de consolas, pero mi escepticismo inicial ha sido reemplazado por curiosidad y entusiasmo por el potencial de los NPC impulsados por IA.
Deja una respuesta