
A pesar de la expectación generada por la función Siri Personalizada, Apple anunció que su lanzamiento se pospondría hasta el próximo año, tras el lanzamiento de iOS 18.4. Sin embargo, los comentarios de los empleados sugieren optimismo en la empresa respecto a su posible lanzamiento a finales de este año. Estudios recientes revelan cómo Apple está perfeccionando sus procesos de entrenamiento de IA, en particular mediante el desarrollo de Apple Intelligence.
Métodos de formación innovadores: cómo Apple utiliza datos sintéticos manteniendo la privacidad del usuario
Ante el retraso de Siri Personalizada, un informe de Bloomberg arroja luz sobre la estrategia de Apple para entrenar sus sistemas de IA. El informe cita un blog del departamento de Investigación de Aprendizaje Automático de Apple, que analiza el uso de datos sintéticos para entrenar modelos de IA.
Históricamente, los críticos han señalado que Apple se ha quedado atrás de sus competidores en el ámbito de la IA. El uso poco convencional de datos sintéticos por parte de la compañía ha presentado ciertos desafíos. Por ejemplo, el método tiene dificultades para interpretar eficazmente las tendencias necesarias para herramientas que requieren resúmenes exhaustivos o una comunicación articulada, como la redacción de correos electrónicos extensos.
Reconociendo estos desafíos, Apple ha introducido un enfoque innovador que permite comparar datos sintéticos con correos electrónicos reales de los usuarios, garantizando al mismo tiempo el respeto a su privacidad. Este proceso busca optimizar la eficacia de los modelos de IA para optimizar las funciones de comunicación.
Para mejorar nuestros modelos, necesitamos generar un conjunto de correos electrónicos que cubran los temas más comunes. Para seleccionar un conjunto representativo de correos electrónicos sintéticos, comenzamos creando un conjunto amplio de mensajes sintéticos sobre diversos temas. Por ejemplo, podríamos crear un mensaje sintético como «¿Te gustaría jugar al tenis mañana a las 11:30?».
Esto se realiza sin conocer los correos electrónicos individuales de cada usuario. Posteriormente, derivamos una representación, denominada incrustación, de cada mensaje sintético que captura algunas de las dimensiones clave del mensaje, como el idioma, el tema y la longitud. Estas incrustaciones se envían a un pequeño número de dispositivos de usuarios que han habilitado el análisis de dispositivos.
Los dispositivos participantes seleccionan una pequeña muestra de correos electrónicos recientes de los usuarios y calculan sus incrustaciones. Cada dispositivo decide cuál de las incrustaciones sintéticas se asemeja más a estas muestras. Mediante la privacidad diferencial, Apple puede identificar las incrustaciones sintéticas seleccionadas con mayor frecuencia en todos los dispositivos, sin tener que saber qué incrustación sintética se seleccionó en cada dispositivo.
Estas incrustaciones sintéticas seleccionadas con mayor frecuencia pueden usarse para generar datos de entrenamiento o prueba, o podemos ejecutar pasos de curación adicionales para refinar aún más el conjunto de datos. Por ejemplo, si el mensaje sobre jugar al tenis es una de las incrustaciones principales, se podría generar un mensaje similar que sustituya «tenis» por «fútbol» u otro deporte y añadirlo al conjunto para la siguiente ronda de curación (véase la Figura 1).Este proceso nos permite mejorar los temas y el lenguaje de nuestros correos electrónicos sintéticos, lo que nos ayuda a entrenar nuestros modelos para crear mejores resultados de texto en funciones como resúmenes de correos electrónicos, a la vez que protegemos la privacidad.
Aunque Apple reconoce las limitaciones de su enfoque actual, la nueva tecnología promete proporcionar una mejor comprensión de las tendencias de los usuarios sin vulnerar los derechos de privacidad ni recopilar información confidencial. Según Bloomberg, se espera que esta funcionalidad mejorada se incluya en las próximas versiones beta de iOS 18.5 y macOS 15.5. Para más detalles, puede consultar la publicación completa de Apple sobre este tema.
Deja una respuesta