Microsoft entwickelt zuverlässige KI-Agenten für den Computereinsatz

Verbesserung der Zuverlässigkeit von KI-Agenten mit Microsofts UI-Evol

Forscher von Microsoft Research Asia haben eine bahnbrechende Komponente namens UI-Evol vorgestellt – eine aufregende Entwicklung. Diese Innovation soll die Genauigkeit und Zuverlässigkeit von KI-Agenten verbessern, also Algorithmen, die durch die Interaktion mit einem Betriebssystem Aufgaben autonom ausführen können. Trotz ihrer fortschrittlichen Fähigkeiten hatten diese KI-Modelle bisher Schwierigkeiten mit der Präzision.

Die Herausforderung der Wissens-Handlungs-Kluft

KI-Systeme rufen häufig Informationen aus dem Internet ab, um die Interaktion mit Benutzeroberflächen zu erlernen. Angesichts der ständigen Weiterentwicklung von Benutzeroberflächen fällt es diesen Systemen jedoch oft schwer, ihr theoretisches Wissen in der Praxis anzuwenden. Diese Diskrepanz, die als Wissens -Handlungs-Lücke bekannt ist, stellt ein erhebliches Hindernis dar, das ihre Effektivität mindert.

Eine kürzlich von Microsoft hervorgehobene Studie unterstreicht dieses Problem: KI-Agenten, die mit bis zu 90 % korrekten Anweisungen arbeiteten, erreichten nur in 41 % der Fälle einen erfolgreichen Aufgabenabschluss. Darüber hinaus zeigten diese Agenten Unvorhersehbarkeit und führten dieselbe Operation oft mit unterschiedlichen Ergebnissen aus. Diese Inkonsistenz erforderte eine gezielte Lösung.

Wir stellen UI-Evol vor

Hier kommt UI-Evol ins Spiel – eine vielseitige Komponente, die sich nahtlos in den Workflow eines KI-Agenten integriert. Durch die Nutzung von Echtzeitinformationen der tatsächlichen Benutzeroberfläche ist UI-Evol darauf ausgelegt, das Schnittstellenwissen der KI kontinuierlich zu verfeinern und zu aktualisieren. Diese Entwicklung verbessert die Zuverlässigkeit und Genauigkeit dieser Agenten.

So funktioniert UI-Evol

UI-Evol verfolgt einen unkomplizierten zweistufigen Ansatz:

Retrace: Diese Methode beinhaltet die genaue Aufzeichnung der Aktionen, die ein KI-Agent während der Erledigung einer Aufgabe durchführt – wie Klicks, Tastatureingaben und Entscheidungen.
Kritik: Im Anschluss an die Aufzeichnung vergleicht diese Methode die Aktionen des Agenten mit festgelegten externen Anweisungen. Werden Abweichungen festgestellt, passt das System seine Wissensbasis entsprechend an, um sicherzustellen, dass sie praxisnahe und effektive Strategien innerhalb der Softwareumgebung widerspiegelt.

Nachgewiesene Wirksamkeit

Um die Wirksamkeit von UI-Evol zu validieren, wurde es mit Agent S2, einem der leistungsstärksten Computer-Benutzeragenten, anhand des OSWorld- Benchmarks getestet. Experimente mit Agenten, die mit führenden großen Sprachmodellen wie GPT-4o und OpenAI-o3 trainiert wurden, lieferten beeindruckende Ergebnisse: deutliche Verbesserungen der Erfolgsquoten bei Aufgaben und erhöhte Konsistenz, wodurch die Verhaltensvariabilität der Agenten reduziert wurde. Diese Entwicklung macht die KI-Agenten zuverlässiger.

Auswirkungen auf die Zukunft

Mit der Einführung von UI-Evol ist Microsoft bestens gerüstet, die Fähigkeiten von KI-Agenten in der Büroautomatisierung und bei Aufgaben virtueller Assistenten deutlich zu verbessern. Diese Weiterentwicklung positioniert Microsoft nicht nur als führendes Unternehmen in der KI-Forschung, sondern ebnet auch den Weg für eine Zukunft, in der KI-Agenten in verschiedenen Anwendungen effizienter und zuverlässiger arbeiten können.

Bildquelle: Depositphotos.com

Quellen & Bilder