Fara-7B: Microsofts KI-Agent steuert PCs autonom
28.11.2025 - 05:40:11Microsoft verschärft das Rennen um autonome KI-Agenten. Mit Fara-7B präsentiert der Konzern ein kompaktes Modell, das Computer wie ein Mensch bedienen kann – direkt auf dem Gerät, ohne Cloud-Anbindung. Die Veröffentlichung dieser Woche markiert einen Strategiewechsel: weg von riesigen Cloud-Systemen, hin zu effizienter On-Device-Intelligenz, die komplexe Benutzeroberflächen navigiert und dabei die Privatsphäre wahrt.
Das Besondere: Microsoft stellt die Modellgewichte unter MIT-Lizenz frei zur Verfügung. Zielgruppe sind Entwickler und Forscher, die „agentische” Workflows aufbauen wollen – Systeme also, die nicht nur Text generieren, sondern aktiv Aufgaben erledigen, indem sie klicken, scrollen und tippen.
Anders als herkömmliche Sprachmodelle funktioniert Fara-7B als Computer Use Agent (CUA). Die KI nimmt den Bildschirm visuell wahr – interpretiert Screenshots auf Pixel-Ebene – und interagiert über virtuelle Maus und Tastatur mit Standard-Oberflächen.
Am Montag, 24. November vorgestellt, basiert das Modell auf der Qwen2.5-VL-7B-Architektur. Das Training erfolgte mit Microsofts proprietärem Magentic-One-Framework anhand von über 145.000 synthetischen „Trajektorien” – Abfolgen von Aktionen und Beobachtungen, die der KI beibrachten, Websites zu navigieren, Formulare auszufüllen und mehrstufige Workflows ohne menschliches Eingreifen zu bewältigen.
Seit August 2024 gelten neue Regeln für KI‑Systeme – viele Entwickler und Unternehmen riskieren unwissentlich Bußgelder, wenn sie die Vorgaben nicht kennen. Unser kompakter Umsetzungsleitfaden zur EU‑KI‑Verordnung erklärt verständlich, welche Pflichten für agentische Systeme wie Fara‑7B gelten, wie Sie Ihr System richtig klassifizieren, welche Dokumentation nötig ist und welche Übergangsfristen einzuhalten sind. Ideal für Entwickler und Entscheider, die KI‑Produkte rechtssicher bereitstellen wollen. Jetzt kostenlosen KI‑Verordnung‑Leitfaden herunterladen
„Fara-7B arbeitet mit denselben Modalitäten wie Menschen”, heißt es im begleitenden Technikbericht. „Es benötigt keine Accessibility-Bäume oder separate Parsing-Modelle und kann daher jede Anwendung bedienen wie ein Nutzer.”
Dieser „Vision-First”-Ansatz ermöglicht den Umgang mit dynamischen Webseiten und Legacy-Anwendungen, deren zugrundeliegender Code für traditionelle Automatisierungsskripte verschleiert oder unzugänglich sein könnte.
Klein, aber oho: Überraschende Leistung
Trotz seiner vergleichsweise bescheidenen 7 Milliarden Parameter zeigt Fara-7B verblüffende Effizienz. In wichtigen Benchmarks übertrifft es deutlich größere proprietäre Modelle.
Laut Microsoft Research erreichte Fara-7B diese Woche eine Erfolgsquote von 73,5 Prozent im WebVoyager-Benchmark, einem Standardtest für webbasierte Agenten. OpenAIs GPT-4o kam bei denselben Aufgaben nur auf 65,1 Prozent. Diese Effizienz ist entscheidend für das Hauptverkaufsargument: die Lauffähigkeit auf Consumer-Hardware.
„Wir erleben einen Paradigmenwechsel, bei dem Effizienz genauso zählt wie pure Rechenleistung”, erklärte Yash Lara, Senior Program Manager bei Microsoft Research. „Durch die Optimierung für lokale Ausführung reduzieren wir die Latenz drastisch. Der Agent muss keinen Screenshot in die Cloud schicken und auf Antwort warten – er denkt und handelt direkt auf Ihrem Gerät.”
Microsoft führte am Donnerstag zudem WebTailBench ein: ein neues Evaluierungsset mit 609 realen Aufgaben in elf Kategorien, darunter Reisebuchung, Jobsuche und Preisvergleich. Erste Ergebnisse zeigen Fara-7B als Klassenprimus bei diesen praktischen Szenarien – durchschnittlich 16 Schritte pro Aufgabe, verglichen mit über 40 Schritten bei manchen Open-Source-Konkurrenten.
Pixel-Souveränität und Sicherheitsmechanismen
Ein zentrales Thema beim Launch: Datenschutz. Durch die lokale Verarbeitung visueller Daten auf dem Neural Processing Unit (NPU) oder GPU des Geräts stellt Microsoft sicher, dass sensible Bildschirminhalte – etwa Bankdaten oder private E-Mails – den Computer nie verlassen. Microsoft nennt dieses Konzept „Pixel-Souveränität”, einen Standard, der für die Enterprise-Akzeptanz in regulierten Branchen wie Gesundheitswesen und Finanzsektor essenziell sein dürfte.
Doch autonome PC-Kontrolle durch KI birgt Risiken. Zur Absicherung verfügt Fara-7B über einen eingebauten Schutzmechanismus namens „Critical Points”.
Während des Trainings lernte das Modell, Hochrisiko-Situationen zu erkennen – etwa das Bestätigen einer Finanztransaktion, das Versenden einer E-Mail oder Löschen einer Datei. Erkennt der Agent solch ein Szenario, pausiert er programmgemäß und fordert explizit die Nutzerfreigabe an.
„Das Ziel ist überwachte Autonomie”, erläutert ein Sicherheitsanalyst von SecurityWeek. „Microsoft versucht eine Balance: Die KI übernimmt die schwere Arbeit bei Navigation und Dateneingabe, aber der Mensch bleibt finale Instanz für irreversible Handlungen.”
Kontext: Der Wettlauf um agentische KI
Die Fara-7B-Veröffentlichung fällt in eine hektische Phase des „Agentic AI”-Sektors. Erst letzten Monat brachte Anthropic eine „Computer Use”-Funktion für Claude 3.5 Sonnet heraus, Google DeepMind zeigt Ähnliches für Gemini-Modelle.
Microsofts Ansatz unterscheidet sich fundamental durch die Priorisierung lokaler Open-Weight-Modelle statt Cloud-exklusiver APIs. Mit der Veröffentlichung auf Plattformen wie Hugging Face und Microsoft Foundry kommodifiziert das Unternehmen faktisch die Basis-Ebene der Computer-Automatisierung und fördert ein Entwickler-Ökosystem rund um Windows-basierte Agenten.
Der Schritt fügt sich in Microsofts breitere „Agentic OS”-Vision für Windows 11 ein, die auf der Ignite-Konferenz Anfang des Monats vorgestellt wurde. Das Betriebssystem soll von einer passiven Plattform zum aktiven Assistenten transformiert werden, der komplexe Workflows im Hintergrund ausführt.
Ausblick: Integration in Copilot+ PCs
Zwar gilt Fara-7B derzeit als experimentelles Release für Forschung und Entwicklung, die Implikationen sind jedoch unmittelbar. Entwickler können nun anspruchsvolle Automatisierung in lokale Anwendungen integrieren, ohne hohe Kosten und Latenz cloudbasierter LLMs.
Branchenbeobachter erwarten, dass Microsoft verfeinerte Versionen dieses Modells bis Mitte 2026 direkt in Copilot+ PCs integriert. Diese mit dedizierter NPU-Hardware ausgestatteten Geräte könnten persistente KI-Agenten ausführen, die administrative Routinearbeit übernehmen – Dateien organisieren, Meetings planen, Rechnungen verarbeiten – vollständig im Hintergrund.
Vorerst steht Fara-7B als kraftvoller Machbarkeitsnachweis: KI muss nicht massiv sein, um leistungsfähig zu sein. Und sie muss nicht in der Cloud sein, um intelligent zu sein.
Das Fara-7B-Modell steht ab sofort für Forscher und Entwickler über Hugging Face und Microsoft Foundry zur Verfügung.
Übrigens: Die Übergangsfristen der EU‑KI‑Verordnung laufen für manche Systeme bald ab. Wenn Sie Fara‑7B lokal einsetzen oder Agenten in Copilot+ PCs planen, sollten Sie jetzt prüfen, ob Kennzeichnung, Risikobewertung und Dokumentation passen. Der Gratis‑E‑Book‑Guide fasst die wichtigsten Schritte in einer praktischen Checkliste zusammen und zeigt konkrete Umsetzungsschritte für Entwickler und Produktverantwortliche. Gratis‑E‑Book zur KI‑Verordnung anfordern


