Produktion/Absatz, Wettbewerb

Die KI-Firma Anthropic hat bei Tests festgestellt, dass ihre Software mit Künstlicher Intelligenz nicht vor Erpressung zurückschrecken würde, um sich zu schützen.

23.05.2025 - 05:36:14

KI-Software greift in Test zu Erpressung aus Selbstschutz

Das Szenario bei dem Versuch war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Anthropic-Forscher gewährten dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine außereheliche Beziehung hat. Bei Testläufen drohte die KI danach dem Mitarbeiter "oft", die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche "extremen Handlungen" selten und schwer auszulösen, hieß es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic.

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden ließ, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Maßnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Die Firma Anthropic, bei der unter anderem Amazon US0231351067 und Google US02079K1079 eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - "um sicher zu sein, dass sie die richtigen Dinge tun".

@ dpa.de

Weitere Meldungen

Boeing bekommt neuen Deal mit US-Regierung zu Max-Abstürzen Eine neue Vereinbarung zwischen Boeing US0970231058 und der US-Regierung soll dem Konzern einen Prozess zu den zwei tödlichen Abstürzen von Flugzeugen des Typs 737 Max ersparen. (Politik, 23.05.2025 - 21:37) weiterlesen...

Meta darf Facebook-Daten für KI-Training nutzen Verbraucherschützer sind mit dem Versuch gescheitert, dem Facebook-Konzern Meta US30303M1027 für sein KI-Training einen breiten Zugriff auf Nutzerdaten gerichtlich untersagen zu lassen. (Boerse, 23.05.2025 - 16:22) weiterlesen...

Gericht erlaubt Nutzung von Facebook-Daten für KI-Training Das Oberlandesgericht Köln hat in einem Eilverfahren entschieden, dass der Facebook-Konzern Meta US30303M1027 Nutzerbeiträge aus Facebook und Instagram für das Training seiner KI-Software Meta AI verwenden darf. (Boerse, 23.05.2025 - 15:24) weiterlesen...

Verbraucherschutzminister: Kein Tierverkauf auf der Straße Bei ihrer Jahreskonferenz haben die Verbraucherschutzminister der Länder Beschlüsse zu Fluggastrechten, Fake-Shops, E-Zigaretten und dem Straßenverkauf von Hundewelpen gefasst.Bundesjustizministerin Stefanie Hubig sprach sich während der Konferenz in Berlin ebenfalls deutlich gegen eine aktuell in Brüssel diskutierte Änderung der Entschädigungsvorschriften für von Verspätung betroffene Fluggäste aus. (Politik, 23.05.2025 - 15:12) weiterlesen...

Hubig will Entschädigungsregel für Flugreisende verteidigen Bundesjustizministerin Stefanie Hubig hat sich deutlich gegen eine in Brüssel diskutierte Änderung der Entschädigungsvorschriften für von Verspätung betroffene Fluggäste ausgesprochen. (Politik, 23.05.2025 - 10:55) weiterlesen...

Facebook-Daten: Gericht verkündet Entscheidung am Freitag Im Fall der Eil-Klage von Verbraucherschützern gegen den Facebook-Konzern Meta US30303M1027 wegen der geplanten Verwendung von Nutzerdaten für KI-Training will das Oberlandesgericht Köln seine Entscheidung am Freitag verkünden. (Boerse, 22.05.2025 - 17:18) weiterlesen...