Chrikro.at Logo

WebSoftwareTechnik

KI-Sprachmodelle: Das Ende der Vielfalt im Internet?

Roboterhand auf Notebook

Seit Mitte der 1990er gibt es Websites im heutigen Sinne. Sie haben – in Kombination mit Suchmaschinen – unsere Art, Informationen zu recherchieren, revolutioniert. Doch das Web befindet sich in einem Umbruch. Large Language Models (LLMs), umgangssprachlich als KI bezeichnet, liefern Informationen sofort und ohne langes Herumsuchen. Aber mit Risiken.

Haben Websites eine Zukunft?

Eines ist klar: Einfach zu recherchierende Informationen zu erhalten, geht schon jetzt über LLMS. Die Ergebnisse dahingehend sind sehr verlässlich. In absehbarer Zeit wird niemand mehr die Wikipedia aufrufen, um zu erfahren, wie viele Einwohner ein Land hat oder wie die Mitglieder der Beatles hießen.

Sobald die Fragestellungen aber komplexer werden oder auf aktuelle Geschehnisse referenzieren, können wir uns, zumindest aktuell, nicht zu 100% auf LLMs verlassen. Und auch wenn die Ergebnisse laufend besser werden, wird es diese Sicherheit nie geben, wenn man keine Quellenangaben bekommt. Wenn es Quellenangaben sind, dann handelt es sich dabei in der Regel wiederum um Websites.

Die Katze beißt sich in den eigenen Schwanz

Und hier sehen wir die Problematik: LLMs nutzen Websites als Trainingsmaterial. Wenn die Anzahl der Websites mit nützlichen Informationen aufgrund sinkender Aufrufe aber zurück geht, dann wird über kurz oder lang die Datenqualität schlechter. Diesen Effekt merkt man in einem anderen Zusammenhang schon jetzt. Die Entwickler von LLMs kämpfen mit dem Problem, dass viele Inhalte im Internet schon jetzt KI-generiert sind, aber nicht als solche erkannt werden können. Das Trainingsmaterial ist also „verunreinigt“. Und je mehr LLMs eingesetzt werden, desto größer wird diese Problematik.

Mögliche Auswege aus der Misere

Mittelfristig kann man sich damit behelfen, nur noch offizielle Informationen zu Trainingszwecken zuzulassen. Die Web-Crawler, die für das Sammeln von Informationen eingesetzt werden, müssten grundlegend umgebaut werden. Vermutlich passiert das gerade auch, da es die einzige Möglichkeit ist, die Datenqualität zu heben. Aber selbst dann ist man nie davor sicher, dass LLMs in bestimmten Situationen nicht anfangen zu „halluzinieren“. Das ergibt sich aus dem grundlegenden Aufbau dieser Technologie.

Was bedeutet das alles für die Zukunft der Websites?

Diese Frage kann wohl nicht abschließend beantwortet werden. Websites sind für das Training von KIs von großer Wichtigkeit, werden aber für den Endnutzer weniger relevant werden. Denkbar ist, dass Informationen zukünftig nur noch als strukturierte Daten zur Verfügung gestellt werden. Also in erster Linie direkt für KIs aufbereitet. Andererseits gibt es für Website-Betreiber keinen großen Anreiz, da sie von den KI-Unternehmen keine Vergütung erhalten.

Man kann also spekulieren dass es in eine andere Richtung geht: Da LLM-Entwickler ein Interesse daran haben, dass es weiterhin qualitative Websites gibt, werden diese vermutlich vermehrt in LLM-Texten verlinkt werden. Davon profitieren die Website-Betreiber und in direkt auch die LLMs. Noch ist davon wenig zu merken, aber es wäre langfristig ein sinnvoller Ansatz um das Gleichgewicht zu wahren.

Beitrag teilen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert