m.fuchs hat geschrieben: Fr 25. Jul 2025, 08:51
Falsch. Was soll ein nicht-deterministisches System sein? Für den Determinismus muss man einen Algorithmus betrachten. Also beispielsweise die Erzeugung von Zufallszahlen durch Werfen eines Würfels.
Du hast das Beispiel einfach nicht verstanden, oder du willst es nicht verstehen. Nochmal ich zitiere was du gesagt hast:
Objektiv messbar ist da übrigens gar nichts, die Dinger sind nämlich nicht deterministisch.
Ich leg dir hier keine Worte in den Mund deine Aussage war ganz direkt: Man kann "gar nichts" objektiv messen wenn das system nichtdeterministisch ist. Eine Aussage die einfach so fundamental falsch ist, das das simple Beispiel eines Würfels schon reicht um diese Aussage zu wiederlegen.
Dinge wie Erwartungswert, Statistisches Mittel, Standardabweichung, etc. kann man alle Objektiv Messen und auf basis dessen objektiv Aussagen über die Korrektheit von einem Probabilistischen Algorithmus treffen.
Wenn ich dir jetzt eine Box gebe, du weißt nicht was drin ist, und ich sage dir: Diese box implementiert einen hoch proprietären probabilistischen Algorithmus um das Ergebnis einer Einstelligen Addition auszurechnen.
In wirklichkeit ist darin ist eine kleine Fee eingesperrt die einen würfel wirft und das Ergebnis des Wurfs rausgibt.
Kannst du dann Objektiv messen ob und mit welcher Wahrscheinlichkeit dieser Algorithmus korrekt arbeitet?
Ich hab nie behauptet das der Würfel ein guter Algorithmus ist um einstellige Addition zu berechnen, aber es ist objektiv quantisierbar genau wie gut oder der Würfel diese Aufgabe erfüllt mittels statistik.
Übrigens dein Kommentar von vorher:
Ich kann dir aus der Definition eines Würfel sagen wie gut er darin ist die Rechenaufgabe 1+2 zu lösen: gar nicht.
Ist hierfür absolut irrelevant, weil es um objektive messungen geht. Eine Analytische Lösung auf basis des unterliegenden Statistischen Modells ist im Falle eines würfels genauso möglich, aber das nur weil der Würfel ein sehr simples modell ist, weils ein beispiel ist.
Ein LLM hingegen ist deutlich Komplexer da es ein Probabilistisches System auf einem mehrdimensionalen Zahlenraum ist, um das Analytisch zu modellieren fehlt uns schlicht weg die rechenleistung da es von zu vielen Parametern abhängt.
Deshalb hab ich einen Würfel genommen, weil es ein schönes eindimensionales system ist
Ein LLM ist nichts anderes als ein sehr viel Komplexeres Probabilistisches System, was man verwenden kann um z.B. logische Aufgabenstellungen zu lösen. Man kann also dieses LLM ans Black Box benutzen um eine reihe an Testaufgaben zu lösen um die Genauigkeit des Systems auf dieser Art von Aufgabenstellung zu lösen.
Das sind objektive messungen und am ende bekommt man eine objektive statistik raus.
Deine Behauptung war das man in einem nicht deterministischen system "gar nichts" objektiv messen kann, und das ist falsch. Wenn diese Aussage stimmen würde wäre das gesammte Feld der Statistik hinfällig.
Diese Tests sagen aber nichts darüber aus, wie gut sich damit Schrauben in die Wand drehen lassen. Dazu brauche ich keinen Test, ich kann sofort sagen: geht nicht. Dafür ist das Ding nicht gemacht.
Das ist auch eine schlicht und ergreifend falsche aussage. Ich kann 100 studenten hinsetzen mit hammer und schrauben und sagen: Dreht mit dem Hammer die Schrauben in das Holz.
Danach messe ich das ergebnis anhand vorher definierter Parameter, wie z.B. wie tief ist die Schraube in das holz gedreht, wie viel kraft wird benöötigt um die schraube gewaltsam zu entfernen, etc.
Danach kann ich auf diesen erfassten werten eine statistik machen und diese gegenüber dem gewünschten wert (z.B. Werte erhoben mit einem Schraubenzieher) vergleichen und ein Konfidenzintervall für die Abweichung bilden. Dann kann ich sagen "mit einer konfidenz von 95% halten schrauben die mit einem Hammer in das Holz gedreht wurden zu 74% weniger kraft".
Das ist eine vollkommen objektive Messung.
Bei den LLMs verhält es sich nicht anders. Wissenschaftler entwickeln Logik tests und werfen dann die LLMs auf mehrere Tausende Aufgaben und berechnen dann die Genauigkeit über Statistische Mittel und können damit ausgeben wie gut diese LLMs in Logik sind.
Nur weil etwas nicht für Aufgabe X entwickelt wurde heißt das nicht das es nicht dafür nützlich ist. In der Medizin kommt es tatsächlich extrem oft vor das Medikamente die für einen Zweck entwickelt wurden später rausgefunden wurde das sie etwas anderes viel besser können. Z.B. Viagra wurde als Kopfschmerzmedikament entwickelt, dann wurde in Tests rausgefunden das es einen besseren Anwendungsfall hat, und heute verschreibt es kein Arzt gegen Kopfschmerzen.