Einsatz von AI zum Musik machen

Summa · 23. Juli 2025

Martin Kraken schrieb:
a.E. Ich glaube nicht, dass es eine Rolle spielt, aber vielleicht wäre ein echter Zufall der Schlüssel zu AGI? Nur Spaß.

Das hat nix mit Glauben zu tun, wenn da bei einem Modell irgendwas mit Zufall stattfindet kann das Aufgrund der Technik nur vom Programmierer gewollt sein.

Martin Kraken · 23. Juli 2025

DanReed schrieb:
Das ist auch genau meine Beobachtung. Es gibt Beispiele, bei denen geht alles gut (vermutlich stammen sie aus dem Trainingsmaterial des jeweiligen Systems), aber real-world klingen doch immer einige Stems ganz unglaublich schlecht. Ähnlich wie mp3 mit 64kBit, aber schlechter.

Will auch keiner, muss auch keiner. Weiß auch jeder, der sich damit auskennt, denn diese Information wäre völlig unerheblich, denn
1) bereits beim nächsten kompletten Trainingslauf wäre wieder alles ganz anders und
2) die Vorstellung, dass irgendwelche ganz bestimmten Nodes irgendein klar identifizierbares Wissen beinhalten, trifft nicht zu. Das gesamte trainierte Wissen verteilt sich ineinander verschachtelt und überlagert auf das komplette Netz. Natürlich gibt es dann irgendwelche Regionen im Netz, die besonders aktiv bei bestimmten Wortfeldern sind, aber was nützt mir die Information, wenn sich eh alles neu organisiert beim nächsten Trainingslauf.

Nein, es gibt schon seit mehr als 2 Jahrzehnten den Konsens, keine Visualisierungsversuche zu unternehmen (es sei denn, sie sollen den Medien als "Futter" dienen für "aufregende" Berichte). Er gibt bereits bei einfachsten Neuronalen Netzen keinen Erkenntnisgewinn durch Visualisierung. Sind sie zu einfach, begreift jeder, wie sie funktionieren (ähnlich einer Linearen Regression), aber sobald mehr als ca. 20 Neuronen mit allen Verbindungen beteiligt sind, wird das Ganze unübersichtlich und ist vor allem bei jedem Trainingslauf anders, da es meistens kein globales Optimum gibt, sondern statt dessen viele lokale. Und bei jedem Trainingslauf landet das Netz in einem anderen lokalen Optimum (das mal weiter mal weniger weit vom Optimum entfernt ist).

Die spannenden Fragen sind vielmehr:
- wie verbessere (beschleunige) ich den Trainingsprozess?
- wie stelle ich sicher, dass mein Trainingsmaterial alle Fälle gleichmäßig abdeckt?
- wie finde ich die beste Netztopologie zur jeweiligen Aufgabe?
- ...

Das ist 1) alles nicht so einfach, 2) alles nicht so neu, 3) alles nicht so gut, wie man als Laie zunächst annimmt.

Das ist ungefähr das was ich seit mehreren Seiten versuche zu erklären. Wobei EAI sehr wohl ein großes Thema war um 2023 und manche Firmen wie Anthropic daran forschen, ob nur für die Show oder ob sie wirklich eine Idee haben, kann man natürlich nicht sagen. a.E. Behalte ich den gleichen Seed, sollte das Netz reproduzierbar sein (sieht man mal von irgendwelchen GPU Floating-Point-Rundungsfehlern oder asynchroner Berechnungen). Lösche ich nun einen Trainingssatz so kann ich diesen Trainingssatz bestimmten Parameterveränderungen zuordnen im finalen Model. Nicht realistisch durchführbar, aber wäre eine Möglichkeit ;-)

Es wäre interessant was für Ansätze Anthropic hat, aber die werden sie wahrscheinlich nicht verraten.

Martin Kraken · 23. Juli 2025

Summa schrieb:
Das hat nix mit Glauben zu tun, wenn da bei einem Modell irgendwas mit Zufall stattfindet kann das Aufgrund der Technik nur vom Programmierer gewollt sein.

Der Seed, also die Parameter vor dem ersten Training sind zufällig gewählt und die Reihenfolge der Trainingsdaten kann zufällig variiert werden. Alleine der Zufall im Seed kann ein völlig anderes Modell ergeben, welches auch andere Antworten gibt, weil es eine andere Lösungsstrategie gefunden hat. Man trainiert also verschiedene Modelle mit verschiedenen Seeds, aber gleichen Trainingsdaten und nimmt das was die besten Ergebnisse zeigt (sehr vereinfacht). Manchmal macht man auch Ensembles (a.E.) oder vielleicht hat ein Modell ne geile Strategie gefunden um Algebra zu lösen, ist aber sonst ziemlich unfähig, dann könnte man dieses Modell für Algebra nehmen und ein anderes für Poetry-Slams?

Summa · 23. Juli 2025

Martin Kraken schrieb:
Der Seed, also die Parameter vor dem ersten Training sind zufällig gewählt und die Reihenfolge der Trainingsdaten kann zufällig variiert werden. Alleine der Zufall im Seed kann ein völlig anderes Modell ergeben, welches auch andere Antworten gibt, weil es eine andere Lösungsstrategie gefunden hat. Man trainiert also verschiedene Modelle mit verschiedenen Seeds, aber gleichen Trainingsdaten und nimmt das was die besten Ergebnisse zeigt (sehr vereinfacht). Manchmal macht man auch Ensembles (a.E.) oder vielleicht hat ein Modell ne geile Strategie gefunden um Algebra zu lösen, ist aber sonst ziemlich unfähig, dann könnte man dieses Modell für Algebra nehmen und ein anderes für Poetry-Slams?

Sieht man davon ab dass du diesen Zufallsfaktor dann nur ein einziges mal hättest, spielt an diesem Punkt die von mir erwähnte Evolution eine Rolle, die Software gibt vor in welche Richtung sie die K.I. entwickeln soll. Du siehst, wir drehen uns schon wieder im Kreis, dir fehlen zum Verständnis vielleicht so ein paar Semster Grundlagen der Informatik ;-)

Martin Kraken · 23. Juli 2025

Summa schrieb:
Sieht man davon ab dass du diesen Zufallsfaktor dann nur ein einziges mal hättest, spielt an diesem Punkt die von mir erwähnte Evolution eine Rolle, die Software gibt vor in welche Richtung sie die K.I. entwickeln soll. Du siehst, wir drehen uns schon wieder im Kreis, dir fehlen zum Verständnis vielleicht so ein paar Semster Grundlagen der Informatik

Ich bin nicht sicher, was du genau mit ‚Evolution‘ meinst oder wie die Software selbst eine Richtung vorgeben sollte. Bei einem LLM bestimmt letztlich der Trainingsprozess – also die Daten und die Optimierungsfunktion – wie sich das Modell entwickelt. Die Software selbst enthält keine eigenen Ziele, sie ist nur ein Werkzeug, das die Parameter so anpasst, dass der Fehler auf den Trainingsdaten minimiert wird.

Summa · 23. Juli 2025

Martin Kraken schrieb:
Ich bin nicht sicher, was du genau mit ‚Evolution‘ meinst oder wie die Software selbst eine Richtung vorgeben sollte.

Summa schrieb:
Prinzipbedingt läuft der Lernprozess der K.I. evolutionär ab, in der Natur bestimmt die Umgebung die Resultate während bei einer K.I. Software/Code bestimmt wie die Daten verarbeitet und gewichtet werden. Man hat also die Wahl an diesen beiden Stellschrauben (Code/Lerndaten) zu drehen um ein bestimmtes Ergebnis zu erreichen - beim LLM könnte das auch ein Bereich sein, vielleicht weil Sprache etwas sehr subjektives ist - wie man unter anderem bei unsere Diskussion merkt.

Cee · 23. Juli 2025

Die Wirtschaft ist enttäuscht und stampft 40% ihrer AI-Projekte ein, während die Halluzinationsrate mit der Weiterentwicklung wieder zunimmt; Zweifel, ob die derzeitigen Modelle der Weg zur generellen AI sind:

Zweifel an Künstlicher Intelligenz: Experten warnen vor der Vergeudung von Milliarden

In den Hype um KI mischt sich Skepsis. So beeindruckend die neue Technik sein kann, so ernüchternd bleiben ihre Schwächen. Lohnen sich die Rekordinvestitionen überhaupt?

www.tagesspiegel.de

Martin Kraken · 23. Juli 2025

Cee schrieb:
Die Wirtschaft ist enttäuscht und stampft 40% ihrer AI-Projekte ein, während die Halluzinationsrate mit der Weiterentwicklung wieder zunimmt; Zweifel, ob die derzeitigen Modelle der Weg zur generellen AI sind:

Zweifel an Künstlicher Intelligenz: Experten warnen vor der Vergeudung von Milliarden

In den Hype um KI mischt sich Skepsis. So beeindruckend die neue Technik sein kann, so ernüchternd bleiben ihre Schwächen. Lohnen sich die Rekordinvestitionen überhaupt?

www.tagesspiegel.de

Ist leider hinter einer Paywall. Deutschland und Europa ist ja komplett abgehängt was KI angeht, ist halt auch ein demographisches Problem, zu viele alte Menschen, die an alten Konzepten hängen. Damit verliert man aber auch den Einfluss auf die Steuerbarkeit der Entwicklung. Aufhalten wird man die Entwicklung nicht können, auch nicht wenn man die Augen verschliesst wie Kevinside.

Falls es in dem Artikel um irgendwelche Aussagen von Apple geht, die habens ja auch verschlafen und stehn vor dem aus.

Martin Kraken · 23. Juli 2025

@Summa
„ Software/Code bestimmt wie die Daten verarbeitet und gewichtet werden“

Du musst halt mal näher ausführen, weil so wird halt nicht klar, ob du den Unterschied zu einem gewöhnlichen Programm verstanden hast und warum man davon spricht, dass ein neuronales Netz nicht programmiert wurde, sondern lernt. Natürlich ist es am Ende Software/Code/Variablen, aber es geht doch darum verständlich zu machen, dass es eben einen Unterschied zu einem gewöhnlichen Programm gibt. Die Software gewichtet zwar die Trainingsdaten, aber eben alle Trainingsdaten nach dem gleichen Prinzip. Wie eine Backform, der Kuchen hat zwar die selbe Form aber je nach Zutaten ist er ein Schokoladenkuchen oder ein Zitronenkuchen.

Summa · 23. Juli 2025

Martin Kraken schrieb:
Du musst halt mal näher ausführen, weil so wird halt nicht klar, ob du den Unterschied zu einem gewöhnlichen Programm verstanden hast und warum man davon spricht, dass ein neuronales Netz nicht programmiert wurde, sondern lernt.

Darwin und Evolutionstheorie ist hoffentlich klar und wie die Umwelt einen Einfluss auf die Entwicklung der Arten hat und bei der K.I. könnte man das was die Software macht vielleicht Guided Learning nennen ;-)

Summa · 23. Juli 2025

Martin Kraken schrieb:
Die Software gewichtet zwar die Trainingsdaten, aber eben alle Trainingsdaten nach dem gleichen Prinzip. Wie eine Backform, der Kuchen hat zwar die selbe Form aber je nach Zutaten ist er ein Schokoladenkuchen oder ein Zitronenkuchen.

Was ist die Zielvorgabe für die K.I. alle Kuchen die man mit den Zutaten backen kann oder sich mit dir über Kuchen zu unterhalten?

Martin Kraken · 23. Juli 2025

Summa schrieb:
Was ist die Zielvorgabe für die K.I. alle Kuchen die man mit den Zutaten backen kann oder sich mit dir über Kuchen zu unterhalten?

Es gibt keine Zielvorgabe in der Software, sie ist ne Backform, je nach dem was für Zutaten du reinmachst kommt nen anderer Kuchen raus, aber die Backform bleibt immer die selbe. Die Zutaten sind die Texte in den Trainingsdaten und diese Texte enthalten sowohl die Frage (Input), als auch die Antwort (Ziel). Wenn du den Satz hast "Die Katze frisst Fisch" als Trainingsdaten nutzt, dann kannst du für den Input "Fisch" löschen und hast "Die Katze frisst" was du vorne ins Netz einspeist und hinten überprüft die Software, ob das Netz "Fisch" ausgibt, wenn nicht wird es neu eingestellt. a.E. man kann es sich wie eine Entschlüsselung/Verschlüsselung und Kompression vorstellen. Aus den Billionen an Texten werden die Muster extrahiert, in der Sprache eines neuronalen Netzes gespeichert und dadurch komprimiert, am Output wird das dann wieder in unsere Sprache übersetzt.

Summa schrieb:
Darwin und Evolutionstheorie ist hoffentlich klar und wie die Umwelt einen Einfluss auf die Entwicklung der Arten hat und bei der K.I. könnte man das was die Software macht vielleicht Guided Learning nennen

Es ist im Prinzip wie ein Lehrer der nicht lehrt und nichts erklärt und auch nicht vorgibt was gelernt werden soll, sondern nur überprüft, ob die Kinder die richtige Antwort geben (die er selbst nur abliest und nicht versteht) und wenn nicht, müssen sie weiter im Buch (Trainingsdaten) lesen.

Es ist kein Evolution, denn es wird nicht zufällig ein Wert verändert und dann geschaut was besser ist, sondern eine Backpropagation des Zielwerts. Aber das nur ein Detail, sehr abstrakt zur besseren Vorstellung kann man auch von Evolution sprechen.

Hier mal eine Vorlesung von einem Nobelpreisträger der gleich am Anfang erklärt warum ein evolutionärer Ansatz sehr langsam und ineffizient ist.

Summa · 23. Juli 2025

Nur kurz, weil ich gerade auf dem Sprung bin;

Martin Kraken schrieb:
Es gibt keine Zielvorgabe in der Software, sie ist ne Backform, je nach dem was für Zutaten du reinmachst kommt nen anderer Kuchen raus, aber die Backform bleibt immer die selbe.

Warum sollte man dann eine K.I. Programmieren? Selbst wenn du einem Menschen etwas beibringst hast musst du ihm an irgend einem Punkt sagen wenn das Ergebnis deinen Vorstellungen entspricht, ansonsten kann er ja nur raten was er machen soll und da wunderst du dich dass die Ergebnisse der Reihenfolge deiner Eingabe entsprechen.

Martin Kraken schrieb:
Die Zutaten sind die Texte in den Trainingsdaten und diese Texte enthalten sowohl die Frage (Input), als auch die Antwort (Ziel).

Das Training ist es der K.I. den Unterschied zwischen gewünschtem und unerwünschtem Output zu zeigen, die Evolution besteht darin mit jedem neuen Input weniger Fehler bei der Erkennung der gesuchten Daten zu machen, damit die K.I. die Arbeit schneller und effizienter als ein Mensch machen kann.

ganje · 23. Juli 2025

DanReed schrieb:
Das ist auch genau meine Beobachtung. Es gibt Beispiele, bei denen geht alles gut (vermutlich stammen sie aus dem Trainingsmaterial des jeweiligen Systems), aber real-world klingen doch immer einige Stems ganz unglaublich schlecht. Ähnlich wie mp3 mit 64kBit, aber schlechter.

Ich habe mit Spectralayers schon gute Resultate erzielt. Perfekt waren sie zwar nicht, aber brauchbar. Hängt natürlich viel vom Ausgangsmaterial ab. Sollte in guter Qualität sein und am besten mit konventionellen Instrumenten (Drums, Bass, Gitarre, Piano, Stimme) und nicht zu viele Effekte haben.

Martin Kraken · 23. Juli 2025

Summa schrieb:
Nur kurz, weil ich gerade auf dem Sprung bin;

Warum sollte man dann eine K.I. Programmieren? Selbst wenn du einem Menschen etwas beibringst hast musst du ihm an irgend einem Punkt sagen wenn das Ergebnis deinen Vorstellungen entspricht, ansonsten kann er ja nur raten was er machen soll und da wunderst du dich dass die Ergebnisse der Reihenfolge deiner Eingabe entsprechen.

Das Training ist es der K.I. den Unterschied zwischen gewünschtem und unerwünschtem Output zu zeigen, die Evolution besteht darin mit jedem neuen Input weniger Fehler bei der Erkennung der gesuchten Daten zu machen, damit die K.I. die Arbeit schneller und effizienter als ein Mensch machen kann.

Eine neuronales Netz ist nicht programmiert. Es muss nicht raten, denn die Ziele befinden sich in den Texten selbst und nicht in der Software. Evolution ist eine schöne Analogie, ist technisch aber nicht richtig, denn Backpropagation ist keine Evolution. Jedoch werden evolutionsähnliche Mechanismen beim Fine-Tuning der Modelle eingesetzt.

Ich habe dir hier nochmal die exakte Stelle rausgesucht, bitte schaus dir an, ich bin müde es zu erklären. Wenn du es einem Nobelpreisträger nicht glaubst, dann habe ich auch keine Chance es dir zu erklären. (Du kannst das Video auch auf Deutsch stellen, wenn das das Problem sein sollte).

Kevinside · 23. Juli 2025

Das bleibt die Frage... Kann AI wirklich intelligent handeln oder kombiniert sie nur das Wiessen, was ihr antrainiert wurde?
Kann eine KI individuell funktionieren oder täuscht sie das nur vor, weil sie damit trainiert wurde...
Selber habe ich keine Chance gegen eine Ki die mit dem ganzen Internet gefüttert wurde, aber nur alleine durch Informationen, ensteht noch lange nicht eine reale künstliche Intelligenz...

Ich selber bin geistig behindert, was viele Vorteile bringt, aber auch Nachteile...
Aber der Gedächtnispalast hat mir geholfen...

Summa · 23. Juli 2025

Martin Kraken schrieb:
Eine neuronales Netz ist nicht programmiert. Es muss nicht raten, denn die Ziele befinden sich in den Texten selbst und nicht in der Software.

Ich hab' den Verdacht du hast bisher nur mit pre-trained K.I.s gearbeitet :dunno:

, denn das Training würde ansonsten nur funktionieren wenn die Daten bereits gelabelt wären.

Martin Kraken schrieb:
Wenn du es einem Nobelpreisträger nicht glaubst, dann habe ich auch keine Chance es dir zu erklären. (Du kannst das Video auch auf Deutsch stellen, wenn das das Problem sein sollte).

War das nicht der Nobelpreisträger der für mich unverständlicher Weise plötzlich Panik vor K.I. gemacht hat ;-)

Martin Kraken schrieb:
denn Backpropagation ist keine Evolution

War damit auch nicht gemeint, das scheint eine ganz andere Baustelle zu sein:
Quelle: https://www.ibm.com/de-de/think/topics/backpropagation

Backpropagation ist die Abkürzung für „Backward Propagation of Error“ (Rückwärtsausbreitung von Fehlern) und eine elegante Methode, um zu berechnen, wie sich Änderungen an den Gewichten oder Verzerrungen eines neuronalen Netzes auf die Genauigkeit von Modellvorhersagen auswirken. Sie ist unerlässlich für die Verwendung von überwachtem Lernen, halbüberwachtem Lernen oder selbstüberwachtem Lernen, um neuronale Netze zu trainieren.

Martin Kraken · 24. Juli 2025

Summa schrieb:
Ich hab' den Verdacht du hast bisher nur mit pre-trained K.I.s gearbeitet , denn das Training würde ansonsten nur funktionieren wenn die Daten bereits gelabelt wären.

Dieser Satz ergibt keinen Sinn. Das zentrale Training eines LLMs erfolgt ohne jedes Labeling, die Labels werden aus den Texten selbst erzeugt. Nur beim Fine-Tuning nutzt man Labels, also zusätzliche Information oder gezielte sehr spezifische Informationen für eine Aufgabe. Ändert aber nichts daran, dass diese Ziele in den Trainingsdaten sind. Ohne Finetuning sind die meisten Modelle heute schon sehr gut, sie würden sich halt teilweise wie ein Arschloch verhalten, deshalb muss man ihnen zum Schluss nochmal gelabelte Daten geben die ihnen klar machen "Du bist ein Wichser" ist negativ und soll nicht benutzt werden. Ironie muss z.B, gelabelt werden, auch wenn manche Modelle sehr gut mit Ironie umgehen können. Der Witz an LLMs und warum sie so gut sind, liegt aber daran, dass man eben keine von Hand erstellten Labels braucht und einfach alle Texte die man zu fassen bekommt durchjagen kann.

Summa schrieb:
War das nicht der Nobelpreisträger der für mich unverständlicher Weise plötzlich Panik vor K.I. gemacht hat

Man nennt ihn auch the Godfather of AI, ich verstehe das, du hast natürlich mehr Ahnung als er. Er hat nicht nur den Nobelpreis gewonnen, sondern auch den Turing Award.

Summa schrieb:
War damit auch nicht gemeint, das scheint eine ganz andere Baustelle zu sein:
Quelle: https://www.ibm.com/de-de/think/topics/backpropagation

Es ist keine andere Baustelle. Du kannst dir die ersten paar Minuten des Videos des Nobelpreisträgers anschauen, er erklärt dort warum Modelle nach dem Evolutionsprinzip nicht skalierbar sind und warum man stattdessen Backpropagation nutzt.

Martin Kraken · 24. Juli 2025

Kevinside schrieb:
Das bleibt die Frage... Kann AI wirklich intelligent handeln oder kombiniert sie nur das Wiessen, was ihr antrainiert wurde?
Kann eine KI individuell funktionieren oder täuscht sie das nur vor, weil sie damit trainiert wurde...
Selber habe ich keine Chance gegen eine Ki die mit dem ganzen Internet gefüttert wurde, aber nur alleine durch Informationen, ensteht noch lange nicht eine reale künstliche Intelligenz...

Ich selber bin geistig behindert, was viele Vorteile bringt, aber auch Nachteile...
Aber der Gedächtnispalast hat mir geholfen...

Irgendwann stellt sich halt die Frage was Intelligenz ist. LLMs erreichen bei Mensa-IQ-Tests etwa ein IQ von 135. Wobei sie an räumlichen, nicht textbasierten Aufgaben scheitern, dafür fast alle textbasierten Aufgaben zu 100% lösen können. Ein LLM decodiert die Welt nur anhand von Text. Wir sehen, hören, fühlen, riechen, schmecken usw. Natürlich haben wir deutlich mehr Informationen über die Welt als jemand der die Welt nur durch Text sieht. Der Mechanismus könnte aber der Selbe sein. Es gibt beim Training von LLMs zu nächst eine Phase wo das Modell sich nur Dinge merkt. Es kann nur auf gelerntes Antworten. Ab einem magischen Moment fängt es an zu generalisieren und erkennt Muster im gelernten (ohne das sich irgendwas geändert hätte, ganz von alleine). Dies bedeutet Generalisierung erfolgt automatisch in einem neuronalen Netz, ab einer bestimmten Menge an gemerkter Information. Dies könnte also bei uns genauso sein. Vielleicht können wir ab einer bestimmten Datenmenge generalisieren. Zunächst schafft das Kleinkind nur die Treppe im eigenen Haus und jede neue Treppe ist eine Herausforderung, aber wenn es genug Stufen auf verschiedenen Treppen genommen hat, dann kann es jede Treppe ohne Probleme meistern.

Summa · 24. Juli 2025

Martin Kraken schrieb:
Dieser Satz ergibt keinen Sinn. Das zentrale Training eines LLMs erfolgt ohne jedes Labeling, die Labels werden aus den Texten selbst erzeugt.

Ich versuche einfach nur zu verstehen wie du auf die Idee kommst, dass neuronale Netze einer K.I. aktuell schon besser funktionieren als biologische Vorbilder. Schon an diesem Punkt müsste dir klar dass du von falschen Voraussetzungen ausgehst, weil da rein von der verwendeten Technik bei binär arbeiteten Rechnern im Moment noch div. Grenzen gesetzt sind.
Menschen lernen ihre Muttersprache ja auch nicht ohne eine gewisse Form von Labeling z.B. die Objekte die sich dazu sehen. Worte sind in der Datenverarbeitung ja nur eine Reihe von Buchstaben (ASCII Codes, also eigentlich nur Zahlen) getrennt mit Leerzeichen, wenn eine K.I. das als Worte erkennt ergibt sich daraus dass ein gewisses Vorwissen bzw. Pre-Training vorhanden sein dürfte. Man hat die K.I. sicher nicht mit irgendwelche Buchstaben gefüttert und sie hat irgendwann von ganz alleine erkannt dass es Worte sind.
Es gibt auch unsupervised Algorithmen die ohne Labeling auskommt, das funktioniert aber eher wie in der Sesamstraße - "welche dieser Daten sind anders", erkennen von Muster und Unterschieden in Daten.
An diesem Punkt bin ich schon tiefer als geplant in den Kaninchenbau gestiegen, ich vermeide dabei mit irgendwelchen Fachbegriffen um mich zu werfen um Kompetenz vorzutäuschen.

Martin Kraken schrieb:
Man nennt ihn auch the Godfather of AI, ich verstehe das, du hast natürlich mehr Ahnung als er. Er hat nicht nur den Nobelpreis gewonnen, sondern auch den Turing Award.

Aber auch der wird gelegentlich Vorträge für ein Publikum mit geringem Vorwissen halten ohne weiter in die Details zu gehen. Von daher aus meiner Sicht ohne Zusammenhang eher eine Nebelkerze.

Martin Kraken · 24. Juli 2025

Summa schrieb:
Ich versuche einfach nur zu verstehen wie du auf die Idee kommst, dass neuronale Netze einer K.I. aktuell schon besser funktionieren als biologische Vorbilder. Schon an diesem Punkt müsste dir klar dass du von falschen Voraussetzungen ausgehst, weil da rein von der verwendeten Technik bei binär arbeiteten Rechnern im Moment noch div. Grenzen gesetzt sind.
Menschen lernen ihre Muttersprache ja auch nicht ohne eine gewisse Form von Labeling z.B. die Objekte die sich dazu sehen. Worte sind in der Datenverarbeitung ja nur eine Reihe von Buchstaben (ASCII Codes, also eigentlich nur Zahlen) getrennt mit Leerzeichen, wenn eine K.I. das als Worte erkennt ergibt sich daraus dass ein gewisses Vorwissen bzw. Pre-Training vorhanden sein dürfte. Man hat die K.I. sicher nicht mit irgendwelche Buchstaben gefüttert und sie hat irgendwann von ganz alleine erkannt dass es Worte sind.
Es gibt auch unsupervised Algorithmen die ohne Labeling auskommt, das funktioniert aber eher wie in der Sesamstraße - "welche dieser Daten sind anders", erkennen von Muster und Unterschieden in Daten.
An diesem Punkt bin ich schon tiefer als geplant in den Kaninchenbau gestiegen, ich vermeide dabei mit irgendwelchen Fachbegriffen um mich zu werfen um Kompetenz vorzutäuschen.

Aber auch der wird gelegentlich Vorträge für ein Publikum mit geringem Vorwissen halten ohne weiter in die Details zu gehen. Von daher aus meiner Sicht ohne Zusammenhang eher eine Nebelkerze.

Ein LLM baut keine Wörter aus Buchstaben. Jedes Wort ist vereinfacht gesagt ein Token, manchmal werden Wörter noch in mehrere Token aufgesplittet. Aber zur Vereinfachung sei jetzt mal jedes Wort ein Token. Für jedes dieser Token (Wörter) gibt es einen Inputknoten im Netz. Bei LLMs heisst dieser erste Layer Embedded Matrix. In jedem Knoten der ein Token(Wort) repräsentiert ist ein Vector gespeichert, der angibt wie stark er die unterschiedlichen Knoten im nächsten Layer verändert. Jetzt kommt der entscheidende Fakt den du verstehen musst. Die Werte in der Embedded Matrix werden zu Beginn zufällig erstellt. Das Netz startet also völlig naiv, ohne jedes Vorwissen. Es lernt die Bedeutung der Wörter durch das Training mit Billionen von Texten.

einseinsnull · 24. Juli 2025

Kevinside schrieb:
@einseinsnull
Und wieder drehst du dir die Welt, so wie sie dir gefällt.

ich drehe überhaupt nix. ich erfasse und zitiere deine texte genau so wie du sie geschrieben hast.

du willst kein licht anmachen weil hitler auch eine glühbirne hatte.

das ist nicht mal unterhaltsam, das ist einfach nur merkwürdig.

einseinsnull · 24. Juli 2025

DanReed schrieb:
Und die überwiegende Mehrheit der Programmierer, die das in VST-PlugIns gießen, und der Firmen, die das verkaufen, auch nicht!

man kann es immerhin lesen und interpretieren wenn es nicht gerade assembly ist. insofern ist es für den, der es codet, eher noch keine "black box".

beim ausführlichen herleiten und erklären der algorithmen wird es dann schon schwieriger. das kann dann nur noch der mathe prof; der software ingenieur ist da schon raus.

dennoch, mindestens der ursprüngliche erfinder weiß es ja und hat es irgendwo publiziert. insofern "weiß man es".

oder sagen wir mal... man könnte es wissen. wenn man wirklich ganz viel bock zum lesen hat.

dass zu viele leute, die nicht mal wissen wie gleitkomma-arithmetik funktioniert, software machen, da bin ich ganz bei dir. aber es gibt zum glück auch noch ein paar leute, die wissen, was sie tun, und von denen die anderen dann klauen können und das neuverpacken...

auch danreed:

Die spannenden Fragen sind vielmehr:
- wie verbessere (beschleunige) ich den Trainingsprozess?
- wie stelle ich sicher, dass mein Trainingsmaterial alle Fälle gleichmäßig abdeckt?
- wie finde ich die beste Netztopologie zur jeweiligen Aufgabe?

es gibt da eigentlich nur zwei möglichkeiten:

entweder ein komplett spezifisches design inclusive der möglichkeit, dass der user auf einer steuerbaren ebene selbst eingreifen kann.

die andere möglichkeit ist mehr speicher, mehr CPU cycles und mehr trainingsmaterial.

aktuell klingt das alles nach 12 bit und 512 fast fourier bins, aber wir sind auch schneller von GPT 2 zu GPT 4 gekommen als wir dachten und da liegen auch welten dazwischen.

ich kann mich noch gut erinnern wie der kollege @ neuronaut im jahr 1998 (?) den ersten vorläufer von sonicworx isolate und das pandora plug-in vorgestellt hat. letzteres kam dann sogar raus.

keine 27 jahre später und das AI zeug aus dem weltnetz klingt immer noch nach mpeg und funktioniert nur halb.

aber: die grundlagen dafür das jetzt bald mit relativ wenig zusätzlichem aufwand hochzubohren und 100 verschiedene versionen davon zu erstellen, sind jetzt da und im prinzip für jeden verfügbar.

-------------------------------

Martin Kraken schrieb:
Ein LLM baut keine Wörter aus Buchstaben.

du liest nicht mal was er schreibt und meinst schon wieder ihm irgendwas zusammengooglen und "erklären" zu müssen, was gar keine sinnvolle antwort auf das von ihm gesagte darstellt.

selbstverständlich muss erst mal eine software da sein, die erkennt, was ein zeichen ist, und natürlich besteht die eingabe (sowohl als auch das trainingsmaterial) aus einzelnen zeichen.

keine textprogramm funktion - kein LLM.

ob und wie und dass die KI dann mit worten oder ganzen sätzen operiert, dieses muster hat sie für sich alles ganz alleine herausgefunden, nachdem sie zuvor hinreichend mit einzelnen zeichen gefüttert wurde.

Martin Kraken schrieb:
Ist das jetzt Ironie? Ich komme nicht mehr mit. Meinst du LLMs mit Chatbots? Ich kann dazu gar nix mehr sagen. Entweder du verarscht mich oder du hast keine Ahnung was LLMs können. Kann ich vielleicht mit diesem Artikel weiterhelfen

https://www.linux-magazin.de/news/gemini-gewinnt-mathe-goldmedaille/

dass gemini mit wolfram trainiert wurde sagt dir notfalls sogar gemini. und manuell. und mit büchern und webseiten über mathematik.

in diesem artikel steht über trainingsmethode und -inhalte rein garnichts drin (wie nicht anders zu erwarten, wenn du eine "quelle" für irgendwas postest)

Martin Kraken schrieb:
LLMs sind keine Spielerei, du weißt nicht wovon du redest.

genau, wir sind alle blöd. hier und in allen anderen threads.

Martin Kraken schrieb:
Schau, wenn keiner es nachvollziehen kann, nicht mal die Programmierer und selbst wenn sie sich Monate hinsetzen würden und die Parameter studieren,

du sagst es ja selbst: man kann es zwar nicht unmittelbar nachvollziehen, aber man könnte es analysieren, indem man hineinschaut.

ob man das jetzt blackbox nennt oder nicht blackbox nennt ist onanie.

ich google jetzt auch mal.... frau google erklärt es hier eigentlich ganz gut:

wer aufgepasst hat, wird sich an meine argumentation erinnern, dass exakt genau das gleiche auch für jegliche andere software gilt.

daher stellt sich hier die frage, warum dir diese feststellung eigentlich so furchtbar wichtig ist.

was genau hat die frage ob das eine black box ist damit zu tun, wie man das zum musikmachen einsetzen kann.

Martin Kraken schrieb:
dann ist es eine Blackbox. Es ist belustigend, weil ich habe mir das mit der Blackbox ja nicht ausgedacht, sondern das ist Konsens unter Wissenschaftlern die sich mit dem Thema befassen (ja auch denen die staatlich bezahlt werden, also richtige Wissenschaftler im Sinne dieses Forums). Jetzt fragt man sich, wie ein ganzes Forum der Meinung seien kann, der Begriff Blackbox und AI sei Schwachsinn. Es scheint hier im Forum eine Zusammenkunft der Allwissenden zu geben, die alle eine gegenteilige Meinung haben.

auch das hast du dir schon fast selbst beantwortet, nämlich als du eingeräumt hast, dass es neben LLMs auch noch andere anwendgunen gibt, die unter "AI" fallen.

vielleicht stößt du deswegen auch wenig gegenliebe, weil LLMs halt verhältnismäßig wenig mit "AI zum musikmachen" zu tun hat?

wenn ich über "AI zum musikmachen" diskutiere, dann denke ich dabei an die anwendungen die ich so kenne und benutze (oder, im falle von super-einfachen netzwerken für ein paar tausend einzelne werte, selbst erstelle) und dann kommst du mit deinem chatbot und sumo scheiß an, wo natürlich ein paar dinge wieder anders sind und dann passt das natürlich nicht mehr zusammen.

aber vielleicht erübrigt sich die ganze diskussion auch in ein paar jahren, wenn die systeme dann noch 100 mal größer sind als die heutigen und trotzdem lokal auf dem iphone laufen.

Summa · 24. Juli 2025

Martin Kraken schrieb:
Ein LLM baut keine Wörter aus Buchstaben. Jedes Wort ist vereinfacht gesagt ein Token, manchmal werden Wörter noch in mehrere Token aufgesplittet. Aber zur Vereinfachung sei jetzt mal jedes Wort ein Token. Für jedes dieser Token (Wörter) gibt es einen Inputknoten im Netz. Bei LLMs heisst dieser erste Layer Embedded Matrix. In jedem Knoten der ein Token(Wort) repräsentiert ist ein Vector gespeichert, der angibt wie stark er die unterschiedlichen Knoten im nächsten Layer verändert. Jetzt kommt der entscheidende Fakt den du verstehen musst. Die Werte in der Embedded Matrix werden zu Beginn zufällig erstellt. Das Netz startet also völlig naiv, ohne jedes Vorwissen. Es lernt die Bedeutung der Wörter durch das Training mit Billionen von Texten.

Wenn die K.I. die Wörter gespeichert hat, dann sind die wahrscheinlich auch auf irgend eine Weise sinnvoll gelabelt, ich denke du bist beim Verständnis immer noch auf der User Ebene der Software, Informationen die für die Nutzung der K.I. nicht wichtig sind werden wahrscheinlich nicht kommuniziert:
Siehe auch:

Machine Learning Labels einfach erklärt

Was sind Labels für Supervised Machine Learning? Wir definieren das Konzept und erklären, warum Labels so wichtig für überwachtes Lernen sind.

www.kobold.ai

Das was du beschreibst wär' das hier und das passt so gar nicht zu den von dir beschriebenen Ergebnissen:

Unsupervised Learning: Kompakt erklärt - Alexander Thamm

Unsupervised Machine Learning ist eine zentrale Methode im Machine Learning. Lese alles zur Definition, Abgrenzung und Funktion.

www.alexanderthamm.com

Martin Kraken · 24. Juli 2025

Summa schrieb:
Wenn die K.I. die Wörter gespeichert hat, dann sind die wahrscheinlich auch auf irgend eine Weise sinnvoll gelabelt, ich denke du bist beim Verständnis immer noch auf der User Ebene der Software, Informationen die für die Nutzung der K.I. nicht wichtig sind werden wahrscheinlich nicht kommuniziert:
Siehe auch:

Machine Learning Labels einfach erklärt

Was sind Labels für Supervised Machine Learning? Wir definieren das Konzept und erklären, warum Labels so wichtig für überwachtes Lernen sind.

www.kobold.ai

Das was du beschreibst wär' das hier und das passt so gar nicht zu den von dir beschriebenen Ergebnissen:

Unsupervised Learning: Kompakt erklärt - Alexander Thamm

Unsupervised Machine Learning ist eine zentrale Methode im Machine Learning. Lese alles zur Definition, Abgrenzung und Funktion.

www.alexanderthamm.com

Nein, sie sind nicht gelabelt in LLMs. Das ist es ja gerade was ich dir versuche zu erklären. Zu Beginn ist jeder Token naiv, es besitzt random Zahlen. Also dem Wort „Katze“ wurden ein Vector mit random Zahlen zugeordnet. Jetzt wird das Modell mit Texten gefüttert, die nicht gelabelt sind sondern einfach nur Texte. Ist der Text „Die Katze frisst Fisch“, dann ist der Input „Die Katze frisst“ und der Ziel-„Token“ „Fisch“. Der Text enthält also sein eigenes Label, nämlich in diesem Fall „Fisch“. Durch Backpropagation werden nun die Zahlen in den Vectoren der Knoten angepasst, bis das Modell „weiß“ nach „Die Katze frisst“ kommt „Fisch“. Das wird jetzt wiederholt mit Billionen von Texten.

Martin Kraken · 24. Juli 2025

einseinsnull schrieb:
man kann es immerhin lesen und interpretieren wenn es nicht gerade assembly ist. insofern ist es für den, der es codet, eher noch keine "black box".

beim ausführlichen herleiten und erklären der algorithmen wird es dann schon schwieriger. das kann dann nur noch der mathe prof; der software ingenieur ist da schon raus.

dennoch, mindestens der ursprüngliche erfinder weiß es ja und hat es irgendwo publiziert. insofern "weiß man es".

oder sagen wir mal... man könnte es wissen. wenn man wirklich ganz viel bock zum lesen hat.

dass zu viele leute, die nicht mal wissen wie gleitkomma-arithmetik funktioniert, software machen, da bin ich ganz bei dir. aber es gibt zum glück auch noch ein paar leute, die wissen, was sie tun, und von denen die anderen dann klauen können und das neuverpacken...

auch danreed:

es gibt da eigentlich nur zwei möglichkeiten:

entweder ein komplett spezifisches design inclusive der möglichkeit, dass der user auf einer steuerbaren ebene selbst eingreifen kann.

die andere möglichkeit ist mehr speicher, mehr CPU cycles und mehr trainingsmaterial.

aktuell klingt das alles nach 12 bit und 512 fast fourier bins, aber wir sind auch schneller von GPT 2 zu GPT 4 gekommen als wir dachten und da liegen auch welten dazwischen.

ich kann mich noch gut erinnern wie der kollege @ neuronaut im jahr 1998 (?) den ersten vorläufer von sonicworx isolate und das pandora plug-in vorgestellt hat. letzteres kam dann sogar raus.

keine 27 jahre später und das AI zeug aus dem weltnetz klingt immer noch nach mpeg und funktioniert nur halb.

aber: die grundlagen dafür das jetzt bald mit relativ wenig zusätzlichem aufwand hochzubohren und 100 verschiedene versionen davon zu erstellen, sind jetzt da und im prinzip für jeden verfügbar.

-------------------------------

du liest nicht mal was er schreibt und meinst schon wieder ihm irgendwas zusammengooglen und "erklären" zu müssen, was gar keine sinnvolle antwort auf das von ihm gesagte darstellt.

selbstverständlich muss erst mal eine software da sein, die erkennt, was ein zeichen ist, und natürlich besteht die eingabe (sowohl als auch das trainingsmaterial) aus einzelnen zeichen.

keine textprogramm funktion - kein LLM.

ob und wie und dass die KI dann mit worten oder ganzen sätzen operiert, dieses muster hat sie für sich alles ganz alleine herausgefunden, nachdem sie zuvor hinreichend mit einzelnen zeichen gefüttert wurde.

dass gemini mit wolfram trainiert wurde sagt dir notfalls sogar gemini. und manuell. und mit büchern und webseiten über mathematik.

in diesem artikel steht über trainingsmethode und -inhalte rein garnichts drin (wie nicht anders zu erwarten, wenn du eine "quelle" für irgendwas postest)

genau, wir sind alle blöd. hier und in allen anderen threads.

du sagst es ja selbst: man kann es zwar nicht unmittelbar nachvollziehen, aber man könnte es analysieren, indem man hineinschaut.

ob man das jetzt blackbox nennt oder nicht blackbox nennt ist onanie.

ich google jetzt auch mal.... frau google erklärt es hier eigentlich ganz gut:

Anhang anzeigen 259087

wer aufgepasst hat, wird sich an meine argumentation erinnern, dass exakt genau das gleiche auch für jegliche andere software gilt.

daher stellt sich hier die frage, warum dir diese feststellung eigentlich so furchtbar wichtig ist.

was genau hat die frage ob das eine black box ist damit zu tun, wie man das zum musikmachen einsetzen kann.

auch das hast du dir schon fast selbst beantwortet, nämlich als du eingeräumt hast, dass es neben LLMs auch noch andere anwendgunen gibt, die unter "AI" fallen.

vielleicht stößt du deswegen auch wenig gegenliebe, weil LLMs halt verhältnismäßig wenig mit "AI zum musikmachen" zu tun hat?

wenn ich über "AI zum musikmachen" diskutiere, dann denke ich dabei an die anwendungen die ich so kenne und benutze (oder, im falle von super-einfachen netzwerken für ein paar tausend einzelne werte, selbst erstelle) und dann kommst du mit deinem chatbot und sumo scheiß an, wo natürlich ein paar dinge wieder anders sind und dann passt das natürlich nicht mehr zusammen.

aber vielleicht erübrigt sich die ganze diskussion auch in ein paar jahren, wenn die systeme dann noch 100 mal größer sind als die heutigen und trotzdem lokal auf dem iphone laufen.

Zur Klärung; Es gibt den Programcode, die Backform und die Trainingsdaten, die Zutaten. Daraus entsteht ein Kuchen. Wir wissen wie die Backform aussieht, wir kennen die Zutaten und wissen wie der fertige Kuchen schmeckt. Was beim backen genau passiert wissen wir nicht. Wenn wir es ganz genau untersuchen bekommen wir vielleicht sehr viele der chemischen Reaktionen heraus. Aber im Gegensatz zu einem Kuchen, sind es in einem LLM billionen verschiedener Zutaten die den Kuchen ergeben.

Wenn du weisst wie Stem-Seperation Modelle funktionieren(auf Code- Ebene), dann klär uns auf, das ist bestimmt interessant.

Ich kann ja schon mal mit einem a.E. anfangen. Wir haben einen Input, das ist der Mix und ein Ziel, das ist nur eine Stem (Gesang/Drums etc,). Jetzt werden 5 Sekunden davon genommen und jede Freq. zu einem bestimmten Zeitpunkt einem Node zugeordnet, der dann die Amplitude dieser Freq. aufnimmt und in das Netz einspeist. Der Rest läuft dann wie immer über Backpropagation.

Summa · 24. Juli 2025

Martin Kraken schrieb:
Nein, sie sind nicht gelabelt in LLMs. Das ist es ja gerade was ich dir versuche zu erklären.

Die Artikel die ich gelesen hab' beziehen sich auch auf Sprachmodelle, warum soll es in deinem Fall anders sein?

Martin Kraken schrieb:
Zu Beginn ist jeder Token naiv, es besitzt random Zahlen.

Echte Random zahlen können das ja Prinzip bedingt bei Computer nicht sein, aber das hatten wir ja schon weiter vorne. Die Token für die jeweiligen Worte müssen ja schon irgendwo in der Datenbank stecken, woher soll die K.I. sonst wissen dass es Worte sind was du da eingibst oder ist alles mit Leerzeichen ein Wort und wenn ja kannst du da auch stattdessen auch Sonderzeichen und Kauderwelsch eingeben?
Rein von der Begrifflichkeit muss ich bei Token an ein Interpreter Programmiersprachen denken. Von der Logik, wie Computer funktionieren gibt das was du mir erzählst ohne eine vielleicht für dich unsichtbare darüberliegende Schicht keinen Sinn, falls es ich um Open Source handelt findet man vielleicht nähere Information über die Arbeitsweise irgendwo im Netz :dunno:

Martin Kraken schrieb:
Durch Backpropagation werden nun die Zahlen in den Vectoren der Knoten angepasst, bis das Modell „weiß“ nach „Die Katze frisst“ kommt „Fisch“.

Wie ich bereits zitiert habe passt Backpropagation eine bereits vorhandenes Neuronales Netz bei Veränderung der Gewichtung an, es erscheint mir eher unwahrscheinlich dass im K.I. Bereich der selbe Begriff für unterschiedliche Prozesse verwendet wird. Es lässt zumindest den Verdacht zu das es sich bei dem von dir verwendeten Modell um ein vortrainiertes handelt, das im Nachhinein durch deine Eingaben eine Anpassung vornimmt.

Martin Kraken schrieb:
Das wird jetzt wiederholt mit Billionen von Texten.

Sind die "Billionen von Texte" schon Teil der Datenbank?

Martin Kraken · 24. Juli 2025

Summa schrieb:
Die Artikel die ich gelesen hab' beziehen sich auch auf Sprachmodelle, warum soll es in deinem Fall anders sein?

Echte Random zahlen können das ja Prinzip bedingt bei Computer nicht sein, aber das hatten wir ja schon weiter vorne. Die Token für die jeweiligen Worte müssen ja schon irgendwo in der Datenbank stecken, woher soll die K.I. sonst wissen dass es Worte sind was du da eingibst oder ist alles mit Leerzeichen ein Wort und wenn ja kannst du da auch stattdessen auch Sonderzeichen und Kauderwelsch eingeben?
Rein von der Begrifflichkeit muss ich bei Token an ein Interpreter Programmiersprachen denken. Von der Logik, wie Computer funktionieren gibt das was du mir erzählst ohne eine vielleicht für dich unsichtbare darüberliegende Schicht keinen Sinn, falls es ich um Open Source handelt findet man vielleicht nähere Information über die Arbeitsweise irgendwo im Netz

Wie ich bereits zitiert habe passt Backpropagation eine bereits vorhandenes Neuronales Netz bei Veränderung der Gewichtung an, es erscheint mir eher unwahrscheinlich dass im K.I. Bereich der selbe Begriff für unterschiedliche Prozesse verwendet wird. Es lässt zumindest den Verdacht zu das es sich bei dem von dir verwendeten Modell um ein vortrainiertes handelt, das im Nachhinein durch deine Eingaben eine Anpassung vornimmt.

Sind die "Billionen von Texte" schon Teil der Datenbank?

Puh, ich verstehe ja von wo du kommst. Du kennst dich aus mit Informatik, Logik, Programmen usw. Worum es geht ist, zu verstehen was ein wenig anders ist. Es gibt keine Datenbank, ein LLM speichert keine Wörter im herkömmlichen Sinne. Wie gesagt, gibt es eine sogenannte Embedded Matrix für den Input, diese Embedded Matrix hat ein Vokabular mit einer bestimmten Anzahl an Token die es erkennt. Und ja, dieses erkennen ist programmiert. Ums mal scherzhaft zu schreiben: If Wort = "Ball" then goto 10. in unserem Fall eine bestimmte Zeile in der Embedded Matrix, die den Vector für das Wort gespeichert hat. Das ist ja komplett banal und hat überhaupt nix mit der eigentlichen Diskussion zu tun.

Ein neuronales Netz ist immer vorhanden, es entsteht nicht. Es sind einfach Knotenpunkte mit Variablen, die am Anfang zufällig eingestellt sind. Während das Modell lernt verändert es diese Variablen, es entstehen keine neuen Variablen, sie werden nur verändert je nach dem wie weit weg der Output, am Ende des Netzes entfernt ist vom Zielwert. Backpropagation ist der Algorhythmus mit dem die Variablen angepasst werden und das ist das Training. Wenn du meinst, das neuronale Netz wird irgendwie trainiert und wenns fertig ist, dann wird Backpropagation eingesetzt, dann NEIN. Backpropagation ist der zentrale Mechanismus für das Training eines neuronalen Netzes. Quasi zu jeder Zeit.

Summa · 24. Juli 2025

Martin Kraken schrieb:
Wie gesagt, gibt es eine sogenannte Embedded Matrix für den Input, diese Embedded Matrix hat ein Vokabular mit einer bestimmten Anzahl an Token die es erkennt.

Also doch 'ne Datenbank, also kein Kauderwelsch möglich, was meine Annahme bestätigen würde. Jetzt müsste ich nur noch wissen woher die Billionen Texte zum Vergleich kommen. Die wird die K.I. kaum google können ;-)

Martin Kraken schrieb:
Wenn du meinst, das neuronale Netz wird irgendwie trainiert und wenns fertig ist, dann wird Backpropagation eingesetzt, dann NEIN.

So beschreibt das mehr als nur eine Quelle im Netz und das würde sich auch mit der eigentlichen Bedeutung (grob übersetzt Rückbereitung) des Begriffs am ehesten decken. Über welche LLM sprechen wir hier?

Martin Kraken · 24. Juli 2025

Summa schrieb:
Also doch 'ne Datenbank, also kein Kauderwelsch möglich, was meine Annahme bestätigen würde. Jetzt müsste ich nur noch wissen woher die Billionen Texte zum Vergleich kommen. Die wird die K.I. kaum google können

So beschreibt das mehr als nur eine Quelle im Netz und das würde sich auch mit der eigentlichen Bedeutung (grob übersetzt Rückbereitung) des Begriffs am ehesten decken. Über welche LLM sprechen wir hier?

Ich glaube kaum, dass eine Quelle das so beschreibt. Ich hatte dir schon Videos verlinkt, zum Beispiel das des Nobelpreisträgers, aber du willst sie nicht anschauen. Es heist Backpropagation, weil es die Werte von hinten nach vorne anpasst. Du hast Evolution vorgeschlagen, also eine zufällige Veränderung der Variablen in einem Netz und danach schaut man, ob man zufällig dem Ziel näher kommt. Bei Backpropagation verstellt man die Werte in den Knoten so, dass am Ende der Outputknoten mit dem Ziel einen eine höheren Wert bekommt. Es ist kein Bonus oder irgendwas was man später macht wenn das Netz fertig trainiert oder fast fertig trainiert ist. Es ist der zentrale Mechanismus, wie das System lernt.

Die KI kann googlen ;-)

Das tut sie auch, noch nicht Chatgpt ausprobiert? Das hat aber nichts mit dem Training zu tun. Die Texte sind einfach alle Texte die die Firmen bekommen können, Bücher, Internetseiten, Social-Media, wissenschaftliche Texte, Transkripte von Filmen oder Fernsehen. Im Idealfall alle Texte die jemals geschrieben wurden.

Einsatz von AI zum Musik machen

Summa

hate is always foolish…and love, is always wise...

Anfänger

Anfänger

Summa

hate is always foolish…and love, is always wise...

Anfänger

Summa

hate is always foolish…and love, is always wise...

been there, done that

Anfänger

Anfänger

Summa

hate is always foolish…and love, is always wise...

Summa

hate is always foolish…and love, is always wise...

Anfänger

Summa

hate is always foolish…and love, is always wise...

ganje

Benutzerdefiniert

Anfänger

Kevinside

Sterbn war gestern. I leb ewig....

Summa

hate is always foolish…and love, is always wise...

Anfänger

Anfänger

Summa

hate is always foolish…and love, is always wise...

Anfänger

[nur noch PN]

[nur noch PN]

Summa

hate is always foolish…and love, is always wise...

Anfänger

Anfänger

Summa

hate is always foolish…and love, is always wise...

Anfänger

Summa

hate is always foolish…and love, is always wise...

Anfänger

Similar threads