Einsatz von AI zum Musik machen

Summa · Gestern um 01:04

Martin Kraken schrieb:
a.E. Ich glaube nicht, dass es eine Rolle spielt, aber vielleicht wäre ein echter Zufall der Schlüssel zu AGI? Nur Spaß.

Das hat nix mit Glauben zu tun, wenn da bei einem Modell irgendwas mit Zufall stattfindet kann das Aufgrund der Technik nur vom Programmierer gewollt sein.

Martin Kraken · Gestern um 01:05

DanReed schrieb:
Das ist auch genau meine Beobachtung. Es gibt Beispiele, bei denen geht alles gut (vermutlich stammen sie aus dem Trainingsmaterial des jeweiligen Systems), aber real-world klingen doch immer einige Stems ganz unglaublich schlecht. Ähnlich wie mp3 mit 64kBit, aber schlechter.

Will auch keiner, muss auch keiner. Weiß auch jeder, der sich damit auskennt, denn diese Information wäre völlig unerheblich, denn
1) bereits beim nächsten kompletten Trainingslauf wäre wieder alles ganz anders und
2) die Vorstellung, dass irgendwelche ganz bestimmten Nodes irgendein klar identifizierbares Wissen beinhalten, trifft nicht zu. Das gesamte trainierte Wissen verteilt sich ineinander verschachtelt und überlagert auf das komplette Netz. Natürlich gibt es dann irgendwelche Regionen im Netz, die besonders aktiv bei bestimmten Wortfeldern sind, aber was nützt mir die Information, wenn sich eh alles neu organisiert beim nächsten Trainingslauf.

Nein, es gibt schon seit mehr als 2 Jahrzehnten den Konsens, keine Visualisierungsversuche zu unternehmen (es sei denn, sie sollen den Medien als "Futter" dienen für "aufregende" Berichte). Er gibt bereits bei einfachsten Neuronalen Netzen keinen Erkenntnisgewinn durch Visualisierung. Sind sie zu einfach, begreift jeder, wie sie funktionieren (ähnlich einer Linearen Regression), aber sobald mehr als ca. 20 Neuronen mit allen Verbindungen beteiligt sind, wird das Ganze unübersichtlich und ist vor allem bei jedem Trainingslauf anders, da es meistens kein globales Optimum gibt, sondern statt dessen viele lokale. Und bei jedem Trainingslauf landet das Netz in einem anderen lokalen Optimum (das mal weiter mal weniger weit vom Optimum entfernt ist).

Die spannenden Fragen sind vielmehr:
- wie verbessere (beschleunige) ich den Trainingsprozess?
- wie stelle ich sicher, dass mein Trainingsmaterial alle Fälle gleichmäßig abdeckt?
- wie finde ich die beste Netztopologie zur jeweiligen Aufgabe?
- ...

Das ist 1) alles nicht so einfach, 2) alles nicht so neu, 3) alles nicht so gut, wie man als Laie zunächst annimmt.

Das ist ungefähr das was ich seit mehreren Seiten versuche zu erklären. Wobei EAI sehr wohl ein großes Thema war um 2023 und manche Firmen wie Anthropic daran forschen, ob nur für die Show oder ob sie wirklich eine Idee haben, kann man natürlich nicht sagen. a.E. Behalte ich den gleichen Seed, sollte das Netz reproduzierbar sein (sieht man mal von irgendwelchen GPU Floating-Point-Rundungsfehlern oder asynchroner Berechnungen). Lösche ich nun einen Trainingssatz so kann ich diesen Trainingssatz bestimmten Parameterveränderungen zuordnen im finalen Model. Nicht realistisch durchführbar, aber wäre eine Möglichkeit ;-)

Es wäre interessant was für Ansätze Anthropic hat, aber die werden sie wahrscheinlich nicht verraten.

Martin Kraken · Gestern um 01:21

Summa schrieb:
Das hat nix mit Glauben zu tun, wenn da bei einem Modell irgendwas mit Zufall stattfindet kann das Aufgrund der Technik nur vom Programmierer gewollt sein.

Der Seed, also die Parameter vor dem ersten Training sind zufällig gewählt und die Reihenfolge der Trainingsdaten kann zufällig variiert werden. Alleine der Zufall im Seed kann ein völlig anderes Modell ergeben, welches auch andere Antworten gibt, weil es eine andere Lösungsstrategie gefunden hat. Man trainiert also verschiedene Modelle mit verschiedenen Seeds, aber gleichen Trainingsdaten und nimmt das was die besten Ergebnisse zeigt (sehr vereinfacht). Manchmal macht man auch Ensembles (a.E.) oder vielleicht hat ein Modell ne geile Strategie gefunden um Algebra zu lösen, ist aber sonst ziemlich unfähig, dann könnte man dieses Modell für Algebra nehmen und ein anderes für Poetry-Slams?

Summa · Gestern um 01:51

Martin Kraken schrieb:
Der Seed, also die Parameter vor dem ersten Training sind zufällig gewählt und die Reihenfolge der Trainingsdaten kann zufällig variiert werden. Alleine der Zufall im Seed kann ein völlig anderes Modell ergeben, welches auch andere Antworten gibt, weil es eine andere Lösungsstrategie gefunden hat. Man trainiert also verschiedene Modelle mit verschiedenen Seeds, aber gleichen Trainingsdaten und nimmt das was die besten Ergebnisse zeigt (sehr vereinfacht). Manchmal macht man auch Ensembles (a.E.) oder vielleicht hat ein Modell ne geile Strategie gefunden um Algebra zu lösen, ist aber sonst ziemlich unfähig, dann könnte man dieses Modell für Algebra nehmen und ein anderes für Poetry-Slams?

Sieht man davon ab dass du diesen Zufallsfaktor dann nur ein einziges mal hättest, spielt an diesem Punkt die von mir erwähnte Evolution eine Rolle, die Software gibt vor in welche Richtung sie die K.I. entwickeln soll. Du siehst, wir drehen uns schon wieder im Kreis, dir fehlen zum Verständnis vielleicht so ein paar Semster Grundlagen der Informatik ;-)

Martin Kraken · Gestern um 02:13

Summa schrieb:
Sieht man davon ab dass du diesen Zufallsfaktor dann nur ein einziges mal hättest, spielt an diesem Punkt die von mir erwähnte Evolution eine Rolle, die Software gibt vor in welche Richtung sie die K.I. entwickeln soll. Du siehst, wir drehen uns schon wieder im Kreis, dir fehlen zum Verständnis vielleicht so ein paar Semster Grundlagen der Informatik

Ich bin nicht sicher, was du genau mit ‚Evolution‘ meinst oder wie die Software selbst eine Richtung vorgeben sollte. Bei einem LLM bestimmt letztlich der Trainingsprozess – also die Daten und die Optimierungsfunktion – wie sich das Modell entwickelt. Die Software selbst enthält keine eigenen Ziele, sie ist nur ein Werkzeug, das die Parameter so anpasst, dass der Fehler auf den Trainingsdaten minimiert wird.

Summa · Gestern um 02:32

Martin Kraken schrieb:
Ich bin nicht sicher, was du genau mit ‚Evolution‘ meinst oder wie die Software selbst eine Richtung vorgeben sollte.

Summa schrieb:
Prinzipbedingt läuft der Lernprozess der K.I. evolutionär ab, in der Natur bestimmt die Umgebung die Resultate während bei einer K.I. Software/Code bestimmt wie die Daten verarbeitet und gewichtet werden. Man hat also die Wahl an diesen beiden Stellschrauben (Code/Lerndaten) zu drehen um ein bestimmtes Ergebnis zu erreichen - beim LLM könnte das auch ein Bereich sein, vielleicht weil Sprache etwas sehr subjektives ist - wie man unter anderem bei unsere Diskussion merkt.

Cee · Gestern um 06:02

Die Wirtschaft ist enttäuscht und stampft 40% ihrer AI-Projekte ein, während die Halluzinationsrate mit der Weiterentwicklung wieder zunimmt; Zweifel, ob die derzeitigen Modelle der Weg zur generellen AI sind:

Zweifel an Künstlicher Intelligenz: Experten warnen vor der Vergeudung von Milliarden

In den Hype um KI mischt sich Skepsis. So beeindruckend die neue Technik sein kann, so ernüchternd bleiben ihre Schwächen. Lohnen sich die Rekordinvestitionen überhaupt?

www.tagesspiegel.de

Martin Kraken · Gestern um 12:04

Cee schrieb:
Die Wirtschaft ist enttäuscht und stampft 40% ihrer AI-Projekte ein, während die Halluzinationsrate mit der Weiterentwicklung wieder zunimmt; Zweifel, ob die derzeitigen Modelle der Weg zur generellen AI sind:

Zweifel an Künstlicher Intelligenz: Experten warnen vor der Vergeudung von Milliarden

In den Hype um KI mischt sich Skepsis. So beeindruckend die neue Technik sein kann, so ernüchternd bleiben ihre Schwächen. Lohnen sich die Rekordinvestitionen überhaupt?

www.tagesspiegel.de

Ist leider hinter einer Paywall. Deutschland und Europa ist ja komplett abgehängt was KI angeht, ist halt auch ein demographisches Problem, zu viele alte Menschen, die an alten Konzepten hängen. Damit verliert man aber auch den Einfluss auf die Steuerbarkeit der Entwicklung. Aufhalten wird man die Entwicklung nicht können, auch nicht wenn man die Augen verschliesst wie Kevinside.

Falls es in dem Artikel um irgendwelche Aussagen von Apple geht, die habens ja auch verschlafen und stehn vor dem aus.

Martin Kraken · Gestern um 12:48

@Summa
„ Software/Code bestimmt wie die Daten verarbeitet und gewichtet werden“

Du musst halt mal näher ausführen, weil so wird halt nicht klar, ob du den Unterschied zu einem gewöhnlichen Programm verstanden hast und warum man davon spricht, dass ein neuronales Netz nicht programmiert wurde, sondern lernt. Natürlich ist es am Ende Software/Code/Variablen, aber es geht doch darum verständlich zu machen, dass es eben einen Unterschied zu einem gewöhnlichen Programm gibt. Die Software gewichtet zwar die Trainingsdaten, aber eben alle Trainingsdaten nach dem gleichen Prinzip. Wie eine Backform, der Kuchen hat zwar die selbe Form aber je nach Zutaten ist er ein Schokoladenkuchen oder ein Zitronenkuchen.

Summa · Gestern um 13:13

Martin Kraken schrieb:
Du musst halt mal näher ausführen, weil so wird halt nicht klar, ob du den Unterschied zu einem gewöhnlichen Programm verstanden hast und warum man davon spricht, dass ein neuronales Netz nicht programmiert wurde, sondern lernt.

Darwin und Evolutionstheorie ist hoffentlich klar und wie die Umwelt einen Einfluss auf die Entwicklung der Arten hat und bei der K.I. könnte man das was die Software macht vielleicht Guided Learning nennen ;-)

Summa · Gestern um 13:20

Martin Kraken schrieb:
Die Software gewichtet zwar die Trainingsdaten, aber eben alle Trainingsdaten nach dem gleichen Prinzip. Wie eine Backform, der Kuchen hat zwar die selbe Form aber je nach Zutaten ist er ein Schokoladenkuchen oder ein Zitronenkuchen.

Was ist die Zielvorgabe für die K.I. alle Kuchen die man mit den Zutaten backen kann oder sich mit dir über Kuchen zu unterhalten?

Martin Kraken · Gestern um 15:53

Summa schrieb:
Was ist die Zielvorgabe für die K.I. alle Kuchen die man mit den Zutaten backen kann oder sich mit dir über Kuchen zu unterhalten?

Es gibt keine Zielvorgabe in der Software, sie ist ne Backform, je nach dem was für Zutaten du reinmachst kommt nen anderer Kuchen raus, aber die Backform bleibt immer die selbe. Die Zutaten sind die Texte in den Trainingsdaten und diese Texte enthalten sowohl die Frage (Input), als auch die Antwort (Ziel). Wenn du den Satz hast "Die Katze frisst Fisch" als Trainingsdaten nutzt, dann kannst du für den Input "Fisch" löschen und hast "Die Katze frisst" was du vorne ins Netz einspeist und hinten überprüft die Software, ob das Netz "Fisch" ausgibt, wenn nicht wird es neu eingestellt. a.E. man kann es sich wie eine Entschlüsselung/Verschlüsselung und Kompression vorstellen. Aus den Billionen an Texten werden die Muster extrahiert, in der Sprache eines neuronalen Netzes gespeichert und dadurch komprimiert, am Output wird das dann wieder in unsere Sprache übersetzt.

Summa schrieb:
Darwin und Evolutionstheorie ist hoffentlich klar und wie die Umwelt einen Einfluss auf die Entwicklung der Arten hat und bei der K.I. könnte man das was die Software macht vielleicht Guided Learning nennen

Es ist im Prinzip wie ein Lehrer der nicht lehrt und nichts erklärt und auch nicht vorgibt was gelernt werden soll, sondern nur überprüft, ob die Kinder die richtige Antwort geben (die er selbst nur abliest und nicht versteht) und wenn nicht, müssen sie weiter im Buch (Trainingsdaten) lesen.

Es ist kein Evolution, denn es wird nicht zufällig ein Wert verändert und dann geschaut was besser ist, sondern eine Backpropagation des Zielwerts. Aber das nur ein Detail, sehr abstrakt zur besseren Vorstellung kann man auch von Evolution sprechen.

Hier mal eine Vorlesung von einem Nobelpreisträger der gleich am Anfang erklärt warum ein evolutionärer Ansatz sehr langsam und ineffizient ist.

Summa · Gestern um 16:25

Nur kurz, weil ich gerade auf dem Sprung bin;

Martin Kraken schrieb:
Es gibt keine Zielvorgabe in der Software, sie ist ne Backform, je nach dem was für Zutaten du reinmachst kommt nen anderer Kuchen raus, aber die Backform bleibt immer die selbe.

Warum sollte man dann eine K.I. Programmieren? Selbst wenn du einem Menschen etwas beibringst hast musst du ihm an irgend einem Punkt sagen wenn das Ergebnis deinen Vorstellungen entspricht, ansonsten kann er ja nur raten was er machen soll und da wunderst du dich dass die Ergebnisse der Reihenfolge deiner Eingabe entsprechen.

Martin Kraken schrieb:
Die Zutaten sind die Texte in den Trainingsdaten und diese Texte enthalten sowohl die Frage (Input), als auch die Antwort (Ziel).

Das Training ist es der K.I. den Unterschied zwischen gewünschtem und unerwünschtem Output zu zeigen, die Evolution besteht darin mit jedem neuen Input weniger Fehler bei der Erkennung der gesuchten Daten zu machen, damit die K.I. die Arbeit schneller und effizienter als ein Mensch machen kann.

ganje · Gestern um 16:40

DanReed schrieb:
Das ist auch genau meine Beobachtung. Es gibt Beispiele, bei denen geht alles gut (vermutlich stammen sie aus dem Trainingsmaterial des jeweiligen Systems), aber real-world klingen doch immer einige Stems ganz unglaublich schlecht. Ähnlich wie mp3 mit 64kBit, aber schlechter.

Ich habe mit Spectralayers schon gute Resultate erzielt. Perfekt waren sie zwar nicht, aber brauchbar. Hängt natürlich viel vom Ausgangsmaterial ab. Sollte in guter Qualität sein und am besten mit konventionellen Instrumenten (Drums, Bass, Gitarre, Piano, Stimme) und nicht zu viele Effekte haben.

Martin Kraken · Gestern um 17:37

Summa schrieb:
Nur kurz, weil ich gerade auf dem Sprung bin;

Warum sollte man dann eine K.I. Programmieren? Selbst wenn du einem Menschen etwas beibringst hast musst du ihm an irgend einem Punkt sagen wenn das Ergebnis deinen Vorstellungen entspricht, ansonsten kann er ja nur raten was er machen soll und da wunderst du dich dass die Ergebnisse der Reihenfolge deiner Eingabe entsprechen.

Das Training ist es der K.I. den Unterschied zwischen gewünschtem und unerwünschtem Output zu zeigen, die Evolution besteht darin mit jedem neuen Input weniger Fehler bei der Erkennung der gesuchten Daten zu machen, damit die K.I. die Arbeit schneller und effizienter als ein Mensch machen kann.

Eine neuronales Netz ist nicht programmiert. Es muss nicht raten, denn die Ziele befinden sich in den Texten selbst und nicht in der Software. Evolution ist eine schöne Analogie, ist technisch aber nicht richtig, denn Backpropagation ist keine Evolution. Jedoch werden evolutionsähnliche Mechanismen beim Fine-Tuning der Modelle eingesetzt.

Ich habe dir hier nochmal die exakte Stelle rausgesucht, bitte schaus dir an, ich bin müde es zu erklären. Wenn du es einem Nobelpreisträger nicht glaubst, dann habe ich auch keine Chance es dir zu erklären. (Du kannst das Video auch auf Deutsch stellen, wenn das das Problem sein sollte).

Kevinside · Gestern um 21:31

Das bleibt die Frage... Kann AI wirklich intelligent handeln oder kombiniert sie nur das Wiessen, was ihr antrainiert wurde?
Kann eine KI individuell funktionieren oder täuscht sie das nur vor, weil sie damit trainiert wurde...
Selber habe ich keine Chance gegen eine Ki die mit dem ganzen Internet gefüttert wurde, aber nur alleine durch Informationen, ensteht noch lange nicht eine reale künstliche Intelligenz...

Ich selber bin geistig behindert, was viele Vorteile bringt, aber auch Nachteile...
Aber der Gedächtnispalast hat mir geholfen...

Summa · Gestern um 21:57

Martin Kraken schrieb:
Eine neuronales Netz ist nicht programmiert. Es muss nicht raten, denn die Ziele befinden sich in den Texten selbst und nicht in der Software.

Ich hab' den Verdacht du hast bisher nur mit pre-trained K.I.s gearbeitet :dunno:

, denn das Training würde ansonsten nur funktionieren wenn die Daten bereits gelabelt wären.

Martin Kraken schrieb:
Wenn du es einem Nobelpreisträger nicht glaubst, dann habe ich auch keine Chance es dir zu erklären. (Du kannst das Video auch auf Deutsch stellen, wenn das das Problem sein sollte).

War das nicht der Nobelpreisträger der für mich unverständlicher Weise plötzlich Panik vor K.I. gemacht hat ;-)

Martin Kraken schrieb:
denn Backpropagation ist keine Evolution

War damit auch nicht gemeint, das scheint eine ganz andere Baustelle zu sein:
Quelle: https://www.ibm.com/de-de/think/topics/backpropagation

Backpropagation ist die Abkürzung für „Backward Propagation of Error“ (Rückwärtsausbreitung von Fehlern) und eine elegante Methode, um zu berechnen, wie sich Änderungen an den Gewichten oder Verzerrungen eines neuronalen Netzes auf die Genauigkeit von Modellvorhersagen auswirken. Sie ist unerlässlich für die Verwendung von überwachtem Lernen, halbüberwachtem Lernen oder selbstüberwachtem Lernen, um neuronale Netze zu trainieren.

Martin Kraken · Heute um 00:25

Summa schrieb:
Ich hab' den Verdacht du hast bisher nur mit pre-trained K.I.s gearbeitet , denn das Training würde ansonsten nur funktionieren wenn die Daten bereits gelabelt wären.

Dieser Satz ergibt keinen Sinn. Das zentrale Training eines LLMs erfolgt ohne jedes Labeling, die Labels werden aus den Texten selbst erzeugt. Nur beim Fine-Tuning nutzt man Labels, also zusätzliche Information oder gezielte sehr spezifische Informationen für eine Aufgabe. Ändert aber nichts daran, dass diese Ziele in den Trainingsdaten sind. Ohne Finetuning sind die meisten Modelle heute schon sehr gut, sie würden sich halt teilweise wie ein Arschloch verhalten, deshalb muss man ihnen zum Schluss nochmal gelabelte Daten geben die ihnen klar machen "Du bist ein Wichser" ist negativ und soll nicht benutzt werden. Ironie muss z.B, gelabelt werden, auch wenn manche Modelle sehr gut mit Ironie umgehen können. Der Witz an LLMs und warum sie so gut sind, liegt aber daran, dass man eben keine von Hand erstellten Labels braucht und einfach alle Texte die man zu fassen bekommt durchjagen kann.

Summa schrieb:
War das nicht der Nobelpreisträger der für mich unverständlicher Weise plötzlich Panik vor K.I. gemacht hat

Man nennt ihn auch the Godfather of AI, ich verstehe das, du hast natürlich mehr Ahnung als er. Er hat nicht nur den Nobelpreis gewonnen, sondern auch den Turing Award.

Summa schrieb:
War damit auch nicht gemeint, das scheint eine ganz andere Baustelle zu sein:
Quelle: https://www.ibm.com/de-de/think/topics/backpropagation

Es ist keine andere Baustelle. Du kannst dir die ersten paar Minuten des Videos des Nobelpreisträgers anschauen, er erklärt dort warum Modelle nach dem Evolutionsprinzip nicht skalierbar sind und warum man stattdessen Backpropagation nutzt.

Martin Kraken · Heute um 00:58

Kevinside schrieb:
Das bleibt die Frage... Kann AI wirklich intelligent handeln oder kombiniert sie nur das Wiessen, was ihr antrainiert wurde?
Kann eine KI individuell funktionieren oder täuscht sie das nur vor, weil sie damit trainiert wurde...
Selber habe ich keine Chance gegen eine Ki die mit dem ganzen Internet gefüttert wurde, aber nur alleine durch Informationen, ensteht noch lange nicht eine reale künstliche Intelligenz...

Ich selber bin geistig behindert, was viele Vorteile bringt, aber auch Nachteile...
Aber der Gedächtnispalast hat mir geholfen...

Irgendwann stellt sich halt die Frage was Intelligenz ist. LLMs erreichen bei Mensa-IQ-Tests etwa ein IQ von 135. Wobei sie an räumlichen, nicht textbasierten Aufgaben scheitern, dafür fast alle textbasierten Aufgaben zu 100% lösen können. Ein LLM decodiert die Welt nur anhand von Text. Wir sehen, hören, fühlen, riechen, schmecken usw. Natürlich haben wir deutlich mehr Informationen über die Welt als jemand der die Welt nur durch Text sieht. Der Mechanismus könnte aber der Selbe sein. Es gibt beim Training von LLMs zu nächst eine Phase wo das Modell sich nur Dinge merkt. Es kann nur auf gelerntes Antworten. Ab einem magischen Moment fängt es an zu generalisieren und erkennt Muster im gelernten (ohne das sich irgendwas geändert hätte, ganz von alleine). Dies bedeutet Generalisierung erfolgt automatisch in einem neuronalen Netz, ab einer bestimmten Menge an gemerkter Information. Dies könnte also bei uns genauso sein. Vielleicht können wir ab einer bestimmten Datenmenge generalisieren. Zunächst schafft das Kleinkind nur die Treppe im eigenen Haus und jede neue Treppe ist eine Herausforderung, aber wenn es genug Stufen auf verschiedenen Treppen genommen hat, dann kann es jede Treppe ohne Probleme meistern.

Summa · Heute um 02:21

Martin Kraken schrieb:
Dieser Satz ergibt keinen Sinn. Das zentrale Training eines LLMs erfolgt ohne jedes Labeling, die Labels werden aus den Texten selbst erzeugt.

Ich versuche einfach nur zu verstehen wie du auf die Idee kommst, dass neuronale Netze einer K.I. aktuell schon besser funktionieren als biologische Vorbilder. Schon an diesem Punkt müsste dir klar dass du von falschen Voraussetzungen ausgehst, weil da rein von der verwendeten Technik bei binär arbeiteten Rechnern im Moment noch div. Grenzen gesetzt sind.
Menschen lernen ihre Muttersprache ja auch nicht ohne eine gewisse Form von Labeling z.B. die Objekte die sich dazu sehen. Worte sind in der Datenverarbeitung ja nur eine Reihe von Buchstaben (ASCII Codes, also eigentlich nur Zahlen) getrennt mit Leerzeichen, wenn eine K.I. das als Worte erkennt ergibt sich daraus dass ein gewisses Vorwissen bzw. Pre-Training vorhanden sein dürfte. Man hat die K.I. sicher nicht mit irgendwelche Buchstaben gefüttert und sie hat irgendwann von ganz alleine erkannt dass es Worte sind.
Es gibt auch unsupervised Algorithmen die ohne Labeling auskommt, das funktioniert aber eher wie in der Sesamstraße - "welche dieser Daten sind anders", erkennen von Muster und Unterschieden in Daten.
An diesem Punkt bin ich schon tiefer als geplant in den Kaninchenbau gestiegen, ich vermeide dabei mit irgendwelchen Fachbegriffen um mich zu werfen um Kompetenz vorzutäuschen.

Martin Kraken schrieb:
Man nennt ihn auch the Godfather of AI, ich verstehe das, du hast natürlich mehr Ahnung als er. Er hat nicht nur den Nobelpreis gewonnen, sondern auch den Turing Award.

Aber auch der wird gelegentlich Vorträge für ein Publikum mit geringem Vorwissen halten ohne weiter in die Details zu gehen. Von daher aus meiner Sicht ohne Zusammenhang eher eine Nebelkerze.

Martin Kraken · Heute um 03:57

Summa schrieb:
Ich versuche einfach nur zu verstehen wie du auf die Idee kommst, dass neuronale Netze einer K.I. aktuell schon besser funktionieren als biologische Vorbilder. Schon an diesem Punkt müsste dir klar dass du von falschen Voraussetzungen ausgehst, weil da rein von der verwendeten Technik bei binär arbeiteten Rechnern im Moment noch div. Grenzen gesetzt sind.
Menschen lernen ihre Muttersprache ja auch nicht ohne eine gewisse Form von Labeling z.B. die Objekte die sich dazu sehen. Worte sind in der Datenverarbeitung ja nur eine Reihe von Buchstaben (ASCII Codes, also eigentlich nur Zahlen) getrennt mit Leerzeichen, wenn eine K.I. das als Worte erkennt ergibt sich daraus dass ein gewisses Vorwissen bzw. Pre-Training vorhanden sein dürfte. Man hat die K.I. sicher nicht mit irgendwelche Buchstaben gefüttert und sie hat irgendwann von ganz alleine erkannt dass es Worte sind.
Es gibt auch unsupervised Algorithmen die ohne Labeling auskommt, das funktioniert aber eher wie in der Sesamstraße - "welche dieser Daten sind anders", erkennen von Muster und Unterschieden in Daten.
An diesem Punkt bin ich schon tiefer als geplant in den Kaninchenbau gestiegen, ich vermeide dabei mit irgendwelchen Fachbegriffen um mich zu werfen um Kompetenz vorzutäuschen.

Aber auch der wird gelegentlich Vorträge für ein Publikum mit geringem Vorwissen halten ohne weiter in die Details zu gehen. Von daher aus meiner Sicht ohne Zusammenhang eher eine Nebelkerze.

Ein LLM baut keine Wörter aus Buchstaben. Jedes Wort ist vereinfacht gesagt ein Token, manchmal werden Wörter noch in mehrere Token aufgesplittet. Aber zur Vereinfachung sei jetzt mal jedes Wort ein Token. Für jedes dieser Token (Wörter) gibt es einen Inputknoten im Netz. Bei LLMs heisst dieser erste Layer Embedded Matrix. In jedem Knoten der ein Token(Wort) repräsentiert ist ein Vector gespeichert, der angibt wie stark er die unterschiedlichen Knoten im nächsten Layer verändert. Jetzt kommt der entscheidende Fakt den du verstehen musst. Die Werte in der Embedded Matrix werden zu Beginn zufällig erstellt. Das Netz startet also völlig naiv, ohne jedes Vorwissen. Es lernt die Bedeutung der Wörter durch das Training mit Billionen von Texten.

einseinsnull · Heute um 03:58

Kevinside schrieb:
@einseinsnull
Und wieder drehst du dir die Welt, so wie sie dir gefällt.

ich drehe überhaupt nix. ich erfasse und zitiere deine texte genau so wie du sie geschrieben hast.

du willst kein licht anmachen weil hitler auch eine glühbirne hatte.

das ist nicht mal unterhaltsam, das ist einfach nur merkwürdig.

einseinsnull · Vor 47 Minuten

DanReed schrieb:
Und die überwiegende Mehrheit der Programmierer, die das in VST-PlugIns gießen, und der Firmen, die das verkaufen, auch nicht!

man kann es immerhin lesen und interpretieren wenn es nicht gerade assembly ist. insofern ist es für den, der es codet, eher noch keine "black box".

beim ausführlichen herleiten und erklären der algorithmen wird es dann schon schwieriger. das kann dann nur noch der mathe prof; der software ingenieur ist da schon raus.

dennoch, mindestens der ursprüngliche erfinder weiß es ja und hat es irgendwo publiziert. insofern "weiß man es".

oder sagen wir mal... man könnte es wissen. wenn man wirklich ganz viel bock zum lesen hat.

dass zu viele leute, die nicht mal wissen wie gleitkomma-arithmetik funktioniert, software machen, da bin ich ganz bei dir. aber es gibt zum glück auch noch ein paar leute, die wissen, was sie tun, und von denen die anderen dann klauen können und das neuverpacken...

auch danreed:

Die spannenden Fragen sind vielmehr:
- wie verbessere (beschleunige) ich den Trainingsprozess?
- wie stelle ich sicher, dass mein Trainingsmaterial alle Fälle gleichmäßig abdeckt?
- wie finde ich die beste Netztopologie zur jeweiligen Aufgabe?

es gibt da eigentlich nur zwei möglichkeiten:

entweder ein komplett spezifisches design inclusive der möglichkeit, dass der user auf einer steuerbaren ebene selbst eingreifen kann.

die andere möglichkeit ist mehr speicher, mehr CPU cycles und mehr trainingsmaterial.

aktuell klingt das alles nach 12 bit und 512 fast fourier bins, aber wir sind auch schneller von GPT 2 zu GPT 4 gekommen als wir dachten und da liegen auch welten dazwischen.

ich kann mich noch gut erinnern wie der kollege @ neuronaut im jahr 1998 (?) den ersten vorläufer von sonicworx isolate und das pandora plug-in vorgestellt hat. letzteres kam dann sogar raus.

keine 27 jahre später und das AI zeug aus dem weltnetz klingt immer noch nach mpeg und funktioniert nur halb.

aber: die grundlagen dafür das jetzt bald mit relativ wenig zusätzlichem aufwand hochzubohren und 100 verschiedene versionen davon zu erstellen, sind jetzt da und im prinzip für jeden verfügbar.

-------------------------------

Martin Kraken schrieb:
Ein LLM baut keine Wörter aus Buchstaben.

du liest nicht mal was er schreibt und meinst schon wieder ihm irgendwas zusammengooglen und "erklären" zu müssen, was gar keine sinnvolle antwort auf das von ihm gesagte darstellt.

selbstverständlich muss erst mal eine software da sein, die erkennt, was ein zeichen ist, und natürlich besteht die eingabe (sowohl als auch das trainingsmaterial) aus einzelnen zeichen.

keine textprogramm funktion - kein LLM.

ob und wie und dass die KI dann mit worten oder ganzen sätzen operiert, dieses muster hat sie für sich alles ganz alleine herausgefunden, nachdem sie zuvor hinreichend mit einzelnen zeichen gefüttert wurde.

Martin Kraken schrieb:
Ist das jetzt Ironie? Ich komme nicht mehr mit. Meinst du LLMs mit Chatbots? Ich kann dazu gar nix mehr sagen. Entweder du verarscht mich oder du hast keine Ahnung was LLMs können. Kann ich vielleicht mit diesem Artikel weiterhelfen

https://www.linux-magazin.de/news/gemini-gewinnt-mathe-goldmedaille/

dass gemini mit wolfram trainiert wurde sagt dir notfalls sogar gemini. und manuell. und mit büchern und webseiten über mathematik.

in diesem artikel steht über trainingsmethode und -inhalte rein garnichts drin (wie nicht anders zu erwarten, wenn du eine "quelle" für irgendwas postest)

Martin Kraken schrieb:
LLMs sind keine Spielerei, du weißt nicht wovon du redest.

genau, wir sind alle blöd. hier und in allen anderen threads.

Martin Kraken schrieb:
Schau, wenn keiner es nachvollziehen kann, nicht mal die Programmierer und selbst wenn sie sich Monate hinsetzen würden und die Parameter studieren,

du sagst es ja selbst: man kann es zwar nicht unmittelbar nachvollziehen, aber man könnte es analysieren, indem man hineinschaut.

ob man das jetzt blackbox nennt oder nicht blackbox nennt ist onanie.

ich google jetzt auch mal.... frau google erklärt es hier eigentlich ganz gut:

wer aufgepasst hat, wird sich an meine argumentation erinnern, dass exakt genau das gleiche auch für jegliche andere software gilt.

daher stellt sich hier die frage, warum dir diese feststellung eigentlich so furchtbar wichtig ist.

was genau hat die frage ob das eine black box ist damit zu tun, wie man das zum musikmachen einsetzen kann.

Martin Kraken schrieb:
dann ist es eine Blackbox. Es ist belustigend, weil ich habe mir das mit der Blackbox ja nicht ausgedacht, sondern das ist Konsens unter Wissenschaftlern die sich mit dem Thema befassen (ja auch denen die staatlich bezahlt werden, also richtige Wissenschaftler im Sinne dieses Forums). Jetzt fragt man sich, wie ein ganzes Forum der Meinung seien kann, der Begriff Blackbox und AI sei Schwachsinn. Es scheint hier im Forum eine Zusammenkunft der Allwissenden zu geben, die alle eine gegenteilige Meinung haben.

auch das hast du dir schon fast selbst beantwortet, nämlich als du eingeräumt hast, dass es neben LLMs auch noch andere anwendgunen gibt, die unter "AI" fallen.

vielleicht stößt du deswegen auch wenig gegenliebe, weil LLMs halt verhältnismäßig wenig mit "AI zum musikmachen" zu tun hat?

wenn ich über "AI zum musikmachen" diskutiere, dann denke ich dabei an die anwendungen die ich so kenne und benutze (oder, im falle von super-einfachen netzwerken für ein paar tausend einzelne werte, selbst erstelle) und dann kommst du mit deinem chatbot und sumo scheiß an, wo natürlich ein paar dinge wieder anders sind und dann passt das natürlich nicht mehr zusammen.

aber vielleicht erübrigt sich die ganze diskussion auch in ein paar jahren, wenn die systeme dann noch 100 mal größer sind als die heutigen und trotzdem lokal auf dem iphone laufen.

Einsatz von AI zum Musik machen

Summa

hate is always foolish…and love, is always wise...

Anfänger

Anfänger

Summa

hate is always foolish…and love, is always wise...

Anfänger

Summa

hate is always foolish…and love, is always wise...

been there, done that

Anfänger

Anfänger

Summa

hate is always foolish…and love, is always wise...

Summa

hate is always foolish…and love, is always wise...

Anfänger

Summa

hate is always foolish…and love, is always wise...

ganje

Benutzerdefiniert

Anfänger

Kevinside

Eines langen Tages Reise in die Nacht zum Ende...

Summa

hate is always foolish…and love, is always wise...

Anfänger

Anfänger

Summa

hate is always foolish…and love, is always wise...

Anfänger

[nur noch PN]

[nur noch PN]

Similar threads