"A ChatGPT for Music Is Here. Inside Suno, the Startup Changing Everything"

Nachdem ich gestern von den musikalischen Ergüssen SUNOs durch die Bank weg eher enttäuscht wurde - quasi nie wurde das Genre richtig getroffen, abgenudelte 4-taktige, repetierte Harmonieschemata brachten mich zur Verzweiflung und die holprige Versmetrik tat ihr übriges dazu, von den meist trotz Aufforderung fehlenden Endings ganz zu schweigen - entschloss ich mich heute während des Frühstücks dazu, einen Workaround für Kraftausdrücke im Liedtext zu erdenken, auch um meiner angestauten Frustration etwas Linderung zu verschaffen...

Gesagt, getan:

Anhang anzeigen Ein Ah Schloch - Bossanova (2) - WOW, DuDu-Gesang und passendem Ending.mp3
Anhang anzeigen Ein Ah Schloch - Jazz (1) - WOW, Roger Cicero, seltsame Metrik aber saucool, mit furiosem Ending.mp3
Anhang anzeigen Ein Ah Schloch - Oper (1) - Coloraturgesang, Text unverständlich, Ending hängt harmonisch in d...mp3
Anhang anzeigen Ein Ah Schloch - Gregorian Chant (4) - WOW, Metrik gut, Ending vorhanden.mp3

Endlich sind Endings zu hören, wenn auch die Textverständlichkeit hier und da (z.B. beim Operngesang) noch etwas Potential zur Verbesserung hat. ;-)
 
Zuletzt bearbeitet:
Hatte zwischen Frühstück und Spitzmorchelsuche noch etwas Zeit und daher SUNO beauftragt, ein Aachener Volkslied neu zu interpretieren, und zwar im Gewand eines Bossanova:

Anhang anzeigen Öscher Jonge V2 - Bossanova - (2)- WOW, vergleichsweise gute Versmetrik, absolut brauchbar, to...mp3

Zum Vergleich hier das Original (inkl. eingeblendetem Tex):




Ich finde es immer wieder interessant, Liedtexte die bereits in vertonter Form vorliegen und man daher eine feste Assoziation des Textes mit der Melodie verinnerlicht hat, von SUNO neu interpretieren zu lassen. In 90% der Fälle kommt dabei zwar Unbrauchbares heraus, weil die Verteilung der Silben auf die Einzeltöne der Melodie (ich nenne es Versmetrik) holprig bis grauenhaft ist, aber bei obigem Bossanova war's eigentlich ganz o.k. .

Was meint Ihr?

Achso: Eins noch. Man kann SUNO zur Erzeugung eines Endings anregen (zwingen wäre übertrieben), indem man ans Ende des Prompts [Ending] (evtl. mit etwas Liedtext dahinter) anfügt.

PS:
Funk-Jazz geht natürlich auch (ist so wie Hering mit Himbeersauce...) ;-)
Anhang anzeigen Öscher Jonge V2 - Funk-Jazz - (2)- WOW, cool, mit Ending.mp3
 
Zuletzt bearbeitet:
Hab' mich heute bei UDIO angemeldet und die ersten Gehversuche gestartet. Mein erster Eindruck:

WOW!
Die Extension-Funktion ist wesentlich zielgerichteter, als bei SUNO. Es werden grundsätzlich 33-sekündige Ergebnisse erstellt, die aber nach Belieben erweitert werden können. Man kann entscheiden, ob man vor dem selektierten Part ein Intro einfügen, oder ob man dahinter einen weiteren 33-sekündigen Part anfügen möchte, oder ein Ending. Dabei kann man wählen ob mit oder ohne Gesang, oder man lässt die KI entscheiden, wie's weitergeht. Die Ergebnisse fühlen sich für meinen Geschmack musikalischer an, als bei SUNO und die Audio-Qualität ist ebenfalls besser (MP3 320kBit/s). Beachtlich finde ich auch, wie gekonnt die KI die einzelnen 33-Sek.-Segmente ineinanderfügt.

Ich kann nur allen SUNO-frustrierten empfehlen, UDIO auszuprobieren.

Hier ein erstes Ergebnis, feinster Fusion-Jazz mit dem Arbeitstitel "Silken Hues ext. v2.2.2.2.1" :


Anhang anzeigen Silken Hues ext v2.2.2.2.1.mp3
 
Zuletzt bearbeitet:
Die grundsätzliche Fragestellung ist ja auch.... ich habe ein bestimmtes stück musik im Kopf.
Alle neuerungen der letzten.... 40 ... Jahre dienten ja dazu, es dem Musiker möglichst einfach zu machen, diesen Sound auf Platte(CD/Band/Festplatte) zu kriegen.

Musste ich vor 1980 noch alle Instrumente eigenhändig auf ein 8 Spur Band spielen, wurde es danach stück für Stück einfacher.... DAWs mit Pianorolls, Drumcomputer, sequencer....
Statt ein Orchester zu engagieren kamen Sampler, etc...
Das alles dient ja zuerst mal dazu erforderliches Können und manuelle Schritte zu eliminieren. Welcher Produzent kann denn schon Oboe, Flügelhorn, Querflöte spielen.

Wenn ich jetzt heute in einer DAW Noten in die Pianoroll schreibe und dann die 100 installierten VST instrumente durchprobiere was als nächstes dem Klang entspricht den ich will bis ich dann die entsprechenden Kombinationen rausgefieselt habe, bin ich ein erfolgreicher hochgelobter Produzent ( siehe auch software vs. Hardware Thread ).

Wenn irgendwann die KI genau das noch besser hinbekommt, also wenn ich ihr exakt sagen kann was ich wie wann haben will, die Umsetzung dessen was ich gerade im Kopf habe, dann sind auch rein softwareorientierte Produktionsumgebungen hinfällig.

Dann noch den Bandkontext zu übernehmen, sprich einzelne Parts zu verbessern wie es z.B. dein Gitarrist, Drummer oder Bassist machen würden mit den Parts die du für sie geschrieben hast, , wäre dann noch das Tüpfelchen auf dem I.
Stell dir vor du gibst der KI einen Song in Auftrag, indem du einfach mal alles vorgibst was du so im kopf hast und dann sagen kannst "jetzt nimm Jon Lord an der Orgel, Jimi Hendix an der Gitarre, Mike Portnoy an den Drums und Jack Bruce am Bass und arbeite ihre Parts so aus wie sie es tun würden"....
Die perfekte Umsetzung dessen was bei dir im Kopf ist, ist ja das Endziel. Und du hast IMMER Vorbilder im Hinterkopf, auch unbewusst, die dir da etwas Vorgeben... Sound, Spielweise, Arrangements....
 
Zuletzt bearbeitet:
"jetzt nimm Jon Lord an der Orgel, Jimi Hendix an der Gitarre, Mike Portnoy an den Drums und Jack Bruce am Bass und arbeite ihre Parts so aus wie sie es tun würden"
Klar, so würde man es sich wünschen, aber:
Die KIs reagieren (neuerdings?) bei der Nennung von Namen (mehr oder weniger) bekannter Musiker/Komponisten ziemlich trotzig und verweigern die Umsetzung der Prompts, die diese Namen enthalten. Anfangs (vor einigen Wochen, also zu Beginn des SUNO-Fiebers) konnte ich noch eingeben "a crossover between Bach's BWV 846 prelude in c-major and Bach's BWV 999 prelude in c-minor played on a harpsichord" und das wurde klaglos angenommen und auch umgesetzt (bis auf das Cembalo...), jedenfalls klingt das Ergebnis eindeutig nach Bach:

Anhang anzeigen Prelude in Contrasting Keys - a crossover between Bach's BWV 846 prelude in c-major and Bach's...mp3

Dennoch:
Da ich beide Präludien seit meinem 17. Lebensjahr spiele, also genauestens kenne, schwebte mir mit der Umschreibung "a crossover between..." eine ganz simple Umsetzung in der Form vor, dass dem C-Dur-Präludium die melodisch-rhythmische Auflösung des C-Moll-Präludiums aufgeprägt werden könnte, oder andersherum man unter Beibehaltung der Akkordprogression des C-Moll-Präludiums man den Fingersatz (gemeint: die arpeggierende Akkordauflösung) des C-Dur-Präludiums verwenden könnte. Beides habe ich als Klavierschüler seinerzeit spaßeshalber gemacht und wenn man beide Präludien verinnerlicht hat, fluppt das auch ohne großartig Nachzudenken... Stattdessen klaute sich SUNO lediglich irgendwelche Fragmente aus Bachs "wohltemperiertem Klavier" zusammen und verpfriemelte diese zu einem Bach-ähnlichen Machwerk.

Wenige Wochen später wollte ich das Thema nochmal aufgreifen, da war SUNO anscheinend aber schon mit erweiterten Eingabefiltern aufgerüstet worden und lehnte den Namen "Bach" im Eingabeprompt ab. Um diese Namensangabe verringert, wurde aus dem von mir gewünschten "a c-major prelude" aber folgendes:

Anhang anzeigen Sunlit Reverie - a c-major prelude (1) Bach abgelehnt, klingt wie Richard Keliderschrank.mp3

Für mich klingt das überhaupt nicht mehr nach J.S.Bach, sondern eher nach Richard Kleiderschrank™. ;-)

Die Konsequenz hieraus kann eigentlich nur bedeuten, dass man als Anwender seine Fähigkeiten, die Spielweise, den Stil, die Stimmung usw. der angestrebten Musik bzw. des zu imitierenden Künstlers so präzise wie möglich zu beschreiben, perfektionieren muss. Es wird früher oder später vielleicht den Beruf des "Prompters" geben. Oder aber, man löst sich von dieser Vorgabe und nutzt die KI lediglich als Ideenquelle, indem man nur ganz grob das Genre vorgibt und sich überraschen lässt.

Im Prinzip könnte man auch "so etwas wie" eine Band-Situation simulieren, indem man die KI anweist einen "track-minus-one" also quasi ein "play-along" zu generieren und man steuert selbst dann sozusagen seinen kreativen Part bei, indem man ihn selbst hinzukomponiert (wie altmodisch... ;-) ).

Man erkennt unschwer, dass neben dem rein repetitiven, nachahmenden Einsatz der KI im Bereich der Musik auch ein hybrider, von Synergismen geprägter denkbar ist.

Ick jlobe, ditt muss ick ürjentwann ma ausprobian, wa? ;-)
 
Zuletzt bearbeitet:
Heute den Test mit UDIO bezüglich der Erwähnung von Bach im Prompt gemacht. Der Prompt lautete wieder (s.o.):

"a crossover between Bach's BWV 846 prelude in c-major and Bach's BWV 999 prelude in c-minor played on a harpsichord"


Reaktion:
1714113632991.png

Wie bitteschön soll ein seit über 270 Jahren verstorbener Komponist den Betreibern einer KI-Plattform seine Erlaubnis erteilen, in seinem Stil Musik zu generieren? Da könnten doch allerhöchstens die leiblichen Nachfahren ihr Veto einlegen...

Egal, es kam jedenfalls das dabei heraus (3 Durchläufe: je einer für Mittelteil, Intro und Outro):

Anhang anzeigen Baroque%20Fusion%20ext%20v2.1.mp3

In der Tat sehr barocklastig, auch das Cembalo wurde brav umgesetzt, aber ist das so richtig Bach-typisch?
 
Wenn ein Künstler ein altes Stück bearbeitet, gilt er als Urheber der Neuinterpretation und hat Anspruch auf Tantiemen.
Ich zitiere mal: Selbst bei strengen Partituren bedarf die Realisierung des Werkes doch der Interpretation durch Musiker und Sänger und damit der ästhetischen Auslegung der Noten, auch wenn die Grenzen eng gesetzt sind.
Die GEMA presst einem grundsätzlich den Zehnt raus, egal ob Ernte oder nicht.
 
Auch ein wenig rumgespielt... Drums ,Klavier und Synths hab ich selbst nur soft dazu arrangiert. Bischen was melodisches dazu klimpern hätte noch gefehlt..

Schon interessant was da so geht und noch gehen wird.. UDIO habe ich jetzt noch nicht ausprobiert.

Unterm Strich super tools..

und da ich eh auf einem heartvibe trip bin.. Hab ich dem Text ein paar Stichwörter gegeben...und wow..


Anhang anzeigen gravity love.mp3
 
Zuletzt bearbeitet:
und da der Song mich total geflasht hat, habe ich noch ein kleine Animation versucht zu machen ...Ist jetzt nur solala..und alles Heute, sprich vorhin spontan entstanden..
 
Zuletzt bearbeitet:
Diese Maschine wird wohl aber keine Genres erfinden sondern sie aktuell nur dehnen und rekombinieren. Ein Maler könnte eben auch mal irgendwann auf die Idee kommen nicht mehr photorealistisch zu sein und das fehlt noch. Kubistisch sein ohne das es das je vorher gab. Die echten Grenzen ausloten.
Ich frag mich ja, ob das nur eine Frage der Betrachtung ist. Anders formuliert: Angenommen die Tools erfinden bereits neue Genres. Würden Menschen es überhaupt erkennen? Für jemanden, der sein leben lang nur Country hört und dann doch ein einziges Mal mit einem House und einem Techno Track konfrontiert wird - wäre der Unterschied zwischen den Genres überhaupt offensichtlich?

Nehmen wir mal an, es gibt zwei dominante Tools für KI-generierte Musik, die uns ein Jahrzent lang im Alltag beschallen. Wir würden vielleicht alle Experten werden, die den Unterschieden zwischen den Tools große Bedeutung beimessen und benennen (Voila - das Genre ist geboren) und eine Präferenz entwickeln.
 
Zuletzt bearbeitet:
Ich frag mich ja, ob das nur eine Frage der Betrachtung ist. Anders formuliert: Angenommen die Tools erfinden bereits neue Genres. Würden Menschen es überhaupt erkennen?
Wäre das überhaupt wichtig oder irgendwie von Bedeutung?
 
Zuletzt bearbeitet:
Wäre das überhaupt wichtig oder irgendwie von Bedeutung?
Für mich subjektiv schon.

Innovation hat mich immer motiviert, Musik zu machen. Im Licht der aktuellen Entwicklungen scheint das Streben nach Innovation lächerlich. Innovation wäre dann nur noch das Ausführen eines Tools, dass bereits jetzt verfügbar ist und - bei Bedarf - sicherlich auch auf radikalere Innovation optimiert werden kann.

Wie gesagt, ich glaube nicht, dass der Mensch sofort eine Innovation erkennt. Ähnlich wie Anfangs niemand das Potenzial der 303 erkannt hat. Wenn es jetzt aber dazu kommt, dass wir über längere Zeit diesen innovativen Ideen ausgesetzt sind, werden wir es als Innovation wahrnehmen.

Für den Konsumenten ist die Quelle der Innovation unerheblich. Da hilft es auch nichts, den KI-Output nur als Grundlage für etwas Neues zu nutzen. Innovation ist Innovation und definiert sich ja gerade darüber, dass es aufgrund der Neuheit nicht in "gut" oder "schlecht" einsortiert werden kann.

Entsprechend kann sich zwar auch die Qualität der menschliche Innovation nicht reduzieren. Aber der Schaffensprozess wirkt wie aus der Zeit gefallen - und damit das, worüber ich mich als Musikmachender definiere.

Jetzt kann man Musik noch aus Freude am Prozess machen. Aber das hat dann auch was komisches (im sozialen Kontext). Ungefähr so, als als würde man in seiner Freizeit Zahlen für die Erstellung eines Sudoku ohne Hilfe eines Computers ausknobeln oder auf dem Pferd zum Büro pendeln.
 
Zuletzt bearbeitet:
Genres sind Schubladen. Kategorien nach denen man Musik sortiert. Ich schreibe ihnen keine große Bedeutung zu.

Aber der Schaffensprozess wirkt wie aus der Zeit gefallen - und damit das, worüber ich mich als Musikmachender definiere.
Wie sieht denn der Schaffensprozess bei dir aus?
 
Genres sind Schubladen. Kategorien nach denen man Musik sortiert. Ich schreibe ihnen keine große Bedeutung zu.


Wie sieht denn der Schaffensprozess bei dir aus?
Ist für mich eine Frage des Betrachtungszeitpunkts. Wenn ein Begriff neu ist, ist es für mich Synonym für eine Innovation. Wenn ein Genre ein paar Jahre existiert, verliert der jeweilige Begriff auch an Bedeutung für mich.

Zum Schaffensprozess .. Puh ist schon sehr abstrakt ..
Kurz gesagt: sehr bottup up; viele Ideen mehr oder weniger isoliert sammeln und dann kreative Wege finden, die Ideen mit einander zu integrieren und unkonventionelle Wege finden, (Ent-)spannung über die Zeit zu schaffen.

Etwas detaillierter: Ich versuche ganz unterschiedliche Ideen zu sammeln (Sounddesign mit verschiedenen Syntheseformen, Einspielen von improvisierte Keyboardlines und Akkorde, um meine Emotionen festzuhalten, neue Effekte als Instrument definieren und spielen...), lass das ganze in meinem Unterbewusstsein etwas wachsen und editiere dann von Zeit zu Zeit immer wieder meine Ideen in der DAW. Wenn ich genug Material zusammen habe, versuche ich Wege zu finden, alles in Einklang zu bringen und mit den ausgeloteten Parametern über den Verlauf des Tracks Spannung/Entspannung zu erzeugen. Da der Vorgang sehr bottom up ist kommt eigentlich nie etwas raus, was ich einem konkreten Genre zuordnen kann.
 


News

Zurück
Oben