"A ChatGPT for Music Is Here. Inside Suno, the Startup Changing Everything"

Fangen wir in D erst mal an, flächendeckend Informatik als Pflichtfach einzuführen. Ohne Microsoft-Office. Texteditor ohne Autovervollständigung und Syntaxhighlighting und etwaige Annehmlichkeiten, die den Blick aufs wesentliche ablenken, Konsole, Compiler/Interpreter/Laufzeitumgebung und Debugger der jeweiligen Sprache. Schon das wird nicht passieren, weil es keine geeigneten Lehrer gibt. Und du fragst "So what"?
Ist doch ein guter Vorschlag… unterstütze ich. Kenne mich beim Thema Schule nicht aus, aber wenn du sagst es wird nicht passieren, dann ist das wohl so. Das „so what“ hast du natürlich immer noch nicht beantwortet (musst du ja auch nicht), aber du baust natürlich von vorne herein eine enorm hohe Hürde auf, wenn du in einer sehr fundamentalen Art und Weise die technische und gesellschaftliche Entwicklung brandmarkst. Aber diesen Ausgangspunkt hast du dir ja selbst gewählt. Das ist in meinen Augen halt schon ein bisschen „Doom Porn“… denn ich verstehe nicht so ganz, wo du hin willst? Antikapitalistische Revolution? Mit einem Sprengstoffgürtel in Microsofts Rechenzentren reinlaufen? Das ist wohlgemerkt Sarkasmus, aber es erschließt sich mir wirklich nicht. Ehrlich.

Und nein: Ich weiß natürlich auch nicht unbedingt wo es hingeht. Andererseits habe ich auch nicht so fundamental vorgelegt wie du. :)
 
Zuletzt bearbeitet:
Hier ist was lustiges:

Ein Däne hat KI mindestens 689 Songs generieren lassen, bei Spotify etc. hochgeladen und dann wiederrum KI tools benutzt um seine Streamingzahlen hochzupowern.
Einkommen: 2 Millionen Dänische Kronen (ca. 270.000 Euro) und Platz 46 der bestverdienenden Musikrechteinhaber in Dänemark.

Das ist genau das was ich meinte, dass mit neuen Tools sofort entsprechende Zeitgenossen auf der Matte stehen.

 
Zuletzt bearbeitet:
Und selbst wenn du es ins Deutsche übersetzt, was du offenbar nicht kannst ("Und nun?" ist in diesem Kontext wenig sinnvoll, merkste): Wenn du nicht lesen willst, was ich auf deine "Frage" geantwortet habe, oder dies nicht als Antwort gelten lässt, dann tut es mir leid, dann haben wir halt erfolglos miteinander zu diskutieren versucht, alles andere als die Ausnahme hier im Forum. Dann ist eingedenk deiner offenbar eingeschränkten Sicht nachvollziehbar, dass du "Doom Porn" drin siehst. Schaltest du eigentlich immer dann ins Englische wenn du nicht weiter weißt oder soll das irgendwie lässig rüberkommen?

Andere, die verstehen was ich schrieb (weil ihnen nicht alles haarklein vorgekaut werden muss), werden zumindest überlegen, Suno einfach nicht zu nutzen und stattdessen stoisch weiter selber Musik machen.
Ein Tamagochi verhungern lassen.
Irgendwas in ein Prompt einzugeben um mal zu gucken was rauskommt, etwas, was irgendwo zu posten sich lohnen könnte, man mit Likes und Herzen einheimst, hat jedenfalls mit Kunst oder Kreativität null zu tun, mehr mit dem Generieren von Gelächter, schlimmstenfalls ists Selbstbetrug.

Aber egal, du hast vollkommen Recht mit dem was du sagst. Oder hierauf antwortest. Wenn es dir persönlich was bringt, stell dir einfach vor ich halte mir die Ohren zu und schreie la-la-la ich hör dich nicht. Hab du deine Genugtuung und ich habe meine, nämlich dass es sich nie gelohnt hat ein Spotify-Abo abzuschließen.
 
Irgendwas in ein Prompt einzugeben um mal zu gucken was rauskommt, etwas, was irgendwo zu posten sich lohnen könnte, man mit Likes und Herzen einheimst, hat jedenfalls mit Kunst oder Kreativität null zu tun, mehr mit dem Generieren von Gelächter, schlimmstenfalls ists Selbstbetrug

Ja. Aber das kriegst Du nicht mit 'Informatik Pflichtfach' in den Griff. Genausowenig, wie man zB die Auswüchse des Kraftverkehrs (von Abgas über Stau bis Raser) mit Technikunterricht 'Bremse, Blinker, Motor' kontrollieren kann.

Leute, die ein Byte nicht erkennen, wenn es sie in den Hintern beißt (ui ui, Wortspielalarm) können trotzdem fachkundig Fortnite daddeln, Memes posten und auch über Excel-Tabellen brüten.

Schätze, mit Deiner Systemkritik liegst Du richtig. Wir sind wieder bei 'Brot und Spiele' angelangt. Um die Musik mache ich mir dabei die wenigsten Sorgen.
 
Hm. Nach einigen Gehversuchen mit Suno komme ich zu dem Zwischenergebnis, dass die "kompositorischen" Resultate mich immer öfter an LORIOTs Bundestagsrede erinnern:



Beiläufig und unaufmerksam gehört, klingt das wie eine x-beliebige Politikerrede. Mit etwas mehr Aufmerksamkeit merkt man aber schnell, dass dem Ganzen eine umspannende Sinnhaftigkeit fehlt. Halbsätze, in Gedankenstrichen eingefügte Einschübe und abgebrochene Hypotaxen wechseln einander ab, sodass es genau genommen Nonsens ist. Während einzelne Satzteile noch Sinn zu ergeben scheinen, scheitert der Versuch, diese Fragmente zu einem sinntransportierenden Gesamtkontext zusammenzufügen kläglich.
 
Is wohl so und das ist auch jedem bewusst, denk ich mal.

Die Geschwindigkeit der Entwicklung wird diese Probleme zeitnah lösen.
 
Alta wie geil!
Ich kauf so selten Software. Im Abo schon gar nicht.
Aber hier kommt man als Musiker wahrscheinlich erstmal nicht rum!
Das ist ja mal megageil. Das muss man erst mal auf klassischem Wege so hinbekommen und vor allen in der Zeit und damit auch mit den Kosten. Ich denke mal, alle Durchschnittsproducer von Durchschnittsmusik können da einpacken, die werden von jedem ScriptKiddy mit AI-Abo um Längen platt gemacht.

Um so mehr Leute die Technologie ablehnen um so weniger Konkurrenz.

Bleibt ja immer noch die superduper individual Künstlermusik auf Bandcamp, die einmal im Monat angeklickt wird. Da kann man sich aber auf die Schulter klopfen, will zwar keiner hören, aber ist selbstgemacht in 2 Wochen Handarbeit und 3 Wochen vorher Inspiration auf der Auslandsreise gesammelt und dabei ein paar Fotos und Dronevideo für Insta gemacht, wie man mit seinem Modularsystem in einem LostPlace sich der Eingebung und dem Flow hingibt.
 
Zuletzt bearbeitet:
Ein Protestsong gegen KI-Musik. Stil:Roots-Reggae

Handwerklich besser komponiert, als ich es selbst könnte. Mit einem charismatischeren Sänger und ein wenig manueller Nacharbeit an den Lyrics, würde es noch dazugewinnen.
Für mich trotzdem verblüffend, wie nah die KI an echte Musik herankommt. Roots-Reggae bedient sich, ähnlich wie Schlager oder New Orleans Jazz, häufig aus einem abgeschlossenen Kanon von musikalischen Ideen. Das trägt vermutlich, dazu bei dass die KI recht überzeugend wirkt. Nachdem ich dieses Stück ein paar mal angehört hatte, ist es mir doch tatsächlich mehrere Tage lang nachgelaufen..
 
Das ist ja mal megageil. Das muss man erst mal auf klassischem Wege so hinbekommen und vor allen in der Zeit und damit auch mit den Kosten. Ich denke mal, alle Durchschnittsproducer von Durchschnittsmusik können da einpacken, die werden von jedem ScriptKiddy mit AI-Abo um Längen platt gemacht.

Um so mehr Leute die Technologie ablehnen um so weniger Konkurrenz.

Bleibt ja immer noch die superduper individual Künstlermusik auf Bandcamp, die einmal im Monat angeklickt wird. Da kann man sich aber auf die Schulter klopfen, will zwar keiner hören, aber ist selbstgemacht in 2 Wochen Handarbeit und 3 Wochen vorher Inspiration auf der Auslandsreise gesammelt und dabei ein paar Fotos und Dronevideo für Insta gemacht, wie man mit seinem Modularsystem in einem LostPlace sich der Eingebung und dem Flow hingibt.

@DerFelix hätte Deine Meinung bestimmt geteilt...
 
Ich glaube die praktischen Anwendungen für den Normalbürger werden sicher zuerst dahin gehen dass z.b. instagram deine Bilder per ki mit Musik unterlegt (sowas macht mubert schon, das akzeptiert ein Bild statt einem prompt), tiktok Videos auf wunsch automatische Musikuntermalung bekommen... sowas halt. Da ist dann irgendwo in einer schon existierenden app ein neuer Button "generiere Musik zu meinem video", der Service im Hintergrund kontaktet seinen Server und der versucht per ki rauszufinden was im video eigentlich passiert und da passende fahrstuhlmusik drunterzulegen.
 
Schon jetzt lassen sich aus den Ergüssen von Suno aber brauchbare Loops basteln.

Hier das Rohmaterial:

Anhang anzeigen Jazz-Funk (1).mp3

Zwei Töne gefielen mir nicht und am Ende fehlte so etwas wie ein Auftakt, damit sich das Ganze rund loopen lässt. Also Wavelab angeschmissen, editiert und hier ist die Loop (damit man's hier als Loop wahrnimmt, viermal hintereinandergeklebt...):

Anhang anzeigen Jazz-Funk (1) looped - 2 tones transposed- 4x.wav

So, jetzt könnte ich noch mein HOHNER D6 rauskramen und einen funky Track dazupfriemeln... (usw.)
 
Zuletzt bearbeitet:
Ich glaube die praktischen Anwendungen für den Normalbürger werden sicher zuerst dahin gehen dass z.b. instagram deine Bilder per ki mit Musik unterlegt (sowas macht mubert schon, das akzeptiert ein Bild statt einem prompt), tiktok Videos auf wunsch automatische Musikuntermalung bekommen... sowas halt. Da ist dann irgendwo in einer schon existierenden app ein neuer Button "generiere Musik zu meinem video", der Service im Hintergrund kontaktet seinen Server und der versucht per ki rauszufinden was im video eigentlich passiert und da passende fahrstuhlmusik drunterzulegen.
Ach ja, und was ich dazu vergessen habe:
Dann ist der ökologische Fussabdruck des täglich abfotografierten veganen Weltrettungs-Bio-Frühstücks halt nochmal um 2 Schuhgrössen gewachsen wenn im Hintergrund auch noch eine KI die passenden positiv-meditativen Klänge dazu bastelt.
 
Zuletzt bearbeitet:
ich hab mal Rap versucht, heute das erste mal angemeldet und rumgespielt.

Oriental Rap turkish ohne Textvorgabe

und ganz spaßig Deutsch Rap mit Textvorgabe, das soll "Hambühren" heißen wird aber etwas seltsam ausgesprochen. Ich hab mal in Hambühren gewohnt.
 
Hm. Nach einigen Gehversuchen mit Suno komme ich zu dem Zwischenergebnis, dass die "kompositorischen" Resultate mich immer öfter an LORIOTs Bundestagsrede erinnern:



Beiläufig und unaufmerksam gehört, klingt das wie eine x-beliebige Politikerrede. Mit etwas mehr Aufmerksamkeit merkt man aber schnell, dass dem Ganzen eine umspannende Sinnhaftigkeit fehlt. Halbsätze, in Gedankenstrichen eingefügte Einschübe und abgebrochene Hypotaxen wechseln einander ab, sodass es genau genommen Nonsens ist. Während einzelne Satzteile noch Sinn zu ergeben scheinen, scheitert der Versuch, diese Fragmente zu einem sinntransportierenden Gesamtkontext zusammenzufügen kläglich.

Kommt der Sinnzusamnenhang nicht bei fast allen Songs mit Vocals (ausser Britney Spears und Co.) ueber den Text? Wenn Suno da ermoeglicht den Text manuell einzugeben, bzw. anzupassen reicht das doch aus um eine KI Vorlage in ein funktionierendes Ganzes zu verwandeln?

Was mich generell bei den Beispielen hier unabhaengig vom Musikstil beeindruckt ist der sehr gut funktionierende Frequenzbereich, vor allem beim Low-End...
 
Jetzt mal etwas in Aachener Mundart:

Et floren Fott norrijen Daach erop,
die wor met hoddele uhsjestoppt,
et floren Fott norrijen Daach erop.

Die Fott flor wier deä Kandel aan,
deä Kandel wier dat Fottlouch aan,
et floren Fott norrijen Daach erop.

Die Fott die hau sich wieh jedooe,
deä Kandel, deä wor schozzelsbloe,
et floren Fott norrijen Daach erop.

Da muuet se nor der Dokter joeh,
dat Fottlouch dat wor marmoriert,
deä kandel hau sich echauffiert,

et floren Fott norrijen Daach erop.


Anhang anzeigen Et floren Fott - authentischer - (1).mp3
 
Zuletzt bearbeitet:
Das Problem mit ChatGPT ist ja, dass die Texte die es an suno übergibt einfach grundsätzlich kreuzlangweilig gereimt sind.

Ich habe gerade mal versucht suno ( bzw chat gpt ) etwas interessantere texte beizubringen. Nicht vom Inhalt her, sondern vom Aufbau.
Da ist Potential, aber tatsächlich bin ich an die Grenze gestossen was die Promptlänge angeht....
Vom Thema her habe ich einfach Nonsense angegeben, das war jetzt nicht wichtig und dann wäre der prompt zu lang geworden.

Das hier war der prompt:

"Create a psychedelic rock song with nonsense lyrics. let the first two lines of the first verse rhyme, and the first two lines of the second verse. let the third lines in each verse rhyme. "

Von den beiden Ergebnissen hatte das erste tatsächlich den flow den ich so in etwa im kopf hatte, da bin ich echt positiv überrascht... das zweite war einfach nur schlimm.
Was noch dazu kommt ist dass ChatGPT offensichtlich die jeweils erste Zeile in sich nochmal als Reim generiert hat, was gar nicht verlangt war aber auch nicht verboten. Sowas verschalteltes von sich aus hätte ich ChatGPT jetzt nicht zugetraut.


Wenn die Aufgabe jetzt teilst und du jetzt auf ChatGPT einen entsprechenden Prompt erstellst für einen Text, und da ganz genaue Vorgaben machst, kannst du mit Sicherheit auch Suno dazu bringen den Text entsprechend zu vertonen.
Aber im Moment reicht die Promptlänge bei Suno für beides noch lange nicht aus.

Edit: ich habe übrigens gerade bemerkt dass das so ein bisschen was von Geldspielautomaten hat und auch diesen Belohnungsmechanismus bedient.
Du kippst was rein, drückst aufs Knöpfchen und wartest ob da jetzt ein Jackpot rauskommt oder nix.
 
Zuletzt bearbeitet:
Kommt der Sinnzusamnenhang nicht bei fast allen Songs mit Vocals (ausser Britney Spears und Co.) ueber den Text?
Nicht nur, sondern auch...
Hier ein Audiobeispiel aus Suno (rein instrumental generiert, obwohl ich einen Text eingegeben hatte):

Anhang anzeigen Et floren Fott 4 - elevator music.mp3

Mal abgesehen von dem total verfehlten Genre (es sollte Fahrstuhlmusik sein, also "elevator-music" so im Sinne von "easy-listening") hört man hier deutlich, dass die Phrasen der Violine zwar über 1 bis 2 Takte separat betrachtet Sinn ergeben, aber in der Aufeinanderfolge wie beliebig aneinandergeklebt klingen. Verstärkt wird dieser Eindruck noch durch im harmonischen Kontext falsch gesetzte Bassnoten, was manchmal so klingt, als hätte sich ein Alleinunterhalter auf seiner Begleithupe beim Greifen der Akkorde vertan.

So entsteht in meinem Kopf die Parallele zu Loriots Bundestagsrede.
 
Suno kann auch Texte aufgreifen und (innerhalb gewisser qualitativer Grenzen) weiterspinnen und natürlich auch vertonen, hier am Beispiel von Heinz Erhardt's Gedicht "die Made":

Anhang anzeigen Hinter dem Baum -generated Lyrics - Bossanova - (1).mp3

Schade nur, dass man keinen Einfluss auf das Ending hat. Leider produziert Suno nur sporadisch Songs mit brauchbarem Ende. Wenn jemand eine Lösung dafür parat hat, bitte her damit! ;-)

Was mir bei dem generierten Text aber aufgefallen ist, sind die in Klammern stehenden Elemente:

[Verse]
Hinter einem Baum ganz still und leise
Da wohnt die Made mit ihrem Kinde (Kinde)
Sie ist allein, denn der Gatte, sie hatte
Fiel herab von einem Blatte (oh nein, oh nein)

[Verse 2]

Diente als Köstlichkeit für eine Ameise
Eines Morgens sprach die Made leise (leise)
"Geh nicht raus, denk an Papa,
Drüben gibt es frischen Kohl, oh ja!" (oh ja, oh ja)

[Chorus]

Hinter einem Baum, dort ruft die Made
Nach ihrem Kinde, oh wie schade (schade)
Doch Ausweg fand das Kleine nicht
Ein bunter Specht verschlang es im Licht (oh nein, oh nein)

Die in eckigen Klammern stehenden Angaben scheinen Anweisungen zur Song-Struktur zu sein, während die in runden Klammern stehenden Texte von backing-Vocals gesungen werden sollen.

Auf Youtube gibt es bezüglich dieser Prompt-Tricks noch weitere Angaben, die funktionieren sollen, wie:

[Intro], [Outro], [Sax Solo], [Guitar Solo], usw.

Vielleicht sollten wir uns hier auch einmal intensiver über solche Tricks austauschen...
 
Zuletzt bearbeitet:
Also wenn ich mir das so anhöre auf suno...für mich klingt vieles davon was man da findet auch nicht viel schlimmer als was so im Radio läuft.
Evtl. gibt's ja künftig dann KI Radio oder so.

Ich probiere damit auch gerne rum, Klischees kann das Ding zumindest schon halbwegs gut. Texte mache ich teilweise im MS Copilot.
Nächstes Mal werde ich mal die Texte noch etwas anpassen und genaue Songstrukturen vorgeben.

Immer dran denken: Jede neue Version von dem Ding wird besser werden als v3.

Was ich gerne hätte, geht sicher auch irgendwann mal : Meine Stimme in eine KI einspeisen und dann damit den Gesang machen. Dann kann ich auf einmal richtig toll singen auch ohne Autotune, lol.

Liedermacher :

Reggae :

Punk :

Gothic :

Synth Pop :
 
Zuletzt bearbeitet:


Neueste Beiträge

News

Zurück
Oben