Neueste KI zur Bilderzeugung

Komisch: ich bekomme dieses Bild, wenn ich einfach in die Tasten haue: doskölklödafn bpäjGOPIEWF FWElkjf evlsvdklksev_ veakljsev veasmvselkmsydvy

Anhang anzeigen 204027

Wenn man der KI nicht wirklich sagt was sie machen soll oder sie mit einem Promt nicht zurecht kommt, erzeugt sie Bilder, die am ehesten ihren Trainigsdaten entsprechen. Und auf den meisten Fotos sind halt Menschen zu sehen. Jedenfalls ist das meine Vermutung, weil im Zweifelsfalle oft eine Frau generiert wird.
 
Wenn man der KI nicht wirklich sagt was sie machen soll oder sie mit einem Promt nicht zurecht kommt, erzeugt sie Bilder, die am ehesten ihren Trainigsdaten entsprechen. Und auf den meisten Fotos sind halt Menschen zu sehen. Jedenfalls ist das meine Vermutung, weil im Zweifelsfalle oft eine Frau generiert wird.

Ja Ok das hatte ich zwar auch gelesen, aber in dem Moment dachte ich, dass evt. bestimmte Prompts auch nicht zugelassen werden.

Wie ist das eigentlich mit den Urheberrechten an so einem Bild? Gehört das dann mir, da ich der Urheber der Idee für dieses Bild war?

lila planet.jpg
 
Wie ist das eigentlich mit den Urheberrechten an so einem Bild? Gehört das dann mir, da ich der Urheber der Idee für dieses Bild war?

Da gibt es schon mehrere Threads zu dem Thema. Kurz zusammengefasst gibt es bei rein KI erzeugten Bildern kein Urheberrecht, weil dafür noch ein Mensch als Urheber gebraucht wird. Darüber kann man aber wunderbar diskutieren.

Der Bing Bildergenerator ist für kommerzielle Nutzung wohl nicht gestattet, es in Foren oder bei Facebook teilen geht wohl klar. Andere Anbieter wie leonardo.ai sagen ganz klar, dass du die Bilder kommerziell nutzen darfst. Bei Stable Diffusion wird es kompliziert, weil jedes Model andere Lizenzen haben kann, einige schreiben auch gar nicht, was erlaubt ist und was nicht. Mitunter sind es aber die gleichen Modelle wie bei leonardo.ai. Bei Stable Diffusion würde ich also sagen, dass, solange man nicht offensichtlich Rechte an Personen wie Celebrities verletzt, sowas wie Darth Vader oder ähnliches generiert, man das auch kommerziell nutzen kann. Spätestens wenn mehrere Modelle gemischt werden oder man noch bei Photoshop zusätzlich Hand anlegt, blickt keiner mehr durch, woher das alles kommt.
 
Ich habe die Prompts mal probeweise sprachlich soweit entstellt, dass beim besten Willen kein Sinn mehr erkennbar ist und jede Übersetzungssoftware eigentlich die Segel streichen, oder die Flinte ins Korn werfen müsste, also absolutes Kauderwelsch, nein eigentlich noch nicht einmal das.

Einfach nur Buchstabensuppe im Stil von:

"jhg Soahofbaucidäasj aöasjdjasd asdasdasölgrlv vdoirt timt flkfhneuhe Lyöxjask"

Zu den gelernten Daten im Modell gehören auch die Bildbeschreibungen und nur diese Verknüpfungen Bild<>Beschreibung machen die so genannte 'Intelligenz' aus. Vor der Verarbeitung wird die Eingabe in Token zerlegt, vereinfacht gesagt so etwas wie Silben. Für Stable Diffusion XL hier mal ein Ausschnitt aus der Datei https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/raw/main/tokenizer/merges.txt:

1707074972608.png

Die Eingabe (Prompt) wird nun solange zerlegt, bis da ein Token rauskommt das einem Bild zugeordnet werden kann. Im Extremfall halt ein einzelner Buchstabe. Es gibt KEINERLEI Verständnis für irgendwas, es gibt nur Zuordnungen und Statistik (Assoziationen trifft es sehr gut).

edit: Dazu kommen natürlich jegliche Rechtschreibfehler, Sonderzeichen, andere Sprachen oder Zeichen. Dadurch findet das Programm immer irgendetwas 'Passendes', egal was man eingibt.
 
Zuletzt bearbeitet:
IMG_4277.JPGIMG_4280.JPGIMG_4281.JPGIMG_4284.JPG

Bei Nonsenseingaben ballert B.I.C. offensichtlich mit Vorliebe Wimmelbildchen raus.
Dies hier sind alle aus demselben Prompt....
 
Stable Diffusion lernt jetzt schreiben:

1707316001187.png1707316029859.png1707316120273.png1707316184614.png1707316219805.png1707316255846.png1707316290058.png1707316313084.png1707316345090.png1707316379087.png1707316416048.png1707316508919.png1707316562198.png1707316594093.png1707316658680.png1707316726228.png

Die ersten Tests sehen gut aus. Ich bin zuversichtlich, das da noch etwas mehr drin ist. Sorry für die lieblosen Bilder, aber diesmal stehen die Buchstaben im Vordergrund.
 
Komisch: ich bekomme dieses Bild, wenn ich einfach in die Tasten haue: doskölklödafn bpäjGOPIEWF FWElkjf evlsvdklksev_ veakljsev veasmvselkmsydvy

die KI erkennt anhand dieses prompts deinen intellekt und weiß sofort, was du willst.

nein, wenn der nix versteht, liefert er immer portraits, blumen oder solche platzhalter wie das "kleine gespenst". ich find´s auch verwirrend.
 
gemini st jetzt auch ohne VPN verfügbar.

es hat mir als erstes mal erzählt, dass es noch nicht verfügbar sei, und zwar 3 dörfer weiter, aber okay.


1707410120470.png
 
Tolle Bilder, freue mich schon wenn in dieser Art und Weise Elektronische Musik gepostet wird, wo man nach ner halben Stunde Promptversuche einen fertigen Track hat, der besser klingt als hätte man ihn in einem Monat per Hand gemacht.
 
Tolle Bilder, freue mich schon wenn in dieser Art und Weise Elektronische Musik gepostet wird, wo man nach ner halben Stunde Promptversuche einen fertigen Track hat, der besser klingt als hätte man ihn in einem Monat per Hand gemacht.

test2sample kann das mitunter. Wenn man da anstatt ein Sample dort ganz genau zu beschreiben und einfach ein genre wie "synthwave" eingibt, klingt das schon ganz gut. Aber mit dem genau beschreiben hat das noch so seine Schwierigkeiten:

Anhang anzeigen synthwave_2.wav

leider sehr kurz als eines der ersten Experimente:

Anhang anzeigen synthwave.wav

Oder Reggae, man kann zumindest erahnen, was gemeint ist:

Anhang anzeigen reggae.wav
 
so, nach Abgabe der Vorschläge im Cover Thread kann ich endlich wieder entspannt hier den Thread weiter voll spammen 😬

bzw um wirklich wichtige Fragen aus allen Lebenslagen kümmen..
was wäre zB. wenn Superhelden mal Bock auf nen Coffee to go haben ..
müssen sie sich genauso anstellen wie alle anderen?🤔



OIG.XLzjiKHogXv8yZ.jpg OIG.oPX3Mw50G5Xkc.jpg

oder in überfüllten öffentlichen WCs...

OI61616G.jpg OIG541651.jpg

.. in schweren Zeiten evtl sogar einen Zweitjob annhemen (oder ihren Müll vom letzten Kampf selbst weg räumen)?

OIG54452.jpg OIG541152.jpg

🤷‍♂️
 
@elabtronx
Frage: Wie bekommst du diesen Comic Style hin?
zb "comic style", mit in den prompt schreiben :]
In dem Fall kann es sein, dass ich noch sowas wie "70s" dazu geschrieben habe .. oder versuche auch mal "pop art".
Bin nicht mehr ganz sicher und speichere nicht alle prompts. Manche speicher ich in einer Tabelle um sie übersichtlicher zu variieren, da BIC ja diese Textleiste hat in der man sonst ewig hin und her scrollen muss.

btw habe ich noch nicht raus gefunden, wie man rechts in der History Liste weiter zurück schauen kann, ausser den ca 20 letzten die dort angezeigt werden. Oft ändere ich so schnell was, (weil BIC mich mal wieder nicht verstand), dass die Liste mit nur einem "projekt" voll ist. Nach dem neu einloggen bzw cache löschen ja sogar ganz leer.
Das absichtliche löschen dagegen, ist Windows/Bing seitig so umständlich, dass man meinen könnte es ist nicht erwünscht... verkehrte Welt ; )
 


Zurück
Oben