Neueste KI zur Bilderzeugung

Smai-Lee · 7. März 2024

Bei den folgenden Bilder habe ich mal 4 von den selber trainierten Elementen zusammengefügt. Der Stil entsteht bzw. variiert durch leicht unterschiedliche Gewichtung. Es wurde natürlich keinerlei Künstlername benutzt:
- Tusche/Aquarell: 7 synthetische Bilder
- Sci-Fi: rund 800 Bilder
- Rauch/Dissolver: 20 synthetische Bilder
- Detailer auf Noisebasis: 42 synthetische Bilder

Ebenso wurde etwas postprocessing gleich in ComfyUI mit-automatisiert. Ein Bild benötigt rund 70 Sekunden auf einer 4090 wenn man den Prompt einmal gefunden hat. Alle Bilder basieren auf Stable Diffusion SDXL und wurden lokal gerechnet. Der ganze Workflow umfasst rund 60 Module. Die Gesamtrechenzeit für die 4 Themen waren unter 20h, das wird aber nur einmal gemacht.

Nun würde ich das ganze gerne direkt in ein eigenes Basis-Modell gießen und wäre dann tatsächlich (erstmal) fertig

ganje · 7. März 2024

ollo schrieb:
Umgekehrt ist echt schwer. Stable Diffusion will mir einfach keinen Regenwurm erzeugen, der einen Vogel frisst.

Cartoon klappte mit Bing auf Anhieb..

Realistisch war schon schwieriger..

ganje · 7. März 2024

Solche Bilder klappen mit Bing auch ganz gut:

laux · 7. März 2024

Smai-Lee schrieb:
Alle Bilder basieren auf Stable Diffusion SDXL und wurden lokal gerechnet.

Wie ist denn das mit der "KI" bei Stable Diffusen, wenn es offline generiert wird, lernt da die KI noch was dazu, oder ist das berhaupt eine KI?

ollo · 7. März 2024

laux schrieb:
Wie ist denn das mit der "KI" bei Stable Diffusen, wenn es offline generiert wird, lernt da die KI noch was dazu, oder ist das berhaupt eine KI?

Die lernen generell nichts dazu. Nur die Modelle an sich, wenn sie trainiert werden. Es ist also nicht so, dass die KI im Internet nach passenden Bildern suchen könnte oder ähnliches.
Bisher muss immer noch jemand die KI mit Bildern gefüttert und trainiert haben. Egal ob das dann der PC zuhause berechnet oder irgendein Server im Netz, die KI kann nur auf diese Trainings-Daten zugreifen.

Zumindest ist das mein Stand der Dinge aber ich denke da unterscheided sich Stable Diffusion nicht von Bing, Midjourney & Co.

Smai-Lee · 7. März 2024

laux schrieb:
Wie ist denn das mit der "KI" bei Stable Diffusen, wenn es offline generiert wird, lernt da die KI noch was dazu, oder ist das berhaupt eine KI?

Die 'KI' steckt im Basismodell und wurde einmal mit Millionen (Mrd) Bildern einmal trainiert. Das Resultat ist eine mehrere Gigabytes große Datei mit den Gewichten des neuronalen Netzwerks und das kann man nun lokal einsetzen und Bilder erzeugen. Egal wieviele Bilder man jetzt macht, hier lernt die KI noch nichts hinzu.
Mit entsprechender Software kann man nun Bilder und deren Beschreibungen diesem Datensatz hinzufügen. Im Beispiel oben habe ich kleinere Erweiterungen trainiert (LoRas), die funktionieren nur im Zusammenhang mit einem Basismodell. Die Erweiterungen sind wiederum nur Dateien mit Gewichtungen und werden beim Renderprozess einfach 'dazugerechnet'.

einseinsnull · 7. März 2024

laux schrieb:
Wie ist denn das mit der "KI" bei Stable Diffusen, wenn es offline generiert wird, lernt da die KI noch was dazu, oder ist das berhaupt eine KI?

das wäre nicht wirklich erwünscht. stattdessen kommen ab und an neue versionen und die alten bleiben weiterhin erhalten.

Smai-Lee · 13. März 2024

Habe das Basismodell nochmal feinjustiert und den Aquarellteil in besserer Auflösung neu trainiert. Die Details sind wieder etwas mehr und besser geworden. Leider bin ich nun mit 24GB VRAM am Limit, höhere Trainingsauflösung als 1280x1280 geht glaube ich nicht mehr.
Alle Bilder sind vom gleichen Comfy Workflow, auch die Zusammenstellung der Modelle zur Erzeugung sind wie im letzten Posting gleich.

darsho · 9. April 2024

alles MS Copilot, finde ihn ganz ok nach wie vor, muss bei Gelegenheit mal was anders ausprobieren.

Jules Verne Reise zum Mittelpunkt der Erde

Der Bibliothekar

Schweine im Weltall

Pinhead und Eddie in einem Pub in Ankh Morpork

Alien mit Ostereiern

was Giger mäßiges

Synth Spieler , psychedelic Art

Ein Motiv aus The Terror (Buch)

Orang Utan mit Bitcoin

RealRider · 21. April 2024

einseinsnull · Dienstag um 16:44

die server werden immer schneller, das generieren dauert inzwischen zu manchen tageszeiten weniger als 10 sekunden.

die version 3.1 bringt sehr gute ergebnisse hervor und gibt dir jetzt dateinamen vor, die aus der prompt bestehen.

das mag man praktisch finden, aber es bringt auch ein neues problem mit, nämlich dass gleiche prompts dann zu gleichen namen führen und man via browser save dialog das ziel umbenennen müsste um es überhaupt abspechern zu können.

denn ich arbeite mit 10 tabs und automatisiere das alles mit mouserecordern und brauche teilweise 100 bilder, die alle auf dem gleichen prompt basieren.

jemand eine idee wie da jetzt das abspeichern organisieren kann? ;-)

meine eigenen audio- und bildbearbeitungsprgoramme haben das eingebaut wenn man´s braucht: man drückt erneut return, und die output datei wird gleichername002.bin genannt. firefox kann das logischerweise nicht...

NickLimegrove · Dienstag um 17:05

ganje schrieb:
Kann jemand von euch ein Bild generieren lassen, wo eine Person unterm Flügel sitzt?

Will auch bei mir nicht so recht klappen...

A harpsichord with a donkey, a dog, a cat, and a cockerel underneath it, in the background the...jpg

NickLimegrove · Dienstag um 17:06

NickLimegrove · Dienstag um 17:07

NickLimegrove · Dienstag um 17:07

NickLimegrove · Dienstag um 17:08

4x Kandinsky 3.1

A harpsichord with a donkey, [!] a dog, a cat, and a cockerel underneath it, in the background there is blue sky with only one cloud and the sun shining behind it, emitting a wide ray of light shining onto the piano. There is also an angel [hä?] sitting on the cloud.

A car mechanic lying on the floor underneath a grand piano, which standing on a lifting ramp in order to be repaired.

A grand piano on a lifting platform in a car workshop, with a mechanic trying to repair it from underneath.

A car mechanic with his tools, lying underneath a grand piano, trying to repair it from below.

Smai-Lee · Dienstag um 17:42

Passt nicht:

Auch hier etwas eng:

Jetzt passt es:

Am 12ten ist Releasetermin für einen Teil von Stable Diffusion 3, bin mal gespannt. Das oben ist SD XL.

Martin Kraken · Dienstag um 18:02

Wie genial die KI ist. Nen Mensch passt halt nicht sitzend unter einen Flügel.

Lois · Gestern um 03:14

Lois · Gestern um 03:17

Lois · Gestern um 03:22

Lois · Gestern um 03:23

Lois · Gestern um 04:34

Summa · Gestern um 05:21

Ist eigentlich für 'nen anderen Thread entstanden, aber es wär' schade die Bilder nicht zu zeigen ...

NicGrey · Gestern um 17:28

… nach dem Anblick diese Bildes geht für mich HR Giger's Biomechanics schon fast als Jugendbuch durch.

Summa schrieb:

Summa · Gestern um 17:53

Das hat die K.I. bei "Amon Tobin - 4 Ton Mantis" ausgespuckt ;-)

ollo · Gestern um 18:03

Smai-Lee schrieb:
Passt nicht:
Anhang anzeigen 217997

Auch hier etwas eng:
Anhang anzeigen 217996

Jetzt passt es:
Anhang anzeigen 217998

Am 12ten ist Releasetermin für einen Teil von Stable Diffusion 3, bin mal gespannt. Das oben ist SD XL.

Martin Kraken schrieb:
Wie genial die KI ist. Nen Mensch passt halt nicht sitzend unter einen Flügel.

Mit einem Trick geht es dann doch. Einfach erst ein Foto von einem Piano generieren und dann den Bereich darunter markieren und Stable Diffusion per Inpainting noch eine Frau unter das Piano setzen lassen. Sieht sogar ziemlich gut aus das Ergebniss.

Oder man macht eine total einfache Strichzeichnung von einer Frau unter einem Piano und gibt das der KI als Vorlage. Oft genügen einfachste Zeichnungen und man gibt der KI ziemlich viel Freiraum. Wenn dann ein Bild schonmal besser ist als die Zeichnung nimmt man das als Grundlage und hangelt sich weiter.

Neueste KI zur Bilderzeugung

Smai-Lee

|||

ganje

Benutzerdefiniert

ganje

Benutzerdefiniert

laux

_laux

||||||||||||

Smai-Lee

|||

[nur noch PN]

Smai-Lee

|||

darsho

Sö Sünteßeisör !

Anhänge

RealRider

\___‹[(Ö)]›___/

[nur noch PN]

NickLimegrove

Flexiganer

NickLimegrove

Flexiganer

NickLimegrove

Flexiganer

NickLimegrove

Flexiganer

NickLimegrove

Flexiganer

Smai-Lee

|||

Anfänger

|||||

|||||

|||||

|||||

|||||

Summa

hate is always foolish…and love, is always wise...

[¥]

Summa

hate is always foolish…and love, is always wise...

||||||||||||

Similar threads

\_‹[(Ö)]›_/