Neueste KI zur Bilderzeugung

Majorin Tommy

00140-87548763.png
Ich muss zugeben, dass mir erst nach längerer Zeit aufgefallen ist, dass die Hand sehr, sehr klein ist. Irgendwas lenkt den Blick ab, aber was?
 
Ich bin zu dumm, um überhaupt zu der Seite zu gelangen, wo man irgendwas eintippt.. Werde nur auf irgendwelche farbenfrohe Seiten weitergeleitet und mit Reizen überflutet.
Ich bin auch ständig auf der Suche nach non-profit KI-Bildgeneratoren, die möglichst große Bilder in annehmbarer bis guter Qualität liefern. Habe nämlich Null Bock auf Abzocke.

Mein bisheriger Favorit:
https://huggingface.co/spaces/stabilityai/stable-diffusion

Vorteile:
- kein Login erforderlich (läuft im Browser)
- kein Payment nötig
- Bildgröße immerhin 768 im Quadrat
- keine Begrenzung bzgl. der Anzahl pro Tag generierter Bilder

Was mit Einschränkungen noch geht:
https://deepai.org/machine-learning-model/text2img

Vorteile:
- Bildgröße bis 2048 im Quadrat "aufblasbar" durch Enhance-Funktion
- verschiedene Seitenverhältnisse als Templates anwählbar
- verschiedene "Styles" vorwählbar, so z.B.: https://deepai.org/machine-learning-model/fantasy-portrait-generator

Nachteile:
- Anzahl der Bilder pro Tag begrenzt (ca. 20)
- Umsetzung anatomisch anspruchsvollerer Eingaben kurios bis schlecht oder überhaupt nicht...

Beispiel: (Texteingabe "ugly person with teeth looking like a piano-keyboard")
output.jpg


Im Vergleich dazu ein paar Beispiele mit dem gleichen Text auf huggingface.co erzeugt:

1679123550573.jpeg
1679123664036.jpeg
1679123701715.jpeg
1679123749732.jpeg

Meine Empfehlung:
Angesichts der rasanten Entwicklung auf dem Gebiet der KI-Bilderzeugung sollten wir vielleicht mehr Links empfehlenswerter Seiten mit Angaben über Vor- und Nachteile austauschen.

Edit:
Zweiten Link korrigiert und ursprünglichen zweiten als Beispiel für Styles verschoben.
 
Zuletzt bearbeitet:
Was mit Einschränkungen noch geht:
https://deepai.org/machine-learning-model/text2img

Vorteile:
- Bildgröße bis 2048 im Quadrat "aufblasbar" durch Enhance-Funktion
- verschiedene Seitenverhältnisse als Templates anwählbar
- verschiedene "Styles" vorwählbar, so z.B.: https://deepai.org/machine-learning-model/fantasy-portrait-generator

Nachteile:
- Anzahl der Bilder pro Tag begrenzt (ca. 20)
- Umsetzung anatomisch anspruchsvollerer Eingaben kurios bis schlecht oder überhaupt nicht...

a bikinimodel with hair made of xlr-cables

Auf den Bikini ist der Generator nicht eingegangen und xlr cable auch nicht. Ansonsten sieht sie aus wie Britney Spears und das rechte Auge hat sich irgendwie mit den Haaren verheddert. Aber künstlerisch hat es was.

xdPzH1t7.jpg

Bei den nächsten Versuchen war bikinimodel für den promt dann zu unsicher.

Am besten wir machen wirklich mal eine Link-Sammlung welche Teile kostenlos sind bzw generell was die Vor und Nachteile sind.
 
a bikinimodel with hair made of xlr-cables

Auf den Bikini ist der Generator nicht eingegangen und xlr cable auch nicht. Ansonsten sieht sie aus wie Britney Spears und das rechte Auge hat sich irgendwie mit den Haaren verheddert. Aber künstlerisch hat es was.

Anhang anzeigen 170507

Bei den nächsten Versuchen war bikinimodel für den promt dann zu unsicher.

Am besten wir machen wirklich mal eine Link-Sammlung welche Teile kostenlos sind bzw generell was die Vor und Nachteile sind.
Britney? :)
 
Wie wir über diesen Atomic Experimental Baukasten aus den 50ern gefacepalmt haben ^^
 
Zuletzt bearbeitet:
Schon krass wie realistisch einige KI-Bilder aussehen:

1679296743954.jpg

1679227391733.jpg

Sehr viele Details. Ich finde noch realistischer sehen teilweise einige Bilder von Promis aus. Ich vermute das liegt daran das die besser analysiert sind?!
 
da sind wir aber immer noch ziemlich tief im Uncanny Valley ...
 
Ich habe jetzt Zugang zu Leonardo.ai bekommen und mal ein bisschen rumprobieren.

Eine Schildkröte die Keyboard vor Leuten spielt klappte nicht ganz so gut, weil es eine Computer Tastatur geworden ist, war aber auch nur der erste Test:

tortoise.jpg
 
Ich habe mal spaßeshalber folgende Formulierung benutzt, um die KI in StableDiffusion2.1 (Huggingface) zu korrekter Wiedergabe einer überlangen Klaviatur zu bewegen:

"modular synthesizer with absolutely correct shaped and sized keyboard, which contains 128 keys"

Die Ergebnisse waren genauso Kacke wie immer, aber vielleicht ist mein Englisch auch nicht gut genug für die KI... ;-)
 
erklär ihm vielleicht einfach mal, dass immer abwechselnd drei und zwei schwarze Tasten kommen. :)
 
Wobei ... von Stuart & Sons gibt es auch einen Flügel mit 108 Tasten.
hm - den linken und den rechten Meter davon kann ich gar nicht mehr hören. Wäre rausgeworfenes Geld. :opa:

Zwei davon nebeneinander und schon kann man das Leitmotiv der Filmmusik zur Neuverfilmung von "Im Westen nichts Neues" spielen. Cool!
Das dürfte doch auch für die meisten aktuellen Popsongs reichen ...
 


News

Zurück
Oben