Everything A.I.

* "sogar unsinnige Floskeln sollen in Zukunft erkannt werden"
 
Da bin ich noch sehr drauf gespannt - sehr gut wäre "sozusagen" - aber wir werden sehen, was das ist - im Text steht was von "I mean…" also "ich denke…" ob das sinnvoll wird - sehen wir.
 
Ja, die Maschine müsste das nach Sinnzusammenhang filtern oder drin lassen.
ABer wenn man sich die Leistungsfähigkeit der Sprachmodelle inzwischen anschaut, ist denkbar daß das möglich ist.

Also natürlich nciht wirklich dem Sinn nach aber daß es statistsich Konstellationen gibt bei denen es eher drin bleiben soll
und solche wo es eher rausfliegen soll - denkbar daß ML sowas mitlernt bei entsprechenden Trainingsdaten.
 
Der Macher schreibt, er habe das mit ML gemacht - also jede Menge Müllelemente durch Menge eingegeben - was ist ein "Äh" und was sind Laute - und ich denke, es sind so kurze Einsilben-Floskeln die keiner vermisst - aber interessanterweise kommen wir dann sogar in den Bereich der "Wahrheit" und dem was man wirklich sagt - ähnlich wie wenn man sich bei Insta nur in superverfiltert hochlädt weil nur so geht man raus - ungeschminkt niemals!

Aber ich hätte es gern für Video - da klappt das leider nicht - aber es wäre schon gut für uns Videocaster und Labercast-Hanseln.

Denke, dass diese Situation wo es nicht raus soll gut gewählt ist - das ist ja gewichtet und probiert - ich hab es ausprobiert - und das was da raus fällt ist sehr sehr gut - ich würde es tun! Für reines Audio wäre das auch Zeitersparnis - für Video geht's leider "SO" nicht.
 
Generating long pieces of music is a challenging problem, as music contains structure at multiple timescales, from milisecond timings to motifs to phrases to repetition of entire sections. We present Music Transformer, an attention-based neural network that can generate music with improved long-term coherence. Here are three piano performances generated by the model:









Mehr:

 


News

Zurück
Oben