Adobe VoCo

ganz so wie man das interpretieren könnte ist es aber nicht.

1. die kombi aus speech to text gekoppelt an die gliedrung in regions zeigt ja auch bei der präsentation hörbare "sprünge" im satzductus als er "my wife" verschiebt, da das programm dort einfach nur copy paste macht und halt den text als regionsgrenze nimmt. sowas sollte eigentlich ein alter hut sein. aber vielleicht hatte die idee noch keiner vorher.

2. am ende sagt er auch dass das programm mindestesn 20 minuten gesprochenes material von jemandem analysieren muss um neue worte erzeugen zu können.

das ist dann natürlich schon deutlich interessanter - aber ob das wirklich - im sinne von "wirklich" - brauchber klingen wird?

wobei: wenn ich an dr. sbaitso aus 1992 denke muss man sich wundern dass es sowas erst 2016 erscheint :lol:
 
wow, bedeutet also man kann mit stimmen von denen man eine 20 minuten aufnahme hat so ziemlich alles machen? Bis auf Emotion, vermutlich. zumindest erst mal. ich denke mit frage- und ausrufezeichen wird es das Programm schon können.

Wahrscheinlich wäre es das einfachste man würde die sprecher pro gemütsausdruck jeweils 20 minuten sprechen lassen und das kann man dann per midi steuern. Dann gibt es Samplepacks von Stimmen. :D . wow
 
formton schrieb:
wow, bedeutet also man kann mit stimmen von denen man eine 20 minuten aufnahme hat so ziemlich alles machen? Bis auf Emotion, vermutlich. zumindest erst mal. ich denke mit frage- und ausrufezeichen wird es das Programm schon können.

Wahrscheinlich wäre es das einfachste man würde die sprecher pro gemütsausdruck jeweils 20 minuten sprechen lassen und das kann man dann per midi steuern. Dann gibt es Samplepacks von Stimmen. :D . wow


es ist alles eine logische konsequenz des fortschrittes und natürlich auch spannend - gleichzeitihg habe ich den eindruck dass wir uns nun wirklich schon in einen bereich hinein bewegen wo der mensch in seltsamen masse bei der erzeugung von musik (ich zähle sprache hier zu musik) an bedeutung verliert.
die frage ist wirklich: ab wann machen die programme ALLES alleine ?

-1000 hits analysiert
-1000 top stimmen analysiert
-1000 top werke aus den bereichen lyrik und metrik analysiert

ich werde mir dann wohl einen programm zuelegen müssen das diese art von musik für mich hört :)

denn diese schleichende depersonalisierung der werke macht mir kontextuell definitv sorgen.
 
also in einem ernsthaften bericht ging es mal darum, dass amerikanische geheimdienste aus 10 minuten audiomaterial jeden satz bilden können, um leute zb übers telefon zu überlisten.

wenn man bedenkt was man per hand schon alles zurechtschneiden kann und man das ganze dann noch zb per lernbarer KI und vernetzungen in der cloud oder auf leistungsfähigen rechnern machen lässt, dann geht da bestimmt einiges.
 
ollo schrieb:
also in einem ernsthaften bericht ging es mal darum, dass amerikanische geheimdienste aus 10 minuten audiomaterial jeden satz bilden können, um leute zb übers telefon zu überlisten.

wenn man bedenkt was man per hand schon alles zurechtschneiden kann und man das ganze dann noch zb per lernbarer KI und vernetzungen in der cloud oder auf leistungsfähigen rechnern machen lässt, dann geht da bestimmt einiges.


ja - im prinzip ist es ja auch gar nicht schwer - die technologischen teilbereiche sind ja alle teilweise schon seit jahrzehnetn existen...

man nehme

- text to speech
- speech to text
- autotune /melodyne o.a.
- transienten analyse
- tools zur mustererkennung von kadenzen in wörtern udn sätzen

wobei man sicher bei den profis so ne art granular speech engine nutzt die direkt den tonfall/stimmlage/sprachdynamik nach der analyse replizieren kann.

am ende ist sprache als werkzeug ja relativ unkomplex - das ist ja auch gerade ihre stärke und hat ja noch nichts mit den inhalten zu tun die hochkomplex sein können :)
 
ohne jegliche polemik - ist es absicht dass du das selbe video von 6 posts weiter oben nochmal (ohne zitat) verlinkt hast ?
 
upps... als ich es gepostet habe hat eines davon ein anderes Startbild gezeigt.

:nihao: sorry ....
 
ollo schrieb:
also in einem ernsthaften bericht ging es mal darum, dass amerikanische geheimdienste aus 10 minuten audiomaterial jeden satz bilden können, um leute zb übers telefon zu überlisten.

wenn man bedenkt was man per hand schon alles zurechtschneiden kann und man das ganze dann noch zb per lernbarer KI und vernetzungen in der cloud oder auf leistungsfähigen rechnern machen lässt, dann geht da bestimmt einiges.
Ein kommentierender Bericht in der SZ von heute warnt vor dem staatlichen Missbrauch:
http://www.sueddeutsche.de/politik/mani ... -1.3238198
Das "Streiflicht" geht auch darüber, ist aber nur für OnlineAbo-Accounts im Netz verfügbar.
 
Ich bin mir ja nicht sicher, ob die Möglichkeiten der Bildbearbeitung gesellschaftlich nicht einen viel größeren Schaden angerichtet haben und anrichten.
Aber da wären wir gleich wieder bei der Politik.

Und seit ich neulich gehört habe, dass bei Theateraufführungen vermehrt Roboter mitspielen werden habe ich innerlich eh irgendwie die Waffen gestreckt...
 
fanwander schrieb:
ollo schrieb:
also in einem ernsthaften bericht ging es mal darum, dass amerikanische geheimdienste aus 10 minuten audiomaterial jeden satz bilden können, um leute zb übers telefon zu überlisten.

wenn man bedenkt was man per hand schon alles zurechtschneiden kann und man das ganze dann noch zb per lernbarer KI und vernetzungen in der cloud oder auf leistungsfähigen rechnern machen lässt, dann geht da bestimmt einiges.
Ein kommentierender Bericht in der SZ von heute warnt vor dem staatlichen Missbrauch:
http://www.sueddeutsche.de/politik/mani ... -1.3238198
Das "Streiflicht" geht auch darüber, ist aber nur für OnlineAbo-Accounts im Netz verfügbar.

in einer zeitung die es auch noch ais papier gibt schreibt mann dann tatsächlich von aufnahmen vom TONBAND :)


allerdings sehe ich wenig gestigertes risiko für manipulation - es geht nur viel schneller - denn gib mir genug minuten text von wem und ich kann auch händisch "mehr oder weniger" beliebige sätzte zusammenschneiden und trimmen - ganz zu schweigen von den seit eh und je existierenden stimmimitatoren.

dennoch alles bedenklich - keine frage.
 
interessant wird auch das copyright. wenn das wirklich als resynthese funktionieren sollte und nicht einfach nur silben zusammenkopiert, ermöglicht das ja richtig viel. ich lade also text von sagen wir rihanna, ein tool generiert komplett neuen inhalt daraus, es klingt aber wie die stimme von rihanna. wie wird damit umgegangen?

das frage ich mich jetzt aber eignetlich auch schon. wenn ich mit einen vocoder oder per resynthese eine acapella bearbeite und der sound als solches dann komplett neu additiv zusammengesetzt wird oder nur aus dem vocoder signal besteht, dann habe ich ja nichts aus der original aufnahme gesamplet.
 
ollo schrieb:
interessant wird auch das copyright. wenn das wirklich als resynthese funktionieren sollte und nicht einfach nur silben zusammenkopiert, ermöglicht das ja richtig viel. ich lade also text von sagen wir rihanna, ein tool generiert komplett neuen inhalt daraus, es klingt aber wie die stimme von rihanna. wie wird damit umgegangen?

das frage ich mich jetzt aber eignetlich auch schon. wenn ich mit einen vocoder oder per resynthese eine acapella bearbeite und der sound als solches dann komplett neu additiv zusammengesetzt wird oder nur aus dem vocoder signal besteht, dann habe ich ja nichts aus der original aufnahme gesamplet.

na in dem fall ist es doch im prinzip die stimme von rihanna weil sie all deren merkmale erfüllt...

du kannst ja auch nicht die limonade "fizzpisse" die 1:1 nach cola schmeckt "stressfrei" vermarkten nur weil die im tetrapak kommt :mrgreen:
 
ollo schrieb:
interessant wird auch das copyright. wenn das wirklich als resynthese funktionieren sollte und nicht einfach nur silben zusammenkopiert, ermöglicht das ja richtig viel. ich lade also text von sagen wir rihanna, ein tool generiert komplett neuen inhalt daraus, es klingt aber wie die stimme von rihanna. wie wird damit umgegangen?
Zum zigtausendsten Mal:
Das Urheberrecht hängt am Text, nicht an der Stimme oder an Frau Rihanna. Wer den Text singt, das ist schnurz.
Wenn Du für die VoCo-Stimme von Rihanna einen neuen Text schreibst, so liegt das Urheberrecht bei Dir.

Wenn, dann berührt das das Leistungsschutzrecht. Und hier ist der Fall eigentlich auch klar, da der einzelne Silbensample, auf dem die Resynthese basiert, immer noch von Rihanna eingesungen wurde. Ob der Sample dann noch grün angemalt wurde, oder durch VoCo genutzt wurde ist ziemlich egal. Die ursprüngliche Leistung wurde durch Rihanna erbracht und ist bei Wiederverwertung zu vergüten.
 
V au schrieb:


mega gruslig, das Programm und die ganze Präsentation

Die sind ja alle schon "brainwashed" (Publikum) - dann macht das auch nix mehr.
Und die geheimdienste bekommen dann eine limited edition :agent:
 
fanwander schrieb:
ollo schrieb:
interessant wird auch das copyright. wenn das wirklich als resynthese funktionieren sollte und nicht einfach nur silben zusammenkopiert, ermöglicht das ja richtig viel. ich lade also text von sagen wir rihanna, ein tool generiert komplett neuen inhalt daraus, es klingt aber wie die stimme von rihanna. wie wird damit umgegangen?
Zum zigtausendsten Mal:
Das Urheberrecht hängt am Text, nicht an der Stimme oder an Frau Rihanna. Wer den Text singt, das ist schnurz.
Wenn Du für die VoCo-Stimme von Rihanna einen neuen Text schreibst, so liegt das Urheberrecht bei Dir.

Wenn, dann berührt das das Leistungsschutzrecht. Und hier ist der Fall eigentlich auch klar, da der einzelne Silbensample, auf dem die Resynthese basiert, immer noch von Rihanna eingesungen wurde. Ob der Sample dann noch grün angemalt wurde, oder durch VoCo genutzt wurde ist ziemlich egal. Die ursprüngliche Leistung wurde durch Rihanna erbracht und ist bei Wiederverwertung zu vergüten.

mit dem urheberrecht ist schon klar.

mir ging es darum, dass ja das leistungsschutzrecht ausgehoben wird, wenn eben nicht nur silbensamples verschoben werden sondern der klang analyisert und nachgebaut wird (wenn es denn so funktioniert). dann hat man die originalaufnahme ja nur analysiert und nicht abgesamplet und in dem sinne ja nur die klangfarbe (die ja nicht geschütz werden kann) mit eigenem text nachgebaut.

du kannst dann wie person x klingen ohne dich aber direkt an einem werk vergriffen zu haben.
 
aber auch nur, wenn es nicht als sogenannte "Bearbeitung" verstanden oder kategorisiert wird, denn da macht man scheinbar auch einen Unterschied ...
 
ollo schrieb:
du kannst dann wie person x klingen ohne dich aber direkt an einem werk vergriffen zu haben.
Du klingst wie Person x weil jemand die Leistung erbracht hat, Person x aufzunehmen, und Person X hat die Leistung erbracht ins Mikro zu sprechen.

=> Leistungsschutzrecht verletzt.
 
fanwander schrieb:
ollo schrieb:
du kannst dann wie person x klingen ohne dich aber direkt an einem werk vergriffen zu haben.
Du klingst wie Person x weil jemand die Leistung erbracht hat, Person x aufzunehmen, und Person X hat die Leistung erbracht ins Mikro zu sprechen.

=> Leistungsschutzrecht verletzt.

ja aber das programm (nicht unbedingt das von adobe hier im beispiel, weil das ja mit samples arbeitet )analysiert ja die klangfarbe von person x, baut die stimme von person x virtuell nach (additiv vielleicht) und im endeffekt habe ich die stimme von person x ohne das auch nur ein kurzes sample benutzt wurde.

ähnlich wie wenn ich einen synthsound einer platte, die ich gut finde nachbaue. klingt im besten fall genauso aber da ich es nicht gesamplet habe wird auch nicht das leistungsschutzrecht verletzt.

ich könnte ja auch jemanden beauftragen, der möglichst wie person x singen kann aber so ein programm, wenn es das könnte, bringt ja nochmal ganz andere möglichkeiten ins spiel.
 
ollo schrieb:
ja aber das programm (nicht unbedingt das von adobe hier im beispiel, weil das ja mit samples arbeitet )analysiert ja die klangfarbe von person x, baut die stimme von person x virtuell nach (additiv vielleicht) und im endeffekt habe ich die stimme von person x ohne das auch nur ein kurzes sample benutzt wurde.
Da gibt es natürlich noch keine Rechtsprechung dazu (und Urheberrecht und Leistungschutzrecht ist REINES Urteilsbasiertes Recht. Es gibt dazu keine schriftlichen Verfahrensvorschriften oder Normen dazu). Aber ich nehme an, dass ein Richter hier nicht die direkte 1:1 Durchverbindung vom Original zur Kopie - wie zB durch ein Sample - braucht. Das auf Basis der virtuellen Kopie erstellte Werk hätte ohne das Original nicht in dieser Weise erstellt werden können. Es ist ein abhängiges Werk. Fertig.
 


Neueste Beiträge

News

Zurück
Oben