Sprachsynthese

Ah...diese beiden Programme werde ich mal abchecken. Ich habe nur
chipspeech gestestet, aber ob er es genau so hinbekommt. Ich hab momentan noch die Testversion und mach ganz selten mal
damit rum.

..mir fällt heute zum ersten mal auf daß bei diesem Kraftwerk Intro scheinbar eine Menschliche Stimme mit beigemischt ist bzw.
einfach in ein Filter auf besondere Weise reingesprochen wurde. Es hört sich irgendwie so menschlich an :dunno:
 
Also ich würde sagen das erste ist Text-To-Speak und das zweite Vocoder.
U96 - Das Boot dachte ich war das Basic Programm "S.A.M.", welches ich bspw. auf dem Commodere C-64 lief.
Alex Christensen nutze wohl [STSpeech], man kann wohl beide Programme noch finden und in entsprechenden Emulatoren laufen lassen.
- unter Mac OS ist TTS dabei, weil man sich ja auch Ereignise vorlesen, bzw. im Terminal einfach `say -v Victoria hello` (es gibt über 20 Voices) eingeben kann.
- Windows SayIt
- Linux: Festival, eSpeak uvm.
- Online TTS gab es auch mal einiges

Anosnten, wenn man will, könnte man mit Formanten, EQ oder Bandpassfiltern auch einen Synth zum Sprechen bringen.
 
VST SPEEK hört sich für mein Befinden ziemlich nach den Vocals von „Das Boot“ an.
Phonetische Schreibweise versteht es glaube ich auch. Ist im Standard allerdings englisch.
Deutsche Aussprache muss man sich daher erst bestmöglichst zusammenbasteln.
Ach ja, Freeware.... ?

Iridium von Waldorf kann auch Sprache synthetisieren.
...ansonsten fällt mir noch Plouge Chipspeech, Tone2 Icarus und PPG Phonem ein
 
Zuletzt bearbeitet:
..mir fällt heute zum ersten mal auf daß bei diesem Kraftwerk Intro scheinbar eine Menschliche Stimme mit beigemischt ist bzw.
einfach in ein Filter auf besondere Weise reingesprochen wurde. Es hört sich irgendwie so menschlich an
Bei Kraftwerk ist das einfach Vocoder mit Rauschen als Carrier und das Hochpassband des Modulators auf den Ausgang durchgeschleift.
 
anscheinend haben kraftwerk aber tatsächlich bei älteren aufnahmen im laufe der jahre den vocoder hier und da gerne mit selbstgebastelten sprachsynths ersetzt, herr schneider hat ja auch lebenslänglich an einem sprachsynthesizer gearbeitet soweit ich weiß
 
Bei den Vocaloids gibt es keine nach Textbaustein zusammengesetzt gesprochenen Worte, sondern gesungene.
Daher sind sie in diesem Sinne keine Sprachsynthesizer a la TextToSpeech, sondern sozusagen "Gesangssynthesizer", TextToSing.
Hörst du zum Beispiel in meinem Werk "Softly Killing" (Vocaloid Avanna):

https://www.youtube.com/watch?v=4WoEaiD_TBY

Ein kostenloses, Vocaloid-ähnliches Tool ist "Alter Ego" für Plugue/Sforzando. Zwar bei weitem nicht so gut wie Vocaloids, aber ganz nette und lustige Sache:

"SAM", vielen bekannt aus dem C64, gibt es auch kostenlos für PC.
Das Downloadtool/Programm läuft allerdings nicht so stabil, weswegen ich die Web-App benutze und Sachen von dort direkt sample:

KRAFTWERK benutzte nicht nur die obligatorischen "Reinsing-Vocoder", sondern vermehrt echte Sprachcomputer.
Damals wurde von Florian zumeist das VOTRAX Sprachmodul benutzt (Votrax VS-4 /später VS 6/ u.a. "Radioland"), das Florian im Gegensatz zu der herkömmlichen Verwendung und die Experten irritierend, irgendwie zum singen bringen konnte (durch Harmonizer), zudem wurden auch noch das große DECTALK System aus den USA und die schwedische INFOVOX mit Platinen für Fremdsprachen benutzt.
Ganz besonders, auch in Mitarbeit mit Wolfgang Kulas (68000 Computer von SWTP), wirkte Florian Schneider in seinem Sprachlabor an der gegenseitigen Weiterentwicklung von Sprachsynthesizern mit.
Auch der Pocket Language Translator (Taschenrechner) und der Speak&Spell (Kindercomputer), beide von Texas Instruments, fanden Verwendung (u.a."Numbers").

Ich nutzte häufig auch im WEB kostenlose TTS-Reader (Demos) mit Natural Readers, die ich dann über Vocoder, Shifter, Bit-Crusher und andere Controler usw. moduliere. Am liebsten z.B. den hier:

Das Lustige ist eigentlich ja auch, dass es mit dem "VODER" (Paralleler Vorläufer des Vocoder) bereits schon 1939(!) einen Sprachsynthesizer gab, der sogar sehr viel ausdruckstärker und cleaner klang als der Votrax:


Und so sah es aus und hörte es sich an, wenn die Vorläufer von SIRI und ALEXA Streit hatten :

https://www.youtube.com/watch?v=WjMwGWdqHVQ

https://www.youtube.com/watch?v=0rAyrmm7vv0
 
Zuletzt bearbeitet:
Bei Kraftwerk ist das einfach Vocoder mit Rauschen als Carrier und das Hochpassband des Modulators auf den Ausgang durchgeschleift.
Jetzt kann ich auch mal sagen "völliger Quatsch". :D
Auf Uranium ist es ebenfalls ein VOTRAX.
Über den externen Eingang des Votrax liegt ein polyphones Audiosignal und sie modulierten damit die Phoneme verschiedener Worte.
 
Afair nutzt U96 ST Speech.



atari 520ST speech synthesizer v2.0 for Atari ST
 
amahas Vocaloid schafft sowas anscheinend und der neue VITAL Softsynth verfügt wohl beispielsweise auch über solch eine Text-2-Speech Funktion
Vocaloid will Sänger ersetzen und kann das auch.


https://soundcloud.com/777-tektite/kuro-feat-miku-hatsune-1


Ja, es gibt auch allerlei andere Stimmen.

Vital macht aus dem Text ein Wavetable. Das kann schon so ähnlich klingen. Ich kriege jedesmal manchmal 'ne Fehlermeldung, dass der Synth keinen Internetzugang findet, obwohl ich online bin.
 
Zuletzt bearbeitet von einem Moderator:
http://www.virsyn.de/de/Products/MATRIX/matrix.html (199,-) (ios app nur 7€ meine ich)

"VirSyn is proud to report that Kraftwerk used our MATRIX Vocoder live on stage at their world tour 2008."


https://www.youtube.com/watch?v=Hr8RbQK5ONk



Der klingt richtig gut (youtu.be/ez-qLmjAOEA?t=246)
https://polyversemusic.com/products/manipulator/ (149,-)

paul stretch funzt auch relativ gut

https://tal-software.com/products/tal-vocoder (free)


Surge (free Synth mit vocoder)


https://www.youtube.com/watch?v=kz2uTwJeH60
 
Zuletzt bearbeitet:
Vocaloid will Sänger ersetzen und kann das auch.


https://soundcloud.com/777-tektite/kuro-feat-miku-hatsune-1


Ja, es gibt auch allerlei andere Stimmen.

Vital macht aus dem Text ein Wavetable. Das kann schon so ähnlich klingen. Ich kriege jedesmal 'ne Fehlermeldung, dass der Synth keinen Internetzugang findet, obwohl ich online bin.

Vorher war das nicht ganz so dolle mit Hatsune&Co (Meiko&Prima&Avanna sind da ohnehin meine Favoriten), jedoch seit Vocaloid5 hat das wiederum ein gewaltigen Hybrid-Sprung gemacht aus Synthesis&Samplephrases.
Es ist nur noch ein Frage der Zeit, wann es (verstorbene) Voices wie z.B. Sinatra, W.Houston, M.Jackson oder OrangUtan-Klaus etc. gibt, die sich via Formant synthetisieren und auf dem Keyboard spielen lassen.

Vocaloid5
 
Zuletzt bearbeitet:
Anbei noch aus der Vocaloid2 Serie "Vocaloid Prima" mit meinem Cover zu Henry Salvador`s "Dans Mon Ile".
Hier hatte ich sie in französisch singen lassen.
Die Besonderheit bei "Prima" ist, dass sie mit einem Trick auch ein rrrollendes "R" ausgeben kann, was sie natürlich für romanische und slawische Sprachen interessant macht. "Avanna" klingt ja "Prima" sehr ähnlich, doch beherrscht Avanna leider nicht das rollende R.

https://www.youtube.com/watch?v=WMeHv1F4gnQ
 
Danke für die reichlichen Beispiele, möchte nochmal erwähnen, schön wären ganz puristisch AUSSCHLIESSLICH SPRACHsynthesizer mit 100 % sprachsynthese, also OHNE samples, Audioquellen (vocoder), Gesang!

der VODER und der Atari sind KLASSE!!!
 
Zuletzt bearbeitet von einem Moderator:
Früher hab ich auch viel mit STspeech unter einem Atari Emulator gemacht (Release, Input) und später immer wieder mal das von Apple verwendet (Welcome the Robots, Nevada)
Hin und wieder verwendet ich auch SayIt von analog http://www.sequencer.de/syns/analog_synthesizer.html, das klingt auch ganz cool.

Da mein nächstes Projekt Thematik "Roboter, Sprache und Sprachsynthese" ist, habe ich mittlerweile einiges an Tools im Studio dafür. Neben dutzenden Effektgeräten und Vocodern, liegt da auch ein Assistive Tech Link (ein Computer zur Sprachausgabe für Behinderte) - Kann etwa 5 unterschiedliche Stimmen und hat einige Parameter um die Stimme "natürlicher" wirken zu lassen. Klingt trotzdem immer nach Computer ;-)
 
Ich nutze gerne den oben genannten Alter Ego, damit geht schon einiges und das für umme.
VST Speek macht genau diese U96 Stimme

Noch nicht genannt wurde Realivox Blue, auch sehr sehr geil was damit teilweise geht:
 
Danke für die reichlichen Beispiele, möchte nochmal erwähnen, schön wären ganz puristisch AUSSCHLIESSLICH SPRACHsynthesizer mit 100 % sprachsynthese, also OHNE samples, Audioquellen (vocoder), Gesang!

der VODER und der Atari sind KLASSE!!!
Cantor 2 von der deutschen Firma VirSyn beherrscht Sprachsynthese bzw. ist eigens dafür geschaffen worden:

 
Zuletzt bearbeitet:
Anbei eine Liste von reiner Sprachsynthese die es so gibt und gab. Software und Hardware:

SOFTWARE
  • Aristech
  • Balabolka (Freeware, 26 Sprachen, SAPI4 und SAPI5)
  • BOSS, entwickelt am Institut für Kommunikationswissenschaften der Universität Bonn
  • Audiodizer
  • Analog X "SayIt"
  • Browsealoud von textHELP
  • Cepstral Text-to-Speech
  • CereProc
  • DeskBot
  • espeak (Open Source, viele Sprachen, SAPI5)
  • Festival
  • Festvox
  • FreeTTS (Open Source)
  • GhostReader
  • Gnuspeech
  • Infovox
  • IVONA Text-to-Speech
  • Linguatec Voice Reader 15
  • Loquendo TTS
  • Logox Clipreader
  • MacinTalk und narrator.device von SoftVoice
  • MARY Text-To-Speech entwickelt vom DFKI Language Technology Lab
  • MBROLA
  • Modulate Software zur Stimmkonversion, benutzt Generative Adversarial Networks
  • NaturalReader von NaturalSoft
  • OnScreenVoices von tom weber software
  • ReadSpeaker: Webseiten vorlesen und Podcasting
  • Realspeak von Nuance (ehem. ScanSoft), jetzt Kobaspeech 3
  • SAM von Don't Ask Software
  • SVOX
  • SpeechConcept
  • Sprechomat
  • SYNVO
  • Tacotron (Google)
  • Text Aloud MP3
  • TTS Robot
  • Toshiba ToSpeak
  • virsyn CANTOR Vokalsynthese
  • Virtual Voice
  • Yamaha Vocaloid

HARDWARE

  • Votrax
    • SC-01A (analog formant)
    • SC-02 / SSI-263 / „Arctic 263“
  • General InstrumentSpeech Processor
    • SP0250
    • SP0256-AL2 „Orator“ (CTS256A-AL2)
    • SP0264
    • SP1000
  • Mullard MEA8000[12]
  • National Semiconductor DT1050 Digitalker (Mozer)
  • Silicon Systems SSI 263 (analog formant)
  • Texas Instruments
  • OkiSemiconductor
    • MSM5205
    • MSM5218RS (ADPCM)
  • Toshiba T6721A C²MOS Voice Synthesizing LSI
 
Software: Der Waldorf Nave hat auch einen Sprachsyntheszizer an Bord.

Hardware: Für den Ploytec PL2 gibt es eine alternative Firmware, mit der er die Phonem-Synthese beherrscht, ist aber etwas fummelig, damit ganze Wörter und Sätze zu formen.
 
Software: Der Waldorf Nave hat auch einen Sprachsyntheszizer an Bord.

Hardware: Für den Ploytec PL2 gibt es eine alternative Firmware, mit der er die Phonem-Synthese beherrscht, ist aber etwas fummelig, damit ganze Wörter und Sätze zu formen.
Vorsicht - die NAVE und Iridium/Quantum und auch NW1 Sprachsynthese ist eine Methode, Wavetables zu erzeugen, sie ist also eine Metalösung. So wie FM oder PWM über Wavetables zu fahren.

Entscheidend ist eher die Methode, die hier natürlich auch einfach Phoneme sind, nur ist deren Handhabung verschieden.
Synthetisch (SAM, ST-Speech etc) erzeugt ist zudem noch verschieden von Sampling-Phonemen (Siri)

Und Vocoder sind ein Effekt, der eine ganz andere Funktionsweise hat.
Vieles wurde schon genannt, deshalb nur ergänzend.

Kraftwerk generell haben bei dem Beispiel einen Vocoder verwendet (siehe auch Countdown in "Orion" etc - nicht zu verwechseln mit Talkbox - einem sehr viel einfacheren Verfahren), es gibt aber auch die synthetische Stimme Votrax und die ist auch synthetisch.
Dazu gibt es hier im Forum auch einen Thread, deshalb spare ich mir noch Kommentare dazu.
 
Noch mal zum Vital. Der ist freilich nicht erste Wahl, denn spontan was reinsabbeln, wie bei MiniNova oder µKorg und -Freak geht nicht. Aber wer Spaß am Basteln hat, wird durchaus auf seine Kosten kommen.

Mit der Gratisversion kann man nur 5 Text2Wavetables pro Tag erstellen. Es gibt aber einen Einblick drauf, was möglich ist, wenn der Fokus darauf liegt, Vocodersounds zu erzeugen. Das Verbiegungpotential ist deutlich höher als bei 'nem Vocoder, nicht zuletzt wegen der internen Effekte.

Da das Text2Wavetable-Thingy Umlaute verarbeiten kann, beherrscht Vital auch Sachsensynthese.

______or2n.jpg
 
Noch mal zum Vital. Der ist freilich nicht erste Wahl, denn spontan was reinsabbeln, wie bei MiniNova oder µKorg und -Freak geht nicht. Aber wer Spaß am Basteln hat, wird durchaus auf seine Kosten kommen.

Mit der Gratisversion kann man nur 5 Text2Wavetables pro Tag erstellen. Es gibt aber einen Einblick drauf, was möglich ist, wenn der Fokus darauf liegt, Vocodersounds zu erzeugen. Das Verbiegungpotential ist deutlich höher als bei 'nem Vocoder, nicht zuletzt wegen der internen Effekte.

Da das Text2Wavetable-Thingy Umlaute verarbeiten kann, beherrscht Vital auch Sachsensynthese.

Anhang anzeigen 87968
Gänsefleisch mal `n Kofferraum uffmachen :D
Eine Art "Dialektocoder" ?
 
Yup. Ich hab den ganzen Satz eingegeben. Es klingt so dermaßen bescheuert, dass ich vor Scham fest vergangen wäre. :oops:

 

Anhänge

  • EiVerbibsch.mp3
    7,9 MB

Similar threads

3
Antworten
3
Aufrufe
4K
B


News

Zurück
Oben