Wer kennt sich mit TEXT-TO-SPEECH-prozessoren und deren SW aus?

Das neue Heft erscheint am 1. Mai
AERO-Fazit: The good, the bad and the strange ...
Flug auf die Lofoten bei Traumwetter
Auftrieb und Widerstand – flugphysikalisch
Qaqortoq ersetzt Narsarsuaq Airport
If you want to fly – buy! Teil 3
Mangelhaftes Automation-Management

Engagierter Journalismus aus Sicht des eigenen Cockpits

Sortieren nach: Datum - neue zuerst | Datum - alte zuerst | Bewertung

Avionik | Wer kennt sich mit TEXT-TO-SPEECH-prozessoren und deren SW aus?

10. September 2025 11:07 Uhr: Von ingo fuhrmeister

Kontext

hallo in die runde!

für ein laufendes project, das wir noch etwas "aufpeppen" möchten....

wer hat kenntnisse im programmieren von text-to-speech mit speech-commandos um

eine liste, die über text abgelegt wurde, mittels stimme aufzurufen?

wir benötigen dafür die sw-/hw auf entsprechend engem raum.

wer hätte eine COTS-lösung - bzw entwicklungszeit aufwand?

mfg

ingo fuhrmeister

Bewerten Antworten Benachrichtigung an

10. September 2025 17:36 Uhr: Von Tobias Schnell an ingo fuhrmeister

Kontext

um eine liste, die über text abgelegt wurde, mittels stimme aufzurufen?

Hmm, also ohne jetzt konkret was beitragen zu können, aber: Ist "Text to Speech" wirklich das, was Du suchst? Für mich klingt das eher nach Voice Recognition!?

Bewerten Antworten

10. September 2025 17:56 Uhr: Von Joachim P. an Tobias Schnell

Kontext

Hmm, der Beschreibung nach will er Texte hinterlegen, die dann maschinell gesprochen werden.

@ingo muss das dynamisch generiert werden oder reichen auch ein paar vordefinierte Brocken?

https://www.berrybase.de/adafruit-audio-fx-mini-sound-board-wav-ogg-trigger-2mb-flash?gad_source=1&gad_campaignid=2274332340

Bewerten Antworten

10. September 2025 19:05 Uhr: Von Ingo Schmittner an ingo fuhrmeister

Kontext

Wenn auf deiner Hardware Linux läuft:
Mozilla TTS

https://github.com/mozilla/TTS

Oder das hier, wenn's µC sein muss: https://www.polaxis.be/using-nexus-vox-with-your-prefered-microcontroller/

Wobei das Mozilla Teil wesentlich(!) besser klingt. Der Polaxis Chip ist IMHO überteuert.

Bewerten Antworten

11. September 2025 11:21 Uhr: Von ingo fuhrmeister an Ingo Schmittner

Kontext

vielen dank für eure antworten...ich habe grad eine interessante anwendung vorzubereiten...in kurzform soll folgendes passieren:

der anwender (A) startet mit seiner aufforderung: LIST

1. in den ycontroller (yC) werden vorher texte geschrieben: zb

1. heute ist ein schöner tag für PuF

(A) sagt: GO ----> ycontroller springt in die nächste textzeile und liest vor:

(yC) sagt: computer einschalten

(A) sagt: GO------> ycontroller springt in die nächste textzeile und liest vor:

(yC) sagt: öffnen sie den browser

(A) sagt: GO------

ist die textsammlung zu ende....kommt vom yC die nachricht:

(yC) sagt: Liste fertig

da die gesamte liste aus mehreren kapiteln besteht - müßte noch ein "NEXT"-commando gesprochen

werden, um zum nächsten kapitel zu springen....

wer könnte mir dabei helfen?

es winken ruhm und ehre.....

mfg

ingo fuhrmeister

Bewerten Antworten

11. September 2025 11:34 Uhr: Von Joachim P. an ingo fuhrmeister

Kontext

Also Sprachausgabe und Spracherkennung.

@Tobias: Dann zahlt jeder sein Bier selbst?

Bewerten Antworten

11. September 2025 11:40 Uhr: Von Tobias Schnell an Joachim P. Bewertung: +0.67 [1]

Kontext

@Tobias: Dann zahlt jeder sein Bier selbst?

Nein, wir trinken jeder zwei.

Bewerten Antworten

11. September 2025 11:55 Uhr: Von Michael Huber an ingo fuhrmeister

Kontext

Hast du Chat GBT ?

Ich habe da mal was eingegeben, da kommt auch was raus, was dann aber meine ZEIT und meine TECHNISCHE Neugier und Können überschreitet...

Bewerten Antworten

11. September 2025 12:04 Uhr: Von Yury Zaytsev an ingo fuhrmeister

Kontext

Schau dir mal https://github.com/ggml-org/whisper.cpp an. Alternativ https://www.pyannote.ai/ .

Bewerten Antworten

11. September 2025 12:17 Uhr: Von ingo fuhrmeister an Yury Zaytsev

Kontext

ja - vielen dank....

gibt es denn einen ycontroller - mit dem ich das auf einem eval-board aufbauen könnte?

ich weis nicht, wonach ich suchen soll....

Bewerten Antworten

11. September 2025 12:49 Uhr: Von Yury Zaytsev an ingo fuhrmeister

Kontext

Ich glaube, man könnte es grundsätzlich mit EmBox hinbekommen (https://github.com/embox/embox). Noch tiefer runter wird schwierig sein, aber dazu muss sich jemand äußern, der sich damit auskennt. Am einfachsten wäre es mit eine Raspberry Pi o. Ä.

Bewerten Antworten

11. September 2025 19:43 Uhr: Von ingo fuhrmeister an Yury Zaytsev

Kontext

hallo yuri...wo finde ich denn da den eval kit mit beschreibung?

Bewerten Antworten

11. September 2025 19:49 Uhr: Von Yury Zaytsev an ingo fuhrmeister

Kontext

Wie bereits gesagt, bin ich aktuell die falsche Adresse für „echte” Mikrocontroller. Sollte für deine Zwecke eine RPi (ein ganz normaler Linux-Computer mit ARM-Prozessor) reichen, kommt für dich vielleicht so etwas in Frage:

https://www.raspberrypi.com/products/compute-module-5/?variant=cm5-104032

Bewerten Antworten

12. September 2025 15:26 Uhr: Von Michael Stock an ingo fuhrmeister

Kontext

Servus Ingo,

eine schon weitgehend integrierte Lösung wäre das hier:

https://www.digikey.de/de/htmldatasheets/production/1317098/0/0/1/isd3900

Aus der ISD-Reihe gibt es noch einige andere Bauteile, die ähnlich sind (ISD1820, ISD700). Ich habe schon einige Versuche mit dem ISD1820 gemacht, also Sprachtext aufgesprochen, dessen Ausgabe durch ein Diskretsignal getriggert werden kann. Mit einem zusätzlichen kleinen Audioverstärker (z.B. LM386) kann man ein Intercom befüttern ....

Bewerten Antworten

12. September 2025 21:08 Uhr: Von Yury Zaytsev an Michael Stock

Kontext

Nun, bei TTS sehe ich weniger das Problem, aber wie sieht es mit STT aus? Meiner Meinung nach geht, wenn es gut und allgemein sein muss, nur RPi + Whisper.

Ich habe ein bisschen gegoogelt und scheinbar kriegt man, wenn man sich richtig anstrengt, irgendetwas extrem abgespecktes auf STM32 zum Laufen, aber das ist kein COTS. Wenn es noch einfacher sein darf (nur einige Wörter), hat TI scheinbar eine MSP-basierte COTS-Lösung:

https://www.ti.com/document-viewer/lit/html/SSZTAN9

Bewerten Antworten

13. September 2025 08:36 Uhr: Von Michael Stock an Yury Zaytsev

Kontext

Stimmt, Spracherkennung ist ein viel dickeres Brett als Spracherzeugung. Danke für den TI-Tip ....

Bewerten Antworten

18. September 2025 13:02 Uhr: Von Yury Zaytsev an Michael Stock

Kontext

Noch eine Alternative, die nicht wirklich ernst zu nehmen ist, aber mit dem MSP432 schon nicht unvergleichbar ist. Als ich „vape” gelesen habe, habe ich sofort an OP gedacht :)

https://bogdanthegeek.github.io/blog/projects/vapeserver/

Bewerten Antworten

23. September 2025 12:13 Uhr: Von Michael Stock an Yury Zaytsev

Kontext

Hmmm .... Allgemeine Spracherkennung ist richtig schwierig, und es stellt sich immer die Frage der Zuverlässigkeit der Erkennung - im Luftfahrtbereich ist das schon wichtig. ich habe jetzt jedenfalls den Auftrag für die Entwicklung einer über CANaerospace-Nachrichten getriggerten Audio-Sprachausgabe erhalten und werde zu gegebener Zeit berichten.

Bewerten Antworten

23. September 2025 12:55 Uhr: Von ingo fuhrmeister an Michael Stock

Kontext

Schalte doch pn frei...

Bewerten Antworten

23. September 2025 18:49 Uhr: Von Michael Stock an ingo fuhrmeister

Kontext

Ach so .... Hab ich jetzt gemacht.

Bewerten Antworten

24. September 2025 08:22 Uhr: Von Yury Zaytsev an Michael Stock

Kontext

Aber für TTS wurden doch oben ein paar gute Vorschläge (Mozilla, Polaxis) gepostet, oder?

Bewerten Antworten

24. September 2025 09:53 Uhr: Von Michael Stock an Yury Zaytsev

Kontext

Ja, das stimmt. Allerdings glaube ich, daß man noch viel Arbeit reinstecken muß, bis das zu einem guten Luftfahrtprodukt wird. Vielleicht beschäftigt sich ja einer der Mitlesenden damit ....

Bewerten Antworten

22 Beiträge Seite 1 von 1

Aktuelle Diskussionen - 20 +
Fliegen nach Egelsbach [25]
Aero 26 [34]
Französische Mittelmeerküste [33]
TRX1500A an GTN650 -> Konfiguration? [6]
Empfehlung Praxisausbildung CB-IR [8]
Island-Hopping in den Philippinen [1]
Neue flugschule 'Treeflight' [3]
Akkus für Schleppmaxxe [18]
Flugplatzrestaurant zwischen Friedrichshafen und Stuttgart [8]
LBA Bearbeitungszeiten für Lizenzen im Ref. L4 [151]
T-6 Impossible Turn [4]
airfield.directory - free, open PIREP and fuel/fees database, non-commercial [267]
Suche: Garmin GI-106 [2]
Knopf im Kopf [7]
ZÜP - der schleichende Abschied ? [12]
Skyecho und ADS-B-out [5]
Currywurst Fly-In Hodenhagen 2026 [5]
"advise you to stay at altitude" - dümmster Spruch ATC seit Jahrzehnten, und... [10]
LBA Medical: Auch am Runden Tisch kann man in der Ecke sitzen [21]
Starlink mini \| Good Bye \| neue Aviation Tarife [60]

Login:
Passwort:
Neuanmeldung Passwort vergessen?