Login: 
Passwort: 
Neuanmeldung 
Passwort vergessen



Das neue Heft erscheint am 23. Dezember
IFR-Training mit dem Amtsgericht Langen
Lisa: Paneldesign
Ramp-Inspections – nüchtern betrachtet
Beinahe-Kollision
LVTO im privaten Flugbetrieb
Fehlerhafte Starttechnik
Engagierter Journalismus aus Sicht des eigenen Cockpits
Engagierter Journalismus aus Sicht des eigenen Cockpits
Sortieren nach:  Datum - neue zuerst |  Datum - alte zuerst |  Bewertung

Avionik | Wer kennt sich mit TEXT-TO-SPEECH-prozessoren und deren SW aus?  
10. September 2025 11:07 Uhr: Von ingo fuhrmeister 

hallo in die runde!

für ein laufendes project, das wir noch etwas "aufpeppen" möchten....

wer hat kenntnisse im programmieren von text-to-speech mit speech-commandos um

eine liste, die über text abgelegt wurde, mittels stimme aufzurufen?

wir benötigen dafür die sw-/hw auf entsprechend engem raum.

wer hätte eine COTS-lösung - bzw entwicklungszeit aufwand?

mfg

ingo fuhrmeister

10. September 2025 17:36 Uhr: Von Tobias Schnell an ingo fuhrmeister

um eine liste, die über text abgelegt wurde, mittels stimme aufzurufen?

Hmm, also ohne jetzt konkret was beitragen zu können, aber: Ist "Text to Speech" wirklich das, was Du suchst? Für mich klingt das eher nach Voice Recognition!?

10. September 2025 17:56 Uhr: Von Joachim P. an Tobias Schnell

Hmm, der Beschreibung nach will er Texte hinterlegen, die dann maschinell gesprochen werden.

@ingo muss das dynamisch generiert werden oder reichen auch ein paar vordefinierte Brocken?

https://www.berrybase.de/adafruit-audio-fx-mini-sound-board-wav-ogg-trigger-2mb-flash?gad_source=1&gad_campaignid=2274332340

10. September 2025 19:05 Uhr: Von Ingo Schmittner an ingo fuhrmeister

Wenn auf deiner Hardware Linux läuft:
Mozilla TTS

https://github.com/mozilla/TTS

Oder das hier, wenn's µC sein muss: https://www.polaxis.be/using-nexus-vox-with-your-prefered-microcontroller/

Wobei das Mozilla Teil wesentlich(!) besser klingt. Der Polaxis Chip ist IMHO überteuert.

11. September 2025 11:21 Uhr: Von ingo fuhrmeister an Ingo Schmittner

vielen dank für eure antworten...ich habe grad eine interessante anwendung vorzubereiten...in kurzform soll folgendes passieren:

der anwender (A) startet mit seiner aufforderung: LIST

1. in den ycontroller (yC) werden vorher texte geschrieben: zb

1. heute ist ein schöner tag für PuF

(A) sagt: GO ----> ycontroller springt in die nächste textzeile und liest vor:

(yC) sagt: computer einschalten

(A) sagt: GO------> ycontroller springt in die nächste textzeile und liest vor:

(yC) sagt: öffnen sie den browser

(A) sagt: GO------

ist die textsammlung zu ende....kommt vom yC die nachricht:

(yC) sagt: Liste fertig

da die gesamte liste aus mehreren kapiteln besteht - müßte noch ein "NEXT"-commando gesprochen

werden, um zum nächsten kapitel zu springen....

wer könnte mir dabei helfen?

es winken ruhm und ehre.....

mfg

ingo fuhrmeister

11. September 2025 11:34 Uhr: Von Joachim P. an ingo fuhrmeister

Also Sprachausgabe und Spracherkennung.

@Tobias: Dann zahlt jeder sein Bier selbst?

11. September 2025 11:40 Uhr: Von Tobias Schnell an Joachim P. Bewertung: +0.67 [1]

@Tobias: Dann zahlt jeder sein Bier selbst?

Nein, wir trinken jeder zwei.

11. September 2025 11:55 Uhr: Von Michael Huber an ingo fuhrmeister

Hast du Chat GBT ?

Ich habe da mal was eingegeben, da kommt auch was raus, was dann aber meine ZEIT und meine TECHNISCHE Neugier und Können überschreitet...

11. September 2025 12:04 Uhr: Von Yury Zaytsev an ingo fuhrmeister
11. September 2025 12:17 Uhr: Von ingo fuhrmeister an Yury Zaytsev

ja - vielen dank....

gibt es denn einen ycontroller - mit dem ich das auf einem eval-board aufbauen könnte?

ich weis nicht, wonach ich suchen soll....

11. September 2025 12:49 Uhr: Von Yury Zaytsev an ingo fuhrmeister

Ich glaube, man könnte es grundsätzlich mit EmBox hinbekommen (https://github.com/embox/embox). Noch tiefer runter wird schwierig sein, aber dazu muss sich jemand äußern, der sich damit auskennt. Am einfachsten wäre es mit eine Raspberry Pi o. Ä.

11. September 2025 19:43 Uhr: Von ingo fuhrmeister an Yury Zaytsev

hallo yuri...wo finde ich denn da den eval kit mit beschreibung?

11. September 2025 19:49 Uhr: Von Yury Zaytsev an ingo fuhrmeister

Wie bereits gesagt, bin ich aktuell die falsche Adresse für „echte” Mikrocontroller. Sollte für deine Zwecke eine RPi (ein ganz normaler Linux-Computer mit ARM-Prozessor) reichen, kommt für dich vielleicht so etwas in Frage:

https://www.raspberrypi.com/products/compute-module-5/?variant=cm5-104032

12. September 2025 15:26 Uhr: Von Michael Stock an ingo fuhrmeister

Servus Ingo,

eine schon weitgehend integrierte Lösung wäre das hier:

https://www.digikey.de/de/htmldatasheets/production/1317098/0/0/1/isd3900

Aus der ISD-Reihe gibt es noch einige andere Bauteile, die ähnlich sind (ISD1820, ISD700). Ich habe schon einige Versuche mit dem ISD1820 gemacht, also Sprachtext aufgesprochen, dessen Ausgabe durch ein Diskretsignal getriggert werden kann. Mit einem zusätzlichen kleinen Audioverstärker (z.B. LM386) kann man ein Intercom befüttern ....

12. September 2025 21:08 Uhr: Von Yury Zaytsev an Michael Stock

Nun, bei TTS sehe ich weniger das Problem, aber wie sieht es mit STT aus? Meiner Meinung nach geht, wenn es gut und allgemein sein muss, nur RPi + Whisper.

Ich habe ein bisschen gegoogelt und scheinbar kriegt man, wenn man sich richtig anstrengt, irgendetwas extrem abgespecktes auf STM32 zum Laufen, aber das ist kein COTS. Wenn es noch einfacher sein darf (nur einige Wörter), hat TI scheinbar eine MSP-basierte COTS-Lösung:

https://www.ti.com/document-viewer/lit/html/SSZTAN9

13. September 2025 08:36 Uhr: Von Michael Stock an Yury Zaytsev

Stimmt, Spracherkennung ist ein viel dickeres Brett als Spracherzeugung. Danke für den TI-Tip ....

18. September 2025 13:02 Uhr: Von Yury Zaytsev an Michael Stock

Noch eine Alternative, die nicht wirklich ernst zu nehmen ist, aber mit dem MSP432 schon nicht unvergleichbar ist. Als ich „vape” gelesen habe, habe ich sofort an OP gedacht :)

https://bogdanthegeek.github.io/blog/projects/vapeserver/

23. September 2025 12:13 Uhr: Von Michael Stock an Yury Zaytsev

Hmmm .... Allgemeine Spracherkennung ist richtig schwierig, und es stellt sich immer die Frage der Zuverlässigkeit der Erkennung - im Luftfahrtbereich ist das schon wichtig. ich habe jetzt jedenfalls den Auftrag für die Entwicklung einer über CANaerospace-Nachrichten getriggerten Audio-Sprachausgabe erhalten und werde zu gegebener Zeit berichten.

23. September 2025 12:55 Uhr: Von ingo fuhrmeister an Michael Stock

Schalte doch pn frei...

23. September 2025 18:49 Uhr: Von Michael Stock an ingo fuhrmeister

Ach so .... Hab ich jetzt gemacht.

24. September 2025 08:22 Uhr: Von Yury Zaytsev an Michael Stock

Aber für TTS wurden doch oben ein paar gute Vorschläge (Mozilla, Polaxis) gepostet, oder?

24. September 2025 09:53 Uhr: Von Michael Stock an Yury Zaytsev

Ja, das stimmt. Allerdings glaube ich, daß man noch viel Arbeit reinstecken muß, bis das zu einem guten Luftfahrtprodukt wird. Vielleicht beschäftigt sich ja einer der Mitlesenden damit ....


22 Beiträge Seite 1 von 1

 

Home
Impressum
© 2004-2026 Airwork Press GmbH. Alle Rechte vorbehalten. Vervielfältigung nur mit Genehmigung der Airwork Press GmbH. Die Nutzung des Pilot und Flugzeug Internet-Forums unterliegt den allgemeinen Nutzungsbedingungen (hier). Es gelten unsere Datenschutzerklärung unsere Allgemeinen Geschäftsbedingungen (hier). Kartendaten: © OpenStreetMap-Mitwirkende, SRTM | Kartendarstellung: © OpenTopoMap (CC-BY-SA) Hub Version 14.29.06
Zur mobilen Ansicht wechseln
Seitenanfang