Spracherkennung?

Für Probleme bezüglich Grafik, Audio, GL, ACS, ...
Antworten
Benutzeravatar
fliegermichl
Lazarusforum e. V.
Beiträge: 785
Registriert: Do 9. Jun 2011, 09:42
OS, Lazarus, FPC: Winux (L 2.0.11 FPC 3.2)
CPU-Target: 32/64Bit
Wohnort: Echzell

Spracherkennung?

Beitrag von fliegermichl »

Moin,

ich bastel zur Zeit an einem Roboter und würde den gerne per Sprachsteuerung kontrollieren. Hat sich jemand schon mal mit dem Thema befasst und kann mir sagen, wo ich da am besten anfange?

LG Michael

Benutzeravatar
Winni
Beiträge: 545
Registriert: Mo 2. Mär 2009, 16:45
OS, Lazarus, FPC: Laz2.06, fpc 3.04
CPU-Target: 64Bit
Wohnort: Fast Dänemark

Re: Spracherkennung?

Beitrag von Winni »

Hi!

Kurz aufflackernde Discussion im internationalen Forum vor zwei Jahren.

https://forum.lazarus.freepascal.org/in ... ic=40886.0

Die Monster M$, Google & Apple sind anscheinend so weit vorne, dass sich nieman mehr ernsthaft damit beschäftigt.

Ich würde mehr im universitären Bereich gucken.

Ich weiss, dass in den 90ern die Uni Birmingham ziemlich weit vorne war mit Sprachsynthese. Ist nicht das Thema aber artverwandt.

Winni

PascalDragon
Beiträge: 222
Registriert: Mi 3. Jun 2020, 07:18
OS, Lazarus, FPC: L 2.0.8, FPC Trunk, OS Win/Linux
CPU-Target: Aarch64 bis Z80 ;)
Wohnort: München

Re: Spracherkennung?

Beitrag von PascalDragon »

Die Voice Assistant Software Rhasspy bietet für die Spracherkennung unter anderem die Nutzung von PocketSphinx, Kaldi oder DeepSpeech. Die entsprechende API müsste natürlich angebunden werden, aber das wären auch die, auf die ich zurückgreifen würde.
FPC Compiler Entwickler

Benutzeravatar
fliegermichl
Lazarusforum e. V.
Beiträge: 785
Registriert: Do 9. Jun 2011, 09:42
OS, Lazarus, FPC: Winux (L 2.0.11 FPC 3.2)
CPU-Target: 32/64Bit
Wohnort: Echzell

Re: Spracherkennung?

Beitrag von fliegermichl »

PascalDragon hat geschrieben:
Di 1. Dez 2020, 13:40
Die Voice Assistant Software Rhasspy bietet für die Spracherkennung unter anderem die Nutzung von PocketSphinx, Kaldi oder DeepSpeech. Die entsprechende API müsste natürlich angebunden werden, aber das wären auch die, auf die ich zurückgreifen würde.
Danke für den Tip. Das sieht sehr vielversprechend aus, zumal es komplett ohne Internetverbindung und idealerweise auf dem Raspberry läuft (der auch meinen Roboter steuern soll)

PascalDragon
Beiträge: 222
Registriert: Mi 3. Jun 2020, 07:18
OS, Lazarus, FPC: L 2.0.8, FPC Trunk, OS Win/Linux
CPU-Target: Aarch64 bis Z80 ;)
Wohnort: München

Re: Spracherkennung?

Beitrag von PascalDragon »

fliegermichl hat geschrieben:
Di 1. Dez 2020, 13:58
PascalDragon hat geschrieben:
Di 1. Dez 2020, 13:40
Die Voice Assistant Software Rhasspy bietet für die Spracherkennung unter anderem die Nutzung von PocketSphinx, Kaldi oder DeepSpeech. Die entsprechende API müsste natürlich angebunden werden, aber das wären auch die, auf die ich zurückgreifen würde.
Danke für den Tip. Das sieht sehr vielversprechend aus, zumal es komplett ohne Internetverbindung und idealerweise auf dem Raspberry läuft (der auch meinen Roboter steuern soll)
Ich selbst plane auch damit zu arbeiten (allerdings mache ich mir das Leben schwerer, indem ich versuche es auf 'nem Arch statt auf 'nem Rasbian zum Laufen zu bringen :P ). Da Rhasspy mit einem MQTT Broker arbeitet kannst du auch entsprechende Anbindungen in FPC machen (was eben mein Plan ist). :)
FPC Compiler Entwickler

Benutzeravatar
fliegermichl
Lazarusforum e. V.
Beiträge: 785
Registriert: Do 9. Jun 2011, 09:42
OS, Lazarus, FPC: Winux (L 2.0.11 FPC 3.2)
CPU-Target: 32/64Bit
Wohnort: Echzell

Re: Spracherkennung?

Beitrag von fliegermichl »

Die komplette Robotersteuerung auf dem Raspberry und auch auf dem Arduino (der macht die Dinge die getimed werden müssen, Schrittmotoren, Neopixel usw.) mache ich mit Lazarus/FPC. Wenn ich den komplett fertig habe (was noch ziemlich lange dauern kann) werde ich das Projekt mal etwas detailierter hier vorstellen.

Antworten