Sprechender PC und Sprachsteuerung (Open Source Projekt)

am 22.11.2009, 11:45 Uhr eröffnete seitenreport folgenden Thread
Projekt-Ideen & gemeinsame Entwicklungen 14638 mal gelesen 9 Antwort(en).

Ich bin gerade dabei, meinem Linux das Sprechen, "Verstehen" und Reagieren auf Sprachanweisungen beizubringen (ähnlich wie der Computer im Film "Star Trek").

Als Plattform verwende ich Linux (Ubuntu). Der Vorteil von Linux ist, dass alle Programme auf einfachen Konsolebefehlen basieren, durch die ich sie beliebig steuern kann. Zudem habe ich ich die volle Kontrolle über das Betriebssystem und kann es dadurch anweisen, genau das zu tun, was ich möchte.

Die Sprachausgabe von beliebigen Texten und Systemwerten (Uhrzeit etc.) funktioniert bereits, z.B. echo "Hallo $USER" | speakit usw.
Die Qualität ist gut und es sind beliebige Sprecherstimmen und Modulationen möglich (selbst singen).

Nach Fertigstellung soll das Programm folgendes können:
- Ich: "Computer? Wie spät ist es?" Er: "Es ist 11 Uhr 35"
- Ich: "Computer? Bitte lies mir die aktuellen Nachrichten vor" Er: (geht auf Google News und liest mir die Headlines vor)

Durch die Ansteuerung der COM/USB Ports können später natürlich auch beliebige Elektroniken im Haus bzw. in der Wohnung per Sprache geschaltet werden. z.B. "Computer? Licht!" usw. (Vernetzung)

Folgende Programme kommen zur Anwendung:
- txt2pho (Umwandlung von Text in Lautsprache)
- mbrola (freier Sprach-Synthesizer)
- simon (freie Spracherkennung)

Das Ganze soll natürlich ein Open Source Projekt werden, damit es jeder nutzen kann.

Ich finde das sehr spannend. Einige von euch sicher auch. Wer hat Lust mitzumachen?

Benötigte Kenntnisse:
- Linux / Ubuntu / Architektur
- Programmierung (C und Bash)
- KI (Grundlagen)

SEO Analyse und Website-Check mit Seitenreport

gelöschter Benutzer

am 22.11.2009, 12:01 Uhr schrieb

Klingt sehr spannend, bin dabei.
Vor Jahren habe ich mich bereits damit beschäftigt. Creative Labs hatte eine Spracherkennung beim Soundblaster dabei. Mit Logox konnte ich mit Textfiles in umgewandelte Sprache ausgeben.

gelöschter Benutzer

am 22.11.2009, 14:38 Uhr schrieb

seitenreport schrieb:

Ich bin gerade dabei, meinem Linux das Sprechen, "Verstehen" und Reagieren auf Sprachanweisungen beizubringen (ähnlich wie der Computer im Film "Star Trek").

Als Plattform verwende ich Linux (Ubuntu). Der Vorteil von Linux ist, dass alle Programme auf einfachen Konsolebefehlen basieren, durch die ich sie beliebig steuern kann. Zudem habe ich ich die volle Kontrolle über das Betriebssystem und kann es dadurch anweisen, genau das zu tun, was ich möchte.

Die Sprachausgabe von beliebigen Texten und Systemwerten (Uhrzeit etc.) funktioniert bereits, z.B. echo "Hallo $USER" | speakit usw.
Die Qualität ist gut und es sind beliebige Sprecherstimmen und Modulationen möglich (selbst singen).

Nach Fertigstellung soll das Programm folgendes können:
- Ich: "Computer? Wie spät ist es?" Er: "Es ist 11 Uhr 35"
- Ich: "Computer? Bitte lies mir die aktuellen Nachrichten vor" Er: (geht auf Google News und liest mir die Headlines vor)

Durch die Ansteuerung der COM/USB Ports können später natürlich auch beliebige Elektroniken im Haus bzw. in der Wohnung per Sprache geschaltet werden. z.B. "Computer? Licht!" usw. (Vernetzung)

Folgende Programme kommen zur Anwendung:
- txt2pho (Umwandlung von Text in Lautsprache)
- mbrola (freier Sprach-Synthesizer)
- simon (freie Spracherkennung)

Das Ganze soll natürlich ein Open Source Projekt werden, damit es jeder nutzen kann.

Ich finde das sehr spannend. Einige von euch sicher auch. Wer hat Lust mitzumachen?

Benötigte Kenntnisse:
- Linux / Ubuntu / Architektur
- Programmierung (C und Bash)
- KI (Grundlagen)

hmmm warum als name computer gib ihm nen frauennamen ....da ist bekannt das sie nie tun was man will *lach
aber mal im ernst ich versteh garnicht warum dieses segment von den entwicklern so dermassen vernachlässigt wird
hab mal ein programm vor jahren ausprobiert aber das funktionierte vorn und hinten nicht

gelöschter Benutzer

am 22.11.2009, 16:40 Uhr schrieb

adi schrieb:

hmmm warum als name computer gib ihm nen frauennamen ....da ist bekannt das sie nie tun was man will *lach
aber mal im ernst ich versteh garnicht warum dieses segment von den entwicklern so dermassen vernachlässigt wird
hab mal ein programm vor jahren ausprobiert aber das funktionierte vorn und hinten nicht

In jedem guten Film spricht der "gute" Rechner als Frau zu Dir. Wenn es ein "böser" Computer (Rasenmähermann) ist, dann spricht ein Mann.
Seit Jahrhunderten verkörpert die Frau das Gute und der Mann das Böse.
:P

seitenreport

Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)

am 23.11.2009, 22:32 Uhr schrieb seitenreport

Ja nur tut die Frauenstimme aus dem Sprachpaket mit der Zeit in den Ohren weh. :P (etwas schlecht moduliert bzw. sehr quietschig - die Männerstimme dagegen ist gut).

@Heiko: Ich schicke Dir im Laufe der nächsten Tage die derzeitigen Installations- und Programmskripte per E-Mail zu. Eine Uhrzeitansage zur vollen Stunde usw. ist bereits integriert. Als nächstes wäre die Verbindung des Programms mit der Spracherkennung dran (was etwas komplexer wird).

SEO Analyse und Website-Check mit Seitenreport

gelöschter Benutzer

am 23.11.2009, 23:01 Uhr schrieb

seitenreport schrieb:

Ja nur tut die Frauenstimme aus dem Sprachpaket mit der Zeit in den Ohren weh. :P (etwas schlecht moduliert bzw. sehr quietschig - die Männerstimme dagegen ist gut).

@Heiko: Ich schicke Dir im Laufe der nächsten Tage die derzeitigen Installations- und Programmskripte per E-Mail zu. Eine Uhrzeitansage zur vollen Stunde usw. ist bereits integriert. Als nächstes wäre die Verbindung des Programms mit der Spracherkennung dran (was etwas komplexer wird).

Spracherkennung ist auf der einen Seite nicht arg so schwer, doch die verschiedenen Tonlagen sind ein wenig aufmüpfig. Bei meinen Test\'s hatte ich manchmal das Problem, dass sie Fragen und Aussagesätze nicht auseinander halten konnte.

Die Soundsequenzen der Frauenstimme lassen wir uns von einer professionellen Sprecherin integrieren. Nee im Ernst, welche Stimmen hast Du denn? Sind das die der MS-Agent\'s?

seitenreport

Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)

am 24.11.2009, 00:24 Uhr schrieb seitenreport

der_booker schrieb:

Die Soundsequenzen der Frauenstimme lassen wir uns von einer professionellen Sprecherin integrieren. Nee im Ernst, welche Stimmen hast Du denn? Sind das die der MS-Agent\'s?

Hehe hör\' mir auf mit MS. Mit denen wäre ein solches Programm gar nicht machbar 8).

Nein nein, das sind freie Sprachpakete (die man natürlich beliebig modulieren kann etc. - ist halt nur Arbeit).

Das mit der professionellen Sprecherin wird so leider nicht funktionieren, da das Ganze ja synthesiert wird - da könntest Du höchstens in penibler Kleinarbeit die Charakteristika der Stimme etc. herausarbeiten und aus diesen ein neues Sprachpaket basteln. :wink:

Auf einem Windows System hatte ich die neueste Spracherkennungssoftware von Nuance. Die war recht gut und sehr genau. Aber sie lässt sich eben nicht frei anpassen geschweige denn umprogrammieren oder mit einem Sprach-Synthesizer koppeln.

Bei den obigen Linux Programmen ist das alles machbar (wenn es auch sehr komplex ist) - daher (und aus anderen Gründen) ist Linux hier eine sehr gute Wahl.

SEO Analyse und Website-Check mit Seitenreport

gelöschter Benutzer

am 24.11.2009, 09:08 Uhr schrieb

Kein Thema, wie schnell magst Du das denn umgesetzt haben? Kundenprojekt haben bei mir immer Prio 1 und dies hier wäre ein Funny-Projekt.

gelöschter Benutzer

am 13.11.2010, 23:44 Uhr schrieb

Ist das hier noch aktuell? Denn die Idee ist super und es wäre genial, wenn da weiter gemacht werden würde. Wenn ihr da weiter macht, wären ein paar aktuelle Infos ganz nett. Ist ja schon fast ein Jahr her.

gelöschter Benutzer

am 24.11.2015, 16:01 Uhr schrieb

Mich würde auch mal interessieren ob hier noch weiter gemacht wird.
Ich suche selber gerade nach so einem System.
Das Projekt welches ich realiesieren möchte, geht übere mehrere Etapen.
Als fertiges Projekt, sollte das System Personen unterscheiden,
mehrere Soundquellen ansteuern können, dazu gleich mehr, und auch auf
Elektrik zugreifen können wie Licht, Licht 20% etc.
Mit Soundquellen meine ich mehrere Soundkarten, wobei jede Soundkarte
für einem Raum der Wohnung ist so das das System dann auch unterscheiden
kann, in welchem Raum ich mich befinde.
Und das System sollte dann auch auf Sprache reagieren können und antworten
können.
Das ganze System sollte dann auf Linux laufen.

Etape eins wäre jetzt erstmal ein System, was ohne Grafische Oberfläche läuft
und erstmal einfache Dinge tuen kann wie Siri oder besser AIVC.
AIVC kann Dinge suchen und vorlesen, das Wetter anzeigen/ansagen,
und man kann selber Befehle und Antworten eingeben.
Das wäre so der erste Schritt des ganzen.
Weiß jemand ob es da schon was gibt oder zumindest im Ansatz???

MFG

Black Zero

« zurück zu: Projekt-Ideen & gemeinsame Entwicklungen

Forum RSS Feed abonnieren

Das Seitenreport Forum hat aktuell 5272 Themen und 36104 Beiträge.
Insgesamt sind 496 Mitglieder registriert.

Sprechender PC und Sprachsteuerung (Open Source Projekt)

Beitrag verfassen

Thema erstellen

Beitrag erstellen