GSM modul (2. díl – hlasové volání)

GSM modul (2. díl – hlasové volání)

How Can We Help?

Categories

GSM modul (2. díl – hlasové volání)

You are here:
< Zpět

Toto je druhá část návodu na GSM modul postavený na Raspberry Pi a komunikující s Loxonem přes UDP. První část najdete zde:

GSM modul (1. díl – integrace do Loxone přes UDP)

Co Loxone naučíme v tomto druhém dílu

 • mluvit do telefonu (přes text-to-speech)
 • vlastně získáme  plnohodnotnou alternativu ke službě “Loxone Caller”
 • naučíme Loxone navíc i zvednout příchozí hovor a mluvit do telefonu

Co to neumí

 • poslouchat v telefonu (speech-to-text)
 • přemýšlet

Pokud byste chtěli něco, co vás umí poslouchat a reagovat na vaše požadavky, pořiďte si Siri, Alexu, Google Home nebo nějakého jiného robota s AI. Na integraci těchto robotů do Node Red a do Loxonu už taky nějaké nástroje existují.

Jaký hardware budete potřebovat

Viz minulý díl.

Jaký software budete potřebovat

Node Red

Někteří už tak jako tak máte Node Red nainstalovaný. Ostatní si dovolím odkázat na existující návody:

Ffmpeg a Mp3wrap

Mp3 wrap budeme potřebovat na slepování MP3 souborů s hlasovou zprávou, které Node Red stahuje z Googlu. Ffmpeg je potřeba na samotné přehrání MP3 souboru se zprávou do GSM modulu.

sudo apt-get install ffmpeg mp3wrap

Stačí nainstalovat, není potřeba nic nastavovat, o vše se postará Node Red.

Nody

Až budete mít nainstalovaný Node Red, spusťte si jej v prohlížeči  ( <IP_adresa>:1880 ) a přes Manage Palette (menu vpravo nahoře) si doinstalujte tyto nody:

 • node-red-contrib-function-npm
 • node-red-contrib-string
 • node-red-contrib-traffic
 • node-red-contrib-fs-ops
 • node-red-contrib-google-tts
 • node-red-contrib-loop-processing
 • node-red-contrib-md5

Flow

Až budete mít doinstalované Nody, vložte si do Node Red tento flow, ve kterém je celý program na řízení GSM modulu:



Flow vložíte jednoduše klávesovou zkratkou Ctrl-I.

Disclaimer: Neumím programovat. Proto na parsování používám všechny ty string nody. Určitě by na to šla použít nějaká funkce, ale nechtělo se mi to učit.

Nastavení nodů

Modem stardardně vytvoří 3 sériové porty (ttyUSB0, ttyUSB1, ttyUSB2). My budeme používat druhý port (ttyUSB1) na audio při hovoru a třetí port (ttyUSB2) na přijímání a odesílání AT příkazů a přijímání SMS. Oba porty se nastavují na začátku. Pozor, ttyUSB2 se nastavuje uvnitř subflow, klikněte na node ttyUSB2 a ještě na “edit flow template” a pak ještě jednou na node ttyUSB2.

Každý port má jiné nastavení komunikace. Je nutné to nastavit správně, jinak audio (ttyUSB1) a odesílání příkazů (ttyUSB2) nebudou fungovat správně.

ttyUSB1 (audio):

ttyUSB2 (příkazy):

 

Sériový port ttyUSB2 (příkazy) můžete otestovat odesláním příkazu AT (viz modrý inject node). V podokně debugu (ikona brouka vpravo nahoře) pak sledujte, jestli jste na příkaz dostali nějakou odpověď. Pokud uvidíte “0”, trefili jste správný port. Technická poznámka: v modemu je zapnutý “limited response format”, proto neuvidíte klasickou odpověď “OK”, ale jenom její číselnou alternativu “0”.

Sériový port ttyUSB1 (audio) si otestujete až při samotném hovoru. Po aktivaci zeleného debug nodu (musíte si ho zapnout) byste při hovoru (vlastně i při samotném vytáčení) měli vidět přehršel čísel (to je samotný zvuk v bufferu).

Dále si musíte nastavit UDP nody. V prvním nodu udp-in si nastavíte místní port, na kterém bude poslouchat Node Red. Mám nastavené, aby Node Red poslouchal na portu 10007. Můžete si to změnit, ale poznamenejte si to.

V druhém nodu udp-out si nastavíte vzdálenou IP adresu Loxonu a vzdálený port, na kterém bude Loxone poslouchat. Mám to nastavené tak, aby Loxone poslouchal na portu 10007. Můžete si to klidně změnit, ale poznamenejte si to, budete to potřebovat při nastavování Loxonu.

Oba UDP nody mám nastavené tak, že Loxone i Node Red poslouchají na stejných portech, ale to samozřejmě není nutné, můžete si vybrat porty odlišné.

Jako poslední si nastavíme globální proměnné. MP3 soubory s audiem se ukládají na úložiště v Raspberry (do domovské složky). V případě potřeby si můžete jméno adresáře upravit (standardně audiocache) a můžete si nastavit maximální velikost této cache (standardně 10MB). Dále si v případě potřeby můžete změnit jazyk převodu TTS a mezinárodní předvolbu pro příchozí a odchozí hovory.

Co ten flow v Node Redu dělá

Flow nejdřív udělá prvotní nastavení modemu. Potom se stará o překlad AT příkazů, kterými se ovládá modem, do podoby user friendly UDP příkazů, kterými komunikuje s Loxonem (tyto UDP příkazy si popíšeme níže). Pro nastavení a provoz GSM modulu vůbec nepotřebujete znát samotné AT příkazy. Pokud byste si chtěli hrát nebo něco testovat, nechal jsem vám úplně dole i nějaké samostatné AT příkazy (viz “useful commands”).

Celý flow je udělaný tak, abyste ho jednou nastavili a potom už na něho nemuseli sahat. Všechno ostatní se bude dělat v Loxonu:

 • Konfigurace autorizovaných telefonních čísel
 • Nastavení příchozích SMS příkazů
 • Obsah odchozích SMS zpráv
 • Obsah odchozích hlasových zpráv
 • Veškerá logika co a jak se bude ovládat atd.

Jediné, co je potřeba v Node Redu hlídat:

 1. Pokud k Raspberry Pi připojíte další USB zařízení, tak se vám pravděpodobně změní sériové porty a budete muset překonfigurovat nody serial-in a serial-out.
 2. Na převod text-to-speech se používá Google. Nepoužíváme ale standardní Google API (to je placené), ale pro převod na řeč využíváme (zneužíváme) webové služby translate.google.com (na tom je postavený node-red-contrib-google-tts). Je to neoficiální oklika, která může přestat fungovat. Původně jsem hledal offline řešení, ale jediné offline řešení pro Linux jsem našel program “festival”. Výsledky byly katastrofální. Tak jsem na TTS zkoušel různá cloudová API. Těm buď chyběla čeština (Amazon, IBM Watson) nebo byla placená (Microsoft a další). Nakonec jsme jako jediné použitelné a neplacené řešení našel Google.

Nastavení v Loxone Config

První sadu příkazů jsem popsal v prvním dílu (https://www.vodnici.net/wiki/gsm-modul-integrace-do-loxone-pres-udp/). Všechny příákazy z prvního dílu (vč. callout) zůstávají funkční. V tomto dílu představím příkazy týkající se hlasového volání.

Node Red z Loxonu přijímá tyto UDP příkazy:

 • gsm voice <volané číslo> <text hlasové zprávy>
 • gsm voice test

Node Red do Loxonu posílá tyto UDP příkazy:

 • gsm voice error
 • gsm voice cachefull

Výstupy z Loxonu

gsm voice <volané číslo> <text hlasové zprávy>

Hlasové volání na uvedené číslo (číslo bez mezinárodní předvolby). Číslo příjemce musí být odděleno z obou stran mezerami. Samotný text hlasové zprávy může obsahovat mezery. Můžete a měli byste používat interpunkci, aby hlasu bylo rozumět. Délka hlasové zprávy není omezena (teoretický limit je 200*999 znaků, místo na disku pro výslednou MP3 s hlasem zprávy a 10 minutový limit pro délku hovoru).

Node Red vytočí volané číslo a pokud to volaný zvedne, tak mu přečte text zprávy. Pokud to típnete (třeba jste zrovna někde na jednání) nebo pokud to nezvednete (timeout pro vyzvánění je stanovený na 1 minutu), tak se nic neděje, Node Red vám pošle text zprávy SMSkou. Z textu původní hlasové zprávy se odstraní interpunkce, zpráva se rozdělí na úseky dlouhé 160 znaků a SMSka (SMSky) se odešle na volané číslo.

Před samotným vytáčením hovoru ještě Node Red kontroluje, jestli mu náhodou to stejné číslo zrovna nevolá v příchozím hovoru. Pokud tam ten příchozí hovor je, tak ho rovnou zvedne a přečte text zprávy (k čemu to je dobré uvidíte níže).

Pro úplnost dodám, že Node Red opakuje hlasovou zprávu ve smyčce, maximální délka hovoru je pro jistotu omezena na 10 minut.

Příklad syntaxe:

gsm voice 123456789 Tvůj barák hoří, zavolej si hasiče!

Na odeslání hlasové zprávy využijeme UDP logger, který jsme si vytvořili pro potřeby odesílání SMS v minulém díle. Vytváření a odesílání hlasového volání je úplně stejné jako vytváření a odesílání SMS (viz příkaz gsm sms <číslo> <zpráva> v prvním díle). Využíváme blok Status napojený na UDP logger, jediný rozdíl je v tom, že v syntaxi příkazu je “voice” místo “sms”. Odchozí hlasové zprávy můžete používat například na alarmy, kdy chcete, aby vám Loxone sám zavolal a řekl vám, co se děje.

Následující příklad je trochu složitější, ukážeme si jak zkombinovat příchozí hovor do Loxonu s hlasovou zprávou z Loxonu:

Takže co tu máme. CALLIN příchozí hovor do Loxonu, dvě autorizovaná čísla. CALLIN funguje jako “virtuální tlačítko”, které pošle impuls při každém zazvonění telefonu. Viz předchozí díl.

Blok Vícenásobný stisk znamená, že pokud telefon típnu po prvním nebo po druhém nebo po třetím zvonění, tak se mi rozsvítí světlo na chodbě (otevře se brána nebo co je vám libo). Pokud ale hovor do Loxonu netípnu, tak se aktivuje blok Status. Blok status do Node Redu odešle požadavek na hlasovou zprávu pro telefonní číslo, které zrovna Loxonu volá. Node Red zjistí, že se obě čísla shodují a ten příchozí hovor rovnou zvedne a přečte vám text hlasové zprávy. Toto řešení můžete používat na rychlé zjištění stavu nějakého čidla nebo celkového stavu domu. Výhoda je jasná: voláte vy, platíte vy a šetříte kredit na SIMkartě v Loxonu. Takže si v tomto případě můžete dovolit dlouhé hlasové zprávy.

Status blok “VOICE stav topení” je napojený na UDP logger a stará se o samotné odeslání hlasové zprávy. Na vstupy můžete přivést digitální signál (vstup AI2 se stavem topení), analogový signál (AI1 obsahující číslo, na které se má zavolat) i textová data (na vstup AI3 je přiveden textový výstup statusu “Teplota ZZ”). Na vstup AI4 je přiveden spouštěč. Nastavení bloku VOICE stav topení:

a samozřejme napojení na UDP logger. Můžeme využít ten, co jsme si vytvořili pro potřeby odesílání SMS:

 

Nastavení bloku Status “Teplota ZZ” je jednoduché. Tento blok není napojený na UDP logger, není na něj přivedený žádný spouštěč. Zrušte jeho zobrazení ve vizualizaci a jako text můžete dát třeba toto. Nebojte se desetinných čísel, Google TTS je zvládá s přehledem.

Ten druhý blok Status jsem tam dal jenom jako ukázku řetězení. Můžete si takto poskládat opravdu dlouhou zprávu obsahující všechny důležité stavy a čidla v domě.

gsm voice test

Jednoduchý příkaz, který otestuje dostupnost služby Google TTS (důvody proč je dobré ji testovat jsem uvedl výše). Pokud je možné stáhnout z Googlu přehratelnou MP3, nic se nestane. Pokud dojde k chybě, pošle vám Node Red UDP zprávu “gsm voice error”.

V Loxone Config si vytvořte Virtuální výstup příkazu, kde si nastavíte

Instrukce při zapnutí

gsm voice test

 

Vstupy do Loxonu

Opět standardně použijeme Virtuální UDP vstupy. Asi bych zase doporučil ty čachry s validací, abychom dostali “digitální impuls” (viz předchozí díl).

gsm voice error

Může znamenat buď:

 • chybu při převodu textu na řeč Google TTS (nedostupný internet, zablokovaný Google, nepřehratelná mptrojka…)
 • chybu při přehrávání MP3 souboru do telefonu přes ffmpeg

V každém případě je na volané číslo text původní hlasové zprávy v SMSce.

gsm voice cachefull

Cache pro audio soubory dosáhla limitu, který jste si nastavili na začátku. Pár slov k tomu, proč tam ta cache je a jak funguje. Cache je tam jako pojistka proti nedostupnosti internetu a Google TTS. Při prvním požadavku na převod TTS se odešle požadavek na Google, odkud se pak stáhne výsledná MP3 s hlasem. Pokud budete později potřebovat hlasovou zprávu  se zcela identickým obsahem, tak se žádný požadavek na Google neposílá, ale vezme se MP3 soubor z cache. Doporučuju proto, aby důležité zprávy alarmu neobsahovaly žádné dynamické proměnné (“Tvůj barák hoří, zavolej si hasiče!”). Poté, co si je nastavíte v Loxonu, tak si je na zkoušku aktivujte, aby se hlas zprávy uložil do cache. Pak budete mít jistotu, že se hlasové volání v budoucnu realizuje i když nepůjde internet nebo nebude fungovat Google TTS. Zprávy s dynamickými proměnnými (“Teplota v zimní zahradě je <v1.1> stupňů Celsia.”) se budou při každé změně proměnné stahovat znova. Takže pokud budete často používat různé hlasové zprávy s dynamickými proměnnými, budete potřebovat větší cache. Pro úplnost dodávám, že Google posílá hlas ve MP3, mono, 32 kBit/s. Takže těch 10MB cache by mělo vystačit na cca 42 minut hlasových zpráv.

Co se stane, když cache dosáhne limitu? Jednak se odešle UDP zpráva (gsm voice cachefull), zároveň se smaže aktuální hlasová zpráva, která překročení limitu zavinila. Samozřejmě až poté, co byla přehrána do telefonu. Staré zprávy (to jsou ty důležité, které jste si převedli do audia jako první) se nemažou.

Pomohl Vám náš blog? Chcete nás podpořit? I málo udělá radost 😉
Become a patron at Patreon!
Table of Contents

3 thoughts on “GSM modul (2. díl – hlasové volání)

 1. Ahoj,
  povedlo se mi zprovoznit modem HUAWEI E1750 v noderedu po pár problémech, kdy se modem nechtěl přepnout do režimu modemu (zůstával v režimu CD ROM a čtečce karet) a pak nebyl modem přístupný z noderedu, protože mám nodered spuštěný v dockeru, ale to se mi nakonec taky povedlo vyřešit (nastavit oprávnění a vypnout modemmanager).
  Teď jsem se zasekl na samotném flow v node redu, kdy jsem nepochopil co která věc dělá. Nepotřebuji TTS, stačí mi příjem a odesílání SMS a ovládání prozvoněním.
  Ale když zkusím na SIM v modemu zavolat, tak se v telefonu hned ozve obsazovací tón, v debugu v noderedu něco proběhne, ale nic smysluplného. Není k dispozici nějaká dokumentace, abych si to mohl nastavit podle sebe ?

 2. Tak jsem to zprovoznil. Musel jsem vypnout úplně modemmanager, nestačilo ho vypnout jen po startu rpi u modemu, protože jinak blokoval používání modemu v node redu.
  Taky jsem musel odblokovat na modemu voice funkci přes DC UNLOCKER a teď už se na SIM dá dovolat a v debugu vidím tel. číslo.

 3. Díky za feedback.
  Já sám už GSM modul nepoužívám. Jsem rád, že ten návod ještě k něčemu je a že se to podařilo rozchodit!

Leave a Reply

Your email address will not be published. Required fields are marked *