9.8 KiB
Pi Zero 2W + ReSpeaker - OPTIMIERT FÜR 3 KOMMANDOS
Lightweight Keyword Spotting statt vollständiges Sprachmodell
TEIL 1-3: Basis-Installation (wie vorher)
Die Schritte zur OS-Installation, SSH-Verbindung und ReSpeaker-Treiber bleiben identisch:
- Raspberry Pi OS (Bullseye 32-bit) installieren (TEIL 1)
- SSH-Verbindung + raspi-config (TEIL 2)
- seeed-voicecard Treiber installieren (TEIL 3)
Folge dazu der ursprünglichen Anleitung bis einschließlich TEIL 3.
TEIL 1: HARDWARE-VORBEREITUNG UND OS-INSTALLATION
1.1 Hardware-Anforderungen
Du benötigst folgende Komponenten:
- Raspberry Pi Zero 2W (nicht Zero oder Zero W!)
- Seed Studio ReSpeaker Pi Hat v1.2 mit 2 Mikrofonen
- microSD-Karte: mindestens 16GB (Class 10 empfohlen)
- USB-Stromversorgung: 2A Netzteil mit Micro-USB
- SD-Kartenleser zum Flashen auf deinem PC
- Computer mit Internetverbindung
- Optional: HDMI-Monitor, USB-Tastatur/Maus zur Direktverbindung
1.2 Raspberry Pi OS Installation
Schritt 1: Raspberry Pi Imager herunterladen
- Öffne https://www.raspberrypi.com/software/
- Lade Raspberry Pi Imager für dein Betriebssystem herunter
- Installiere die Anwendung
Schritt 2: SD-Karte flashen
- Stecke die microSD-Karte in deinen Kartenleser und verbinde ihn mit dem PC
- Öffne Raspberry Pi Imager
- Klicke auf "Gerät auswählen" und wähle "Raspberry Pi Zero 2"
- Klicke auf "Betriebssystem auswählen" und wähle:
- Raspberry Pi OS (Legacy, 32-Bit) - Bullseye
- Hinweis: v1.2 des ReSpeaker-Hats ist am besten mit Bullseye kompatibel
- Klicke auf "Speicher auswählen" und wähle deine microSD-Karte
- Klicke auf das Zahnrad-Symbol (Erweiterte Optionen) und konfiguriere:
- Hostname:
respeaker-pi(oder ein beliebiger Name) - SSH aktivieren: Ja (mit Passwort)
- Benutzername:
pi - Passwort: Ein sicheres Passwort deiner Wahl (aufschreiben!)
- WLAN konfigurieren:
- SSID: Dein WiFi-Netzwerk
- Passwort: Dein WiFi-Passwort
- Land:
DE(Deutschland)
- Zeitzone:
Europe/Berlin
- Hostname:
- Klicke "Speichern" und dann "Schreiben"
- Warte bis zum Abschluss (5-10 Minuten)
- Entnehme die SD-Karte
Schritt 3: Erster Start
- Stecke die SD-Karte in den Pi Zero 2W ein
- Verbinde den ReSpeaker Hat mit dem Pi:
- Ausrichten der GPIO-Pins (40-polige Reihe)
- ReSpeaker sollte fest aufgesetzt sein
- Verbinde die USB-Stromversorgung
- Warte 1-2 Minuten für den ersten Start
Schritt 4: IP-Adresse ermitteln
Methode A (über Router):
- Öffne die Verwaltungsoberfläche deines WLAN-Routers
- Suche nach verbundenen Geräten
- Notiere die IP-Adresse von
respeaker-pi
Methode B (mit arp-scan auf Linux/Mac):
sudo arp-scan -l | grep -i "raspberry\|b8:27"
Methode C (mit Advanced IP Scanner auf Windows):
- Lade Advanced IP Scanner herunter
- Scanne dein Netzwerk
- Suche nach
respeaker-pi
Beispiel-IP: 192.168.1.100
TEIL 2: RASPBERRY PI KONFIGURATION
2.1 SSH-Verbindung herstellen
Auf Linux/Mac (Terminal):
ssh pi@192.168.1.100
# Gib dein Passwort ein
Auf Windows: Nutze PuTTY
- Lade PuTTY herunter
- Öffne PuTTY
- Host:
192.168.1.100 - Port:
22 - Klicke "Open"
- Login:
pi - Passwort: (dein gesetztes Passwort)
2.2 System aktualisieren
sudo apt update
sudo apt upgrade -y
sudo apt install -y git python3-pip python3-dev libatlas-base-dev
Dieser Prozess dauert 10-15 Minuten. Warte ab.
2.3 Audio- und I2C-Konfiguration
sudo raspi-config
Navigiere zu:
- Schnittstellen → I2C → Aktivieren
- Schnittstellen → SPI → Aktivieren
- Lokalisierungsoptionen → Zeitzone → Europa → Berlin
- Lokalisierungsoptionen → Sprache → de_DE.UTF-8
- Bestätige alle Änderungen und Starten Sie neu.
Nach dem Reboot erneut verbinden:
ssh pi@192.168.1.100
TEIL 3: RESPEAKER HAT INSTALLATION
3.1 seeed-voicecard Treiber installieren
Der ReSpeaker benötigt die speziellen Seeed-Treiber. Diese können aus dem Rhasspy-Repo gezogen werden oder als install-respeaker-drivers.sh dieses Verzeichnisses genutzt werden.
cd ~
wget 'https://raw.githubusercontent.com/rhasspy/wyoming-satellite/refs/heads/master/etc/install-respeaker-drivers.sh'
sudo chmod 755 install-respeaker-drivers.sh
sudo ./install-respeaker-drivers.sh
Dies dauert 5-10 Minuten. Wenn es fertig ist:
sudo reboot now
Nach dem Reboot wieder verbinden:
ssh pi@192.168.1.100
3.2 ReSpeaker-Installation verifizieren
Überprüfe, ob die Sound-Karte erkannt wurde:
aplay -l
Du solltest folgende Ausgabe sehen:
**** PLAYBACK hardware devices ****
card 0: ALSA [bcm2835 ALSA], device 0: bcm2835 ALSA [bcm2835 ALSA]
card 1: seeed2miccard [seeed-2mic-voicecard], device 0: ...
Überprüfe auch die Aufnahmegeräte:
arecord -l
Du solltest auch hier seeed-2mic-voicecard sehen.
3.3 Ton-Tests
Lautsprecher testen:
speaker-test -l 1 -c 2 -t sine -f 1000 -r 48000
Du solltest einen Ton hören (drücke Ctrl+C zum Beenden).
Mikrofon testen:
arecord -D hw:1,0 -f S16_LE -c 2 -r 48000 test_recording.wav
Sprich kurz ins Mikrofon und stoppe mit Ctrl+C. Dann abspielen:
aplay -D hw:1,0 test_recording.wav
installieren mit
pip3 install vosk --break-system-packages
mkdir ~/vosk-models cd ~/vosk-models wget https://alphacephei.com/vosk/models/vosk-model-small-de-0.15.zip unzip vosk-model-small-de-0.15.zip mv vosk-model-small-de-0.15 model
aufnehmen mit
arecord -D plughw:1,0 --format S16_LE --rate 16000 --channels 1 --duration 5 test_mono.wav
ausfuehren mit
python3 test_simple.py test_mono.wav
test_simple.py
#!/usr/bin/env python3
import wave
import sys
from vosk import Model, KaldiRecognizer, SetLogLevel
# You can set log level to -1 to disable debug messages
SetLogLevel(0)
wf = wave.open(sys.argv[1], "rb")
if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getcomptype() != "NONE":
print("Audio file must be WAV format mono PCM.")
sys.exit(1)
model = Model("model") #lang="en-us")
# You can also init model by name or with a folder path
# model = Model(model_name="vosk-model-en-us-0.21")
# model = Model("models/en")
rec = KaldiRecognizer(model, wf.getframerate())
rec.SetWords(True)
rec.SetPartialWords(True)
while True:
data = wf.readframes(4000)
if len(data) == 0:
break
if rec.AcceptWaveform(data):
print(rec.Result())
else:
print(rec.PartialResult())
print(rec.FinalResult())
microphone.py
#!/usr/bin/env python3
# prerequisites: as described in https://alphacephei.com/vosk/install and also python module `sounddevice` (simply run command `pip install sounddevice`)
# Example usage using Dutch (nl) recognition model: `python test_microphone.py -m nl`
# For more help run: `python test_microphone.py -h`
import argparse
import queue
import sys
import sounddevice as sd
from vosk import Model, KaldiRecognizer
q = queue.Queue()
def int_or_str(text):
"""Helper function for argument parsing."""
try:
return int(text)
except ValueError:
return text
def callback(indata, frames, time, status):
"""This is called (from a separate thread) for each audio block."""
if status:
print(status, file=sys.stderr)
q.put(bytes(indata))
parser = argparse.ArgumentParser(add_help=False)
parser.add_argument(
"-l", "--list-devices", action="store_true",
help="show list of audio devices and exit")
args, remaining = parser.parse_known_args()
if args.list_devices:
print(sd.query_devices())
parser.exit(0)
parser = argparse.ArgumentParser(
description=__doc__,
formatter_class=argparse.RawDescriptionHelpFormatter,
parents=[parser])
parser.add_argument(
"-f", "--filename", type=str, metavar="FILENAME",
help="audio file to store recording to")
parser.add_argument(
"-d", "--device", type=int_or_str,
help="input device (numeric ID or substring)")
parser.add_argument(
"-r", "--samplerate", type=int, help="sampling rate")
parser.add_argument(
"-m", "--model", type=str, help="language model; e.g. en-us, fr, nl; default is en-us")
args = parser.parse_args(remaining)
try:
if args.samplerate is None:
device_info = sd.query_devices(args.device, "input")
# soundfile expects an int, sounddevice provides a float:
args.samplerate = int(device_info["default_samplerate"])
if args.model is None:
model = Model(lang="de") #"en-us")
else:
model = Model(lang=args.model)
if args.filename:
dump_fn = open(args.filename, "wb")
else:
dump_fn = None
with sd.RawInputStream(samplerate=args.samplerate, blocksize = 8000, device=args.device,
dtype="int16", channels=1, callback=callback):
print("#" * 80)
print("Press Ctrl+C to stop the recording")
print("#" * 80)
rec = KaldiRecognizer(model, args.samplerate)
while True:
data = q.get()
if rec.AcceptWaveform(data):
print(rec.Result())
else:
partialPrint = rec.PartialResult()
print(partialPrint)
if "licht" in partialPrint and "an" in partialPrint and "hex" in partialPrint:
print("SCHALTER EIN!")
if "licht" in partialPrint and "aus" in partialPrint and "hex" in partialPrint:
print("SCHALTER AUS!")
if dump_fn is not None:
dump_fn.write(data)
except KeyboardInterrupt:
print("\nDone")
parser.exit(0)
except Exception as e:
parser.exit(type(e).__name__ + ": " + str(e))