INTELLIGENT SOUND DETECTION

Artificial-Audio-Intelligence-Smart-Home

Intelligent Sound Detection

Una panoramica sui suoni delle nostre case e quali sarebbe meglio ascoltare

Se accendessimo dei registratori dentro le nostre case quando siamo via, rimarremmo sorpresi di quanti suoni queste “emettono” quotidianamente. Dalla centrifuga della lavatrice, al vociare della vicina, ai suoni prodotti dai nostri mobili quando, con il cambio di temperatura, si dilatano o si restringono i loro materiali.

Alcuni di questi suoni sono più importanti perché possono indicare un pericolo per la sicurezza dei nostri cari e quella della nostra casa: l’allarme anti incendio, la rottura di un vetro, il pianto di un bambino, il cane che abbaia per la presenza di uno sconosciuto.

Sono suoni che presentano una caratteristica comune, indicano che “qualcosa” non va e la loro natura è quella di avvisare. Il suono diventa un invito all’azione immediato, per evitare di dover poi correre ai ripari. Poter agire nell’immediato appena il suono si verifica è un’azione che può fare la differenza.

Casa Intelligente

Come riconoscere e agire prontamente alle emergenze domestiche

La finalità delle tecnologie utilizzate nella Smart Home è quella di sostituirsi all’uomo nell’intervenire prontamente, nel modo più semplice e veloce, quando questo non è in casa o non è nelle condizioni di poter agire, o anche al fine di automatizzare azioni ripetitive relativamente al comfort o al risparmio energetico, mirando ad uno status utente “senza pensieri”.

Quando si verificano allarmi o suoni riconducibili ad eventi specifici, le case intelligenti riescono a “sentirli”. I software A.I. rilevano i suoni nel momento in cui vengono prodotti (“so che c’è un suono”) e grazie agli algoritmi di riconoscimento identificano cosa si sta rilevando (“so che suono è”).

Un sistema di rilevamento suoni intelligente sa rilevare un suono e sa riconoscere cos’è

Familiari alle tecnologie domestiche che avvisano in tempo reale sono da sempre le mamme e chi ha in casa un animale domestico. Le prime, con i baby monitor, controllano a distanza la nanna dei piccoli, mentre i secondi, attraverso telecamere interne, verificano che il cucciolo sta bene, non ha già combinato guai o sta abbaiando energicamente per segnalare una presenza sconosciuta.

Se poi la casa intelligente è anche una casa connessa, la presenza di un suono può generare particolari azioni scelte dall’utente: dalla ricezione di una notifica sullo smartphone, all’accensione delle luci del corridoio mentre ci si sveglia per avviarsi a consolare il bambino che piange nella cameretta, alla ricezione di un suono classificato come “intrusione” a cui segue l’avvio di una chiamata o di uno streaming sul cellulare.

Artificial Audio Intelligence

Le orecchie della nostra casa

Grazie alla visione artificiale, l’Intelligenza Artificiale oggi è migliore dell’essere umano nel riconoscere oggetti o facce. Anche il riconoscimento vocale – come quello di Google Home o Amazon Alexa – è sempre più una funzione base dei numerosi assistenti di una Smart Home. A guadagnare sempre più attenzione, è però il riconoscimento dei suoni e l’Intelligenza – Audio Artificiale, meglio nota in lingua inglese “Artificial Audio Intelligence”, funzione di apprendimento estremamente utile per la sicurezza della casa e dei suoi abitanti.
Le prime ricerche di acustica risalenti a Pitagora si arricchiscono nel corso dei secoli dei problemi della registrazione e della riproduzione dei suoni che l’invenzione del fonografo e del microfono portano nel 1877, periodo in cui furono poste anche le basi dell’acustica architettonica come scienza moderna.
Il suono è un fenomeno basato sulle sensazioni e il verbo “suonare” è capace di suscitare notevoli ricordi e sensazioni. Le voci umane non sono da meno: quella della mamma o il canto di una ninna nanna, riesce calmare il bambino nella culla anche attraverso un baby monitor; i decadentisti sostenevano che la musica potesse provocare veri stati di estasi.
La start up di Cambridge Audio Analytics, che studia un sistema di apprendimento automatico per l’Intelligenza Artificiale al fine di riconoscere i suoni, ha registrato la maggior parte dei possibili “bau” in un centro veterinario, collaborato con gruppi di neo genitori per registrare il pianto dei loro differenti neonati, acquistato delle finestre a vetri e … le ha rotte servendosi di vari oggetti (mattoni, utensili da giardinaggio), simulando un’intrusione.
L’A.I. deve saper distinguere da un vetro rotto un bicchiere che cade, un allarme vero da quello imitato dal pappagallo, un allarme incendio dal beep della cena pronta nel microonde e anche rilevamenti anomali: una persona che cade, gli allarmi delle automobili, uno sparo. Si lavora anche sulle grida, non comuni, ma violente: la lingua parlata non è determinante, lo sono più i tassi di adrenalina nella voce. Ma occorre distinguerlo dallo starnazzare delle galline nel cortile del vicino.

Nella testa di Momo

– Marco San Biagio, A.I. Engineer in Morpheos 

Il rilevamento del suono avviene attraverso i vari microfoni installati nella “testa” di Momo che svolgono una doppia funzione: “catturare” e identificare l’origine del suono.

Nella fase attuale, stiamo eseguendo dei test, per verificare che il rilevamento dei suoni tramite Momo funzioni correttamente. raccogliendo e classificando i suoni per il nostro database.

Momo Sound Detection System Architecture

L’architettura del sistema del rilevamento del suono è costituita da due parti fondamentali: una prima fase avviene offline mentre la seconda avviene online, quando un nuovo suono è stato rilevato.

Prima Fase: Training

  • – Database. Contiene gli esempi sui quali è stato addestrato il sistema.
  • – Estrazione Features. Una feature è una proprietà di interesse che può aiutarci nell’indicizzazione di un oggetto. Le features di interesse variano in base alla natura e agli scopi del sistema che ne fa uso. In questa fase, tramite algoritmi specifici, si tenta di ricavare le caratteristiche costitutive di un dato audio al fine di fornire un consistente set di features su cui il processo di classificazione può lavorare. Le features sono estratte da tutti gli oggetti presenti nel database e conservate in un “feature database”.
  • – Modello: insieme di istruzioni e parametri necessari al sistema per operare.

Seconda Fase: Test

La Sorgente: Suono

Il Sensore: Microfono

Il Rilevamento: Gli eventi – Audio

Il Processo d’analisi e Classificazione: il processo di Intelligenza Artificiale che attua:

  • – l’estrazione feature
  • – classificazione in categorie specifiche degli eventi audio rilevati
  • – valutazione degli eventi audio

Vai al progetto Momo – The Home Genius di Morpheos

Fonti: Treccani.it | AudioAnalytic.com | bcc.com