Дослідники розробили інтерфейс беззвучного розпізнавання мовлення, який використовує акустичні датчики та штучний інтелект для безперервного розпізнавання до 31 команди без голосу на основі рухів губ і рота. Інтерфейс EchoSpeech з низьким енергоспоживанням, який можна носити, потребує лише кількох хвилин навчання користувача, перш ніж він розпізнає команди та зможе працювати на смартфоні.
Окуляри EchoSpeech, оснащені парою мікрофонів і динаміків, менших за гумки для олівців, перетворюються на сонарну систему з штучним інтелектом , яка надсилає й приймає звукові хвилі на обличчя та відчуває рухи рота. Потім алгоритм глибокого навчання аналізує ці ехо-профілі в реальному часі з точністю близько 95 % .
Технологія акустичного сприйняття, як-от EchoSpeech, усуває потребу в переносних відеокамерах. А оскільки аудідані набагато менші, ніж зображення чи відеодані, для їх обробки потрібна менша пропускна здатність і їх можна передавати на смартфон через Bluetooth у режимі реального часу.