Закрити

Окуляри зі штучним інтелектом розпізнають слова за рухами губ

Дослідники  розробили інтерфейс беззвучного розпізнавання мовлення, який використовує акустичні датчики та штучний інтелект для безперервного розпізнавання до 31 команди без голосу на основі рухів губ і рота. Інтерфейс EchoSpeech з низьким енергоспоживанням, який можна носити, потребує лише кількох хвилин навчання користувача, перш ніж він розпізнає команди та зможе працювати на смартфоні.

Окуляри EchoSpeech, оснащені парою мікрофонів і динаміків, менших за гумки для олівців, перетворюються на сонарну систему з штучним інтелектом , яка надсилає й приймає звукові хвилі на обличчя та відчуває рухи рота. Потім алгоритм глибокого навчання аналізує ці ехо-профілі в реальному часі з точністю близько 95 % .
Технологія акустичного сприйняття, як-от EchoSpeech, усуває потребу в переносних відеокамерах. А оскільки удідані набагато менші, ніж зображення чи відеодані, для їх обробки потрібна менша пропускна здатність і їх можна передавати на смартфон через Bluetooth у режимі реального часу.

Окуляри зі штучним інтелектом розпізнають слова за рухами губ

 









Наверх

Copyright © 2014-2024  Івано-Франківськ Smart City