Современная наука не стоит на месте.
Каждый год разрабатывается и выпускается огромное число мобильных приложений, направленных на облегчение жизни человека.
К счастью, создатели не обходят стороной тех, чье пользование современными технологиями ограничено из-за проблем со здоровьем.
В феврале 2019 года Google анонсировал новую технологию – Live Transcribe, на базе которой было создано два приложения: Live Caption и Live Relay.
Эти приложения устанавливаются на любой смартфон, поддерживающий операционную систему Android 5.0 и более поздние версии.
Для создания и тестирования этой технологии транскрипции голоса в текстовую информацию была задействована большая команда, включающая бывшего советского математика – Дмитрия Канаевского.
Потеряв в детстве слух, он научился читать по губам, получил образование и преуспел в профессии. В настоящее время Дмитрий занимается разработкой продуктов, которые помогают слабослышащим общаться с близкими, коллегами и друзьями.
Live Transcribe – инструмент, который переводит письменную речь в печатный текст. Программа мгновенно распознает речь, выводя ее на экран мобильного устройства, правильно расставляя при этом знаки препинания. Приложение дает понять, если из-за высокого уровня окружающего шума речь неразборчива и «просит» поднести микрофон ближе. Live Transcribe поддерживает более 70 языков и диалектов, однако требует постоянного подключения к интернету.
Live Caption – опция, позволяющая транскрибировать речь из любого приложения (ролики на YouTube, видеочаты, звонки в Skype, звуковые сообщения, видеозаписи, созданные пользователем) в текст. Программа не требует подключения к интернету, работает в фоновом режиме и не оказывает влияния на функционирование других приложений.
Live Relay позволит слабослышащим и глухим людям беспрепятственно общаться по телефону. Приложение распознает речь человека «на том конце провода» и воспроизводит его на экране телефона в виде текстовой информации. Кроме того, для ответа предлагаются быстрые универсальные ответы (например, на вопрос «Ты где?» телефон сможет выслать местоположение из Google Maps), либо предлагается озвучка набранного текста.
Как было сказано в Google блоге, сотрудничая с обществом глухих, команда разрабатывает методы «приобщения» слабослышащих к цифровым медиа-устройствам, делая их более социально адаптированными.
Также разработан проект Google Euphonia для людей с нарушениями речи. Искусственный интеллект «научится» запоминать речевые паттерны и распознавать то, что ранее было совершенно непонятным.
Для создания этой программы, Google сотрудничал с такими некоммерческими организациями, как ALS Therapy Development Institute и ALS Residence Initiative, которые занимаются проблемами людей, страдающих боковым амиотрофическим склерозом (нейродегенеративным заболеванием, нарушающим двигательные функции и речь). Были записаны голоса пациентов, чтобы «научить» смартфоны и компьютеры понимать слова, сказанные людьми с нарушениями речи.