5 простых шагов для понимания новой технологии Oticon More™ и ее преимуществ
Компания Oticon выпустила новый слуховой аппарат Oticon More™. Внутри этого слухового аппарата находится глубокая нейросеть (Deep Neural Network), которая поможет вам слышать еще лучше. Но что такое DNN и как она может помочь вам слышать лучше?
Это может звучать сложно, но давайте попробуем объяснить.
Глубокая нейросеть — это тип машинного обучения, который имитирует то, как учится мозг. Она используется для решения различных задач, некоторые из них вам знакомы, например, перевод с иностранного языка или поиск изображений, а о некоторых вы, возможно, не знаете, например, медицинская диагностика. К примеру Калифорнийский университет (UCLA) разработал нейросеть позволяющую обнаруживать раковые клетки! А теперь Oticon использует свою нейросеть для в своем новом слуховом аппарате Oticon More.
Общая идея нейросети заключается в том, что она обучается путем повторения действий на основе анализа коллекции образцов, например, 1000 фотографий различных собак, в отличие от набора искусственных правил, по принципу «у собаки черный нос и висячие уши». Таким образом, нейросеть учится так же, как и человеческий мозг — через практику и ошибки.
Вот как она работает:
Компьютеру дается часть информации, например изображение или звук. Допустим, ему дан звук трубы. В отличие от нас, компьютер не знает, что это такое.
Компьютер пропускает этот звук через нейросетевую обработку, распознавая то, что может, и сортируя его элементы — например, звук высокого или низкого тона.
По окончании этого процесса он решает, является ли этот звук трубой или нет.
После чего компьютеру необходимо дать обратную связь — правильно он ответил или нет. Эту информацию компьютер использует, чтобы укрепить свое решение.
Этот процесс повторяется снова и снова с большим количеством различных звуков трубы, пока компьютер не научится распознавать их мгновенно. Точно так же, как это делает мозг.
Теперь предположим, что эта нейросеть была обучена на миллионах реальных звуковых сцен: кафе, аэропорт или оживленная улица. Нейросеть научилась бы определять и балансировать каждый звук в ней, чтобы вы могли получить доступ к наиболее важным для вас звукам.
Именно это и сделали в Oticon! Разработчики обучили нейросеть на примере 12 миллионов сложных реальных звуковых сцен, подобных этим, которые она затем научилась анализировать, упорядочивать и балансировать. После того, как она усвоила все эти удивительные знания, она была готова к работе в Oticon More. Теперь этот слуховой аппарат может использовать интеллектуальные возможности нейросети при балансировке и расстановке приоритетов важных для вас звуков, что также поддерживает здоровье вашего мозга.
Нейросеть делает намного больше, чем обычное программное обеспечение с искусственным интеллектом. Это уникальная и специализированная технология внедренная в слуховой аппарата, разработанная для работы в реальном времени в повседневной жизни.
Как разработчики обучали слуховые аппараты на примере 12 миллионов звуковых сцен?
Разработчики вышли из лаборатории в реальный мир с узкоспециализированным сферическим микрофоном, способным записывать пространственный звук, чтобы собрать звуки из реальных ситуаций.
Сферический микрофон состоит из 32 отдельных микрофонов, равномерно распределенных по сфере. Выходные данные с каждого микрофона объединяются с помощью передовой обработки сигнала для детального и точного захвата конкретной звуковой сцены.
Это служит основой для того, как Oticon More может обрабатывать полную звуковую сцену с непревзойденной точностью и ясностью.
Преимущества слухового аппарата с глубокой нейросетью
До сих пор системы обработки звука разрабатывались с использованием теоретических моделей и созданных человеком гипотез о том, как лучше воспроизводить речь и уменьшить фоновый шум.
Представьте, что вы находитесь в ресторане с друзьями или семьей. Человек, сидящий перед вами, разговаривает, когда вы собираетесь уходить. Поскольку традиционный слуховой аппарат обучен фокусироваться на речи спереди и заглушать все остальные шумы — особенно в громкой обстановке — вы можете не услышать официанта, стоящего позади вас с подносом, полным стаканов.
Благодаря нейросети ваш мозг имеет доступ к полной звуковой картине вокруг, поэтому вы можете услышать человека рядом с вами, стук столовых приборов о тарелку за соседним столом и официанта, стоящего позади вас — все это сбалансировано и усилено в реальности.
Это происходит потому, что нейросеть обеспечивает ваш мозг более значимой звуковой информацией, что делает звук гораздо более четким, а речь — более понятной. Фактически, исследования показывают, что полная звуковая сцена звучит на 60% четче при использовании нейросети в Oticon More.