Новостиbrain2

Открыт новый механизм в процессах распознания человеческой речи

Во многих домах невозможно представить жизнь без языковых помощников – они включают или выключают устройства, сообщают о новостях со всего мира или знают, какая погода будет завтра. Распознавание речи в этих системах в основном основано на машинном обучении, ветви искусственного интеллекта. Машина генерирует свои знания из повторяющихся шаблонов данных. В последние годы использование искусственных нейронных сетей значительно улучшило компьютерное распознавание речи.

Для нейробиолога профессора Катарины фон Кригштейн из TU Dresden, однако, человеческий мозг остается «самой замечательной машиной для обработки речи». «Он работает намного лучше, чем компьютерная обработка речи, и, вероятно, будет продолжать это делать еще долго, – комментирует профессор фон Кригштейн, – потому что точные процессы обработки речи в мозге все еще в значительной степени неизвестны ».

В недавнем исследовании нейробиолог из Дрездена и ее команда обнаружили еще один элемент в обработки человеческой речи. В исследовании приняли участие 33 добровольца, их анализировали с использованием функциональной магнитно-резонансной томографии (МРТ). Испытуемые получали речевые сигналы от разных докладчиков. Им было предложено выполнить речевое задание или контрольное задание для распознавания голоса в случайном порядке. Команда ученых записала активность мозга испытуемых во время эксперимента с использованием МРТ. Оценка записей показала, что структура в левом слуховом проходе – вентральное медиальное коленчатое тело (vMGB) – обладает особенно высокой активностью, когда испытуемые выполняют речевое задание (в отличие от контрольного задания).

mgb speech recognition neurosciencnerws | Radiology24

Визуализация медиального коленчатого тела (MGB) в головном мозге испытуемых людей. MGB является частью слухового пути. Он организован таким образом, что определенные разделы представляют определенные звуковые частоты.

Ранее предполагалось, что вся слуховая информация в равной степени передается по слуховым путям от уха к коре головного мозга. Текущие записи повышенной активности vMGB показывают, что обработка слуховой информации начинается до того, как слуховые пути достигают коры головного мозга. Катарина фон Кригштейн объясняет результаты следующим образом: «В течение некоторого времени у нас появились первые признаки того, что слуховые пути более специализированы в речи, чем предполагалось ранее. Это исследование показывает, что это действительно так: часть vMGB, которая транспортирует информацию из уха в кору головного мозга, обрабатывает слуховую информацию по-разному, когда речь должна быть распознана, по сравнению с тем, когда должны распознаваться другие компоненты сигналов связи, такие как голос говорящего, например.

Распознавание слуховой речи имеет чрезвычайно важное значение для межличностного общения. Понимание основных нейронных процессов будет иметь важное значение не только для дальнейшего развития компьютерного распознавания речи.

Эти новые результаты могут также иметь отношение к некоторым симптомам дислексии развития. Известно, что левый MGB функционирует у лиц с дислексией иначе. Специализация левого MGB в речи может объяснить, почему людям с дислексией часто трудно понять речевые сигналы в шумной обстановке (например, в ресторанах). Катарина фон Кригштейн и ее команда теперь собираются провести дальнейшие исследования, чтобы научно доказать эти показания.

Источник: elifesciences.org