Искусственный интеллект может диагностировать посттравматическое стрессовое расстройство, анализируя голоса: исследование проверяет потенциальный подход к телемедицине

Исследование, опубликованное 22 апреля в журнале Depression and Anxiety, показало, что инструмент искусственного интеллекта может различать – с точностью 89% – голоса людей с посттравматическим стрессовым расстройством или без него.
«Наши результаты показывают, что характеристики, основанные на речи, могут быть использованы для диагностики этого заболевания и, при дальнейшем уточнении и проверке, могут быть использованы в клинике в ближайшем будущем», – говорит старший автор исследования Чарльз Р. Мармар, доктор медицины, Люциус Н. Литтауэр, профессор и заведующий кафедрой психиатрии Медицинской школы Нью-Йоркского университета.

Более 70 процентов взрослых во всем мире в какой-то момент своей жизни переживают травмирующее событие, при этом до 12 процентов людей в некоторых странах, переживающих тяжелый период, страдают от посттравматического стрессового расстройства. Люди с этим заболеванием испытывают сильное, постоянное недомогание, когда им напоминают о пусковом событии.
Авторы исследования говорят, что диагноз посттравматического стрессового расстройства чаще всего определяется клиническим собеседованием или самооценкой, которые по своей природе подвержены предвзятости.

Это привело к усилиям по разработке объективных, измеримых физических маркеров прогрессирования посттравматического стрессового расстройства, во многом похожих на лабораторные показатели медицинских состояний, но прогресс был медленным.
Изучение того, как учиться
В текущем исследовании исследовательская группа использовала метод статистического / машинного обучения, называемый случайными лесами, который позволяет «научиться» классифицировать людей на основе примеров.

Такие программы искусственного интеллекта создают "решающие" правила и математические модели, которые позволяют принимать решения с возрастающей точностью по мере роста объема обучающих данных.
Сначала исследователи записали стандартные многочасовые диагностические интервью, называемые шкалой посттравматического стрессового расстройства, управляемой клиницистом, или CAPS, с 53 ветеранами Ирака и Афганистана с посттравматическим стрессовым расстройством, связанным с военной службой, а также с 78 ветеранами без этого заболевания.

Затем записи были загружены в голосовое программное обеспечение от SRI International – института, который также изобрел Siri – в результате было получено в общей сложности 40 526 речевых функций, записанных в виде коротких всплесков речи, которые программа AI команды проанализировала на предмет шаблонов.
Программа случайного леса связала определенные особенности голоса с посттравматическим стрессовым расстройством, в том числе менее четкую речь и безжизненный металлический тон, оба из которых долгое время сообщалось как полезные для диагностики. Хотя текущее исследование не изучает механизмы заболевания, лежащие в основе посттравматического стрессового расстройства, теория состоит в том, что травматические события изменяют мозговые цепи, которые обрабатывают эмоции и мышечный тонус, что влияет на голос человека.
В дальнейшем исследовательская группа планирует обучить голосовой инструмент AI с большим количеством данных, дополнительно проверить его на независимой выборке и подать заявку на разрешение правительства на использование инструмента в клинических условиях.

«Речь – привлекательный кандидат для использования в автоматизированной диагностической системе, возможно, как часть будущего приложения для смартфонов посттравматического стрессового расстройства, потому что ее можно измерить дешево, удаленно и ненавязчиво», – говорит ведущий автор Адам Браун, доктор философии, адъюнкт-профессор. в отделении психиатрии Медицинской школы Нью-Йоркского университета.
«Технология анализа речи, используемая в текущем исследовании по обнаружению посттравматического стрессового расстройства, входит в диапазон возможностей, включенных в нашу платформу анализа речи под названием SenSay Analytics ™», – говорит Димитра Вергири, директор Лаборатории речевых технологий и исследований (STAR) SRI International.

Программное обеспечение анализирует слова – в сочетании с частотой, ритмом, тоном и артикуляционными характеристиками речи – чтобы сделать вывод о состоянии говорящего, включая эмоции, настроения, когнитивные способности, здоровье, психическое здоровье и качество общения. Технология была задействована в ряде отраслевых приложений, видимых в стартапах, таких как Oto, Ambit и Decoded Health."