Исследователи также разработали новый метод машинного обучения для более точной количественной оценки семантического богатства разговорного языка людей, известного индикатора психоза.
Их результаты показывают, что автоматизированный анализ двух языковых переменных – более частое использование слов, связанных со звуком и говорение с низкой семантической плотностью или нечеткостью – может предсказать, разовьется ли впоследствии у человека из группы риска психоз с точностью 93%.
Даже обученные врачи не заметили, как люди с риском психоза используют больше слов, связанных со звуком, чем в среднем, хотя аномальное слуховое восприятие является доклиническим симптомом.
«Пытаться услышать эти тонкости в разговоре с людьми – все равно что пытаться увидеть микроскопические микробы своими глазами», – говорит Негин Резайи, первый автор статьи. "Разработанный нами автоматизированный метод – действительно чувствительный инструмент для обнаружения этих скрытых закономерностей.
Это похоже на микроскоп для предупреждения о психозе."
Резайи начала работу над газетой, когда она была резидентом факультета психиатрии и поведенческих наук Медицинской школы Эмори. Сейчас она работает научным сотрудником отделения неврологии Гарвардской медицинской школы.
«Ранее было известно, что тонкие черты будущего психоза присутствуют в языке людей, но мы использовали машинное обучение, чтобы раскрыть скрытые детали этих черт», – говорит старший автор Филип Вольф, профессор психологии в Эмори.
Лаборатория Вольфа специализируется на языковой семантике и машинном обучении для прогнозирования принятия решений и психического здоровья.
«Наше открытие является новым и дополняет доказательства, показывающие потенциал использования машинного обучения для выявления языковых аномалий, связанных с психическим заболеванием», – говорит соавтор Элейн Уокер, профессор психологии и нейробиологии Эмори, которая исследует, как развиваются шизофрения и другие психотические расстройства.
Начало шизофрении и других психотических расстройств обычно происходит в возрасте 20 лет, с предупреждающими признаками, известными как продромальный синдром, – примерно в 17 лет.
Примерно от 25 до 30 процентов молодежи, отвечающей критериям продромального синдрома, разовьется шизофрения или другое психотическое расстройство.
Используя структурированные интервью и когнитивные тесты, обученные врачи могут предсказать психоз с точностью около 80 процентов у людей с продромальным синдромом. Исследования в области машинного обучения входят в число многих текущих усилий по оптимизации методов диагностики, выявлению новых переменных и повышению точности прогнозов.
В настоящее время нет лекарства от психоза.
«Если мы сможем раньше идентифицировать людей, которые подвергаются риску, и использовать профилактические меры, мы сможем обратить вспять дефицит», – говорит Уолкер. "Есть хорошие данные, показывающие, что такие методы лечения, как когнитивно-поведенческая терапия, могут отсрочить начало психоза и, возможно, даже снизить частоту возникновения психоза."
В данной статье исследователи сначала использовали машинное обучение, чтобы установить «нормы» разговорного языка.
Они скармливали компьютерной программе онлайн-разговоры 30 000 пользователей Reddit, платформы социальных сетей, где люди проводят неформальные дискуссии по ряду тем. Программа, известная как Word2Vec, использует алгоритм для преобразования отдельных слов в векторы, присваивая каждому из них местоположение в семантическом пространстве на основе его значения.
Те, что имеют схожие значения, расположены ближе друг к другу, чем те, которые имеют совершенно разные значения.
Лаборатория Вольфа также разработала компьютерную программу для выполнения того, что исследователи назвали «векторной распаковкой», или анализа семантической плотности употребления слов.
В предыдущей работе измерялась семантическая согласованность предложений. Векторная распаковка позволила исследователям количественно определить, сколько информации было упаковано в каждое предложение.
После создания базовых «нормальных» данных исследователи применили те же методы к диагностическим интервью с 40 участниками, которые были проведены обученными клиницистами в рамках многопрофильного североамериканского продромального продольного исследования (NAPLS), финансируемого Национальным правительством. Институты здоровья. NAPLS ориентирован на молодых людей с высоким клиническим риском психоза.
Уокер – главный исследователь NAPLS в Эмори, одном из девяти университетов, участвующих в 14-летнем проекте.
Затем автоматизированные анализы выборок участников сравнивались с нормальной исходной выборкой и с продольными данными о том, перешли ли участники в состояние психоза.
Результаты показали, что более частое, чем обычно, употребление слов, связанных со звуком, в сочетании с более высоким уровнем использования слов со схожим значением означает, что психоз, вероятно, уже не за горами.
Сильные стороны исследования включают простоту использования всего двух переменных, каждая из которых имеет прочную теоретическую основу, – репликацию результатов в наборе данных с задержкой, а также высокую точность его прогнозов, превышающую 90 процентов.
«В клинической сфере нам часто не хватает точности», – говорит Резайи. "Нам нужны более количественные, объективные способы измерения скрытых переменных, например тех, которые скрыты в использовании языка."
Резайи и Вольф в настоящее время собирают большие массивы данных и тестируют применение своих методов на различных психоневрологических заболеваниях, включая деменцию.
«Это исследование интересно не только своим потенциалом раскрыть больше о психических заболеваниях, но и пониманием того, как работает мозг – как он объединяет идеи», – говорит Вольф. "Технология машинного обучения развивается так быстро, что дает нам инструменты для анализа данных человеческого разума."
Работа поддержана грантами Национальных институтов здравоохранения и премией Google Research Award.