Почему городским планировщикам следует обращать внимание на сайты с обзорами ресторанов: исследование показало, что информация о ресторанах в Интернете может точно предсказать ключевые показатели района, а не другие данные

Действительно, используя данные онлайн-ресторанов, говорят исследователи, они могут эффективно предсказать дневное и ночное население района, количество расположенных в нем предприятий и общий объем расходов в районе.
«Ресторанная индустрия – одна из самых децентрализованных и нерегулируемых отраслей местного потребления», – говорит Сики Чжэн, профессор урбанистики Массачусетского технологического института и соавтор новой статьи, в которой излагаются результаты. "Это тесно связано с местными социально-экономическими характеристиками, такими как население, богатство и потребление."
Исследователи говорят, что использование данных о ресторанах в качестве заменителя для других экономических показателей может иметь практическое значение для градостроителей и политиков. В Китае, как и во многих других местах, перепись проводится только раз в десятилетие, и может быть трудно проанализировать динамику постоянно меняющихся районов города на более быстрой основе.

Таким образом, новые методы количественной оценки уровня жилого фонда и экономической активности могут помочь городским властям.
«Даже без данных переписи мы можем предсказать различные атрибуты района, что очень ценно», – добавляет Чжэн, доцент кафедры развития недвижимости и предпринимательства Сэмюэля Так Ли и директор факультета китайской лаборатории будущего города Массачусетского технологического института.

«Сегодня наблюдается большой разрыв в данных», – говорит Карло Ратти, директор лаборатории Senseable City Lab Массачусетского технологического института и соавтор статьи. "Данные имеют решающее значение для лучшего понимания городов, но во многих местах у нас мало [официальных] данных. В то же время у нас появляется все больше и больше данных, генерируемых приложениями и веб-сайтами.

Если мы воспользуемся этим методом, мы [сможем] понять социально-экономические данные в городах, где они не собирают данные."
Документ «Прогнозирование социально-экономических характеристик районов с использованием данных о ресторанах» опубликован в Proceedings of the National Academy of Sciences.

Авторами являются Чжэн, который является автором-корреспондентом; Ратти; и Лей Донг, постдок, организованный совместно MIT China Future City Lab и Senseable City Lab.

В исследовании подробно рассматриваются девять городов Китая: Баодин, Пекин, Чэнду, Хэнъян, Куньмин, Шэньян, Шэньчжэнь, Юэян и Чжэнчжоу. Для проведения исследования исследователи извлекли данные о ресторанах с веб-сайта Dianping, который они описывают как китайский эквивалент Yelp, англоязычного сайта бизнес-обзоров.

Сопоставляя данные Dianping с надежными существующими данными для этих городов, включая анонимные и агрегированные данные о местоположении мобильных телефонов из 56.3 миллиона человек, записи по банковским картам, записи о регистрации компаний и некоторые данные переписи – исследователи обнаружили, что они могут предсказать 95 процентов колебаний дневного населения между районами. Они также предсказали 95 процентов колебаний численности населения в ночное время, 93 процента колебаний количества предприятий и 90 процентов колебаний уровней потребительского потребления.

«Мы использовали новые общедоступные данные и разработали новые методы увеличения данных для решения этих городских проблем», – говорит Донг, добавляя, что модель исследования является «новым вкладом в [использование] науки о данных для общественного блага и больших данные для городских экономических сообществ."
Исследователи отмечают, что это более точный прокси для оценки демографической и экономической активности на уровне района, чем другие ранее использовавшиеся методы. Например, другие исследователи использовали спутниковые изображения для расчета количества ночного света в городах и, в свою очередь, использовали количество света для оценки активности на уровне района.

Хотя этот метод хорошо подходит для оценки численности населения, метод данных по ресторанам в целом лучше и намного лучше для оценки деловой активности и потребительских расходов.
Чжэн говорит, что она «уверена» в том, что модель исследователей может быть применена к другим китайским городам, потому что она уже показывает хорошую предсказательную силу в разных городах. Но исследователи также считают, что использованный ими метод – который использует методы машинного обучения для определения значимых корреляций – потенциально может быть применен к городам по всему миру.

"Эти результаты показывают, что данные о ресторанах могут отражать общие показатели социально-экономических результатов, и эти общие черты могут быть перенесены … с разумной точностью в городах, где результаты опроса не наблюдаются », – отмечают исследователи в статье.
Как признают ученые, в их исследовании наблюдалась корреляция между данными о ресторанах и характеристиками района, вместо того, чтобы указывать точные причинно-следственные механизмы в действии.

Ратти отмечает, что причинно-следственная связь между ресторанами и характеристиками района может быть двоякой: иногда рестораны могут удовлетворить спрос в уже процветающем районе, а в других случаях их присутствие является предвестником будущего развития.
«Между ресторанами и развитием района всегда есть толчок и тяга», – говорит Ратти. "Но мы показываем, что социально-экономические данные очень хорошо отражаются на ландшафте ресторанов, в городах, на которые мы смотрим.

Интересный вывод заключается в том, что это похоже на прокси-сервер."
Чжэн говорит, что надеется, что другие ученые поймут этот метод, который в принципе может быть применен ко многим темам урбанистики.
«Сами по себе данные о ресторанах, а также различные прогнозируемые характеристики района могут помочь другим исследователям изучать все виды городских проблем, что очень ценно», – говорит Чжэн.

Исследование стало результатом постоянного сотрудничества между China Future City Lab Массачусетского технологического института и консорциумом MIT Senseable City Lab Consortium, которые используют широкий спектр источников данных, чтобы пролить новый свет на динамику развития городов.
Исследование также было частично поддержано Национальным научным фондом Китая.