Пандемия коронавируса вызвала активный интерес к использованию больших данных со стороны властей различных государств, которые таким образом пытаются отслеживать распространение инфекции и планировать профилактические меры. Однако при всей актуальности этих задач нельзя забывать и том, что большие данные могут принести больше вреда, чем пользы.
По всему миру корпорации и правительства отслеживают местоположение миллионов пользователей интернета и мобильной связи, пытаясь таким образом выявить картину распространения вируса и эффективность социального дистанцирования. В отличие от цифровой слежки, когда контролируются передвижения конкретных лиц, анализ больших массивов данных проводится с целью выявления общих характеристик передвижения и поведения населения в период пандемии.
В США, как сообщается, компании мобильной рекламы вместе с центрами по профилактике и предупреждению заболеваемости и штатовскими и муниципальными властями на основе отслеживания мобильных телефонов проводят анализ изменения потоков людей и их скопления в том или ином месте. Google запустил для исследования эффективности профилактических мер, таких как социальное дистанцирование, отчеты о мобильности в местных сообществах, которые используют данные о местоположении пользователей Google Maps. Facebook в рамках обновленной инициативы по картографированию профилактики коронавируса предоставляет партнерским исследовательским группам данные о передвижении населения и устойчивых группах контактов с целью прогнозирования распространения заболеваемости и мониторинга соблюдения мер профилактики.
Эти проекты могут выглядеть перспективными, однако и корпорации, и власти должны задаться вопросом, действительно ли они обеспечивают заявленный полезный эффект для обеспечения здоровья населения, или же больше оттягивают государственные ресурсы в направлении, которое ставит под угрозу беднейшие и самые уязвимые категории населения.
По опыту эпидемии лихорадки Эбола в Западной Африке в 2014 – 2016 гг., к большим данным следует подходить с осторожностью. Во время вспышки лихорадки гарвардские цифровые эпидемиологи получали данные о звонках пользователей мобильной связи по всему региону и пытались на основе этого предсказывать распространение вируса и разрабатывать для органов здравоохранения рекомендации по повышению адресности профилактических мер. Однако не исключено, что анализ основывался на некорректном допущении о преимущественном переносе вируса через миграцию, в то время как новые заражения были связаны главным образом с уходом за больными и участием в похоронах.
Анализ мобильного трафика также ставит под сомнение теорию о том, что метаданные могут служить надежным индикатором передвижений населения, даже на уровне агрегированных данных. В Западной Африке у многих пользователей мобильной связи имеется по несколько телефонов для различных профессиональных, социальных и личных нужд, и эти телефоны могут широко совместно использоваться внутри семьи, среди знакомых или даже в пределах местного сообщества.
Такие изначально некорректные исходные посылки высвечивают общую проблему, которая заключается в том, что большие данные могут размывать или искажать картину сложных социальных реалий с опасными последствиями как для здоровья населения, так и для прав человека.
В США меньший охват социальными сетями и мобильной связью пожилых людей и сельского населения может приводить к искажению определения потоков движения людей по данным мобильных телефонов, выводя в итоге на некорректную базу для понимания того, как инфекция распространяется внутри сообществ и какие меры необходимы для блокирования новых заражений. Дополнительным фактором, снижающим адекватность анализа передвижений по мобильной связи, служат естественные причины, которые сказываются на точности исходных данных, например, наличие в том или ином районе высоких зданий.
Получаемая на основе больших данных картина мобильности населения также недостаточно дает для понимания причин, почему люди перемещаются с места на место вопреки самоизоляции и другим ограничительным мерам. В местах компактного проживания малообеспеченных категорий населения с устойчиво высокой мобильностью у властей может возникнуть искушение ужесточить режим социального дистанцирования, и в результате могут несправедливо пострадать люди, которые перемещаются в поисках крова, ходят за бесплатной едой или пытаются на время покинуть район с опасно высокой плотностью населения.
Слепые зоны, которые возникают при анализе больших данных, могут приводить к распылению ресурсов здравоохранения, отвлекая и без того ограниченные силы и средства, которые могли бы быть направлены на реализацию проверенных противоэпидемических методов, в частности проактивного тестирования. Другой опасностью может быть введение драконовских ограничений, непропорционально ущемляющих права людей, поведенческие привычки которых не в полной мере или не до конца корректно отражаются большими данными. В Израиле государственная программа отслеживания по мобильным телефонам вызвала жалобы на то, что власти на основе неверных сведений стали ошибочно помещать граждан на режим домашней изоляции.
Если эффективность больших данных для борьбы с коронавирусом как минимум вызывает сомнения, то риски вторжения в частную жизнь очевидно зашкаливают. Правительства и корпорации заявляют об обезличенности персональных данных и называют это главной гарантией сохранения неприкосновенности частной жизни. Однако множество исследований демонстрируют, что восстановление идентифицирующих деталей – всего лишь вопрос времени и техники. Данные о местоположении являются особенно уязвимыми, поскольку при их наложении на общедоступную и персональную информацию о человеке можно составить практически полную картину его передвижений, контактов и деятельности.
В Google и Facebook утверждают, что в рамках корпоративных инициатив они предоставляют только агрегированную картину поведения людей, но не детальный трекинг истории передвижений. Агрегированные данные действительно могут обеспечивать определенную защиту приватности, но здесь необходимы дополнительные гарантии, включая ограничение того, кто и зачем может иметь доступ к таким данным, и определение того, как они должны уничтожаться и сколько храниться. При этом исторически практика обмена данными в технологическом секторе, как правило, не отличалась прозрачностью, и ни сами субъекты данных, ни общество в целом не могут быть уверены ни в существовании таких гарантий, ни в том, насколько строго они соблюдаются.
Разумное отношение к цифровым технологиям в условиях сегодняшнего кризиса способно улучшить наше понимание эпидемии, расширить доступность здравоохранения и помочь нам оставаться на связи. Однако стремление задействовать большие данные в благих целях не должно давать карт-бланш на рискованные эксперименты, когда неприкосновенность частной жизни и гражданские свободы приносятся в жертву с неочевидными результатами и чреваты опасными последствиями, которые могут надолго сохраниться и после того, как человечество справится с коронавирусом.