Дата-журналистика: открытые данные и что в них можно найти

26 октября, 2023
Содержимое
В дата-журналистике выделяют три основные составляющие: сбор данных, их визуализация и сторителлинг. Для успешной работы команды, считает Артём, каждый должен хотя бы в общих чертах понимать работу другого. «Так вы будете знать, какие данные и в каком формате вам нужны, будете говорить на одном языке».

Работа с данными — первая часть дата-журналистики — на самом деле не такая страшная, как кажется на первый взгляд. «Если вы умеете больше, чем “скопировать и вставить ячейку”, это радует, вы уже можете работать с данными», — подбадривает Артем. Знание же языков программирования ещё больше расширит ваши горизонты: вы сможете не только использовать готовые наборы данных, но и создавать свои.

Второй этап работы — визуализация. Здесь создаются инфографики, строятся графики, рисуются карты. «Визуализация, — считает Артём, — должна быть чистой, ясной и понятной». При этом нет ничего плохого в заимствовании методологии или инструментов у известных дизайнеров. Ведь если вы хотите сделать профессиональный продукт, нужно учиться у профессионалов. «В любом случае у вас получится по-другому — наложится специфика издания, собственный стиль».

На третьем этапе работы — сторителлинге — Артём советует не писать выводы заранее. «Когда получаете данные, не подгоняйте их под выдвинутую ранее гипотезу, не мухлюйте. Честно пишите о том, что есть на самом деле». Здесь важно также помнить о правильном сочетании инфографики и текста: они должны не повторять, а дополнять друг друга, создавать цельную картину.

 

Фото с лекции Артёма Щенникова для Школы журналистики HSE Press

Дата-журналисты должны подходить к работе ответственно. Поскольку они представляют объективную информацию (факты, цифры), нужно не забывать консультироваться с экспертами. «Всегда нужно уточнить, верно ли вы интерпретировали или визуализировали ту или иную закономерность, поскольку речь идёт о больших наборах данных».

По сути, дата-журналисты могут работать с любыми открытыми данными — то есть доступными в общем доступе и в хорошем качестве материалами. Но, к сожалению, не все данные легко скачать и прочитать. Например, многие таблицы выкладывают в сеть в виде отсканированных pdf-документов, работать с которыми невозможно. Кстати, для работы с pdf-файлами Артём посоветовал два бесплатных сервиса — Tabula и Textract.

В заключение встречи Артём привёл 3 примера дата-проектов «Новой Газеты».

Первый материал от августа 2019 года «Штаны на лямках», где анализировались декларации о доходах кандидатов в Мосгордуму. Большую сложность, вспоминает Артём, представлял объём данных: их было много, легко было ошибиться при анализе. «Отсюда и главный недостаток работы — не хватило времени на визуализацию данных».

Второй материал вышел в сентябре 2019 года и связан был с желанием чиновников использовать земли университетов в своих целях. «Нам пришлось проводить серьёзный рисёрч, чтобы выяснить стоимость земли. В одних случаях мы обращались к экспертам, в других — к сайтам по продажам недвижимости, к «Циану», например. А для иллюстрации итогов мы составили большую наглядную карту».

И последний пример: недавно «Новая газета» запустила телеграм-бота «Корона-Инфо». Он скачивает из нескольких источников актуальную информацию и делает рассылку о новых случаях заражения. «Это небольшая оперативная дата-история, которая набрала достаточно много просмотров».

На этих примерах Артём показал, что существует два типа дата-журналистики. Первый — большие и затратные по времени расследования, а второй — небольшие оперативные материалы. И лучшая стратегия — совмещать, работая над большим проектом, параллельно выпускать менее масштабные истории. Это поможет разнообразить работу, повысить имидж издания и избежать простоев и пауз в работе команды.


Конспектировала Анастасия Ковалева
Видеозапись встречи с Артёмом Щенниковым в группе ШЖ Вконтакте