Дата-журналистика

Не можешь посчитать — переназови

Бывает, что очень хочется о чём-то рассказать, но не выходит, потому что понятная на житейском уровне вещь не поддаётся строгому описанию, не получается сформулировать правила подсчёта.

Например, вы хотите по данным онлайн-кинотеатра рассказать про зрителей. Но кого считать зрителем? Каждого, кто включал фильм? А если он закрыл его через секунду — какой же это зритель? Можно выбрать отсечку по длительности: учитываем тех, кто смотрел не меньше десяти минут. Но почему десять, а не девять и не пятнадцать? И даже если человек десять минут смотрел двухчасовой фильм, достаточно ли этого, чтобы записать его в зрители?

Простой способ справиться с этой проблемой — не подгонять метод под формулировку, а выбирать формулировку для метода. Например, решили учитывать всех, кто включал фильм, даже на секундочку. Так и назовём этих людей: «те, кто запускал видео». В конце концов, они по-своему интересны: проявили интерес к контенту, даже если смотрели его недолго.

От выбранного метода зависят и  дальнейшие шаги. Продолжим пример: для тех, кто запускал видео, может быть не так показательна средняя длительность просмотра (она будет занижена по сравнению с «настоящими» зрителями), зато интересно количество этих просмотров (сколько фильмов пролистал человек, прежде чем нашёл нужное).

Не можешь посчитать то, о чём хочется рассказать, — реши, что посчитать получается, и переназови.

Читайте также:Правило одного предложенияПочему сравнение с числительным — дурной тонОткрытые данные — 17 любопытных источников