Зачем гуманитариям математика? Подкаст «Поредачим»
Поделиться
Отправить
Поделиться
Павел Федоров
Павел Федоров
Павел Федоров

Зачем гуманитариям математика? Подкаст «Поредачим»

Сергей Антонов — о том, как умение работать с данными повышает ценность редактора

Это текстовая расшифровка одного из выпусков подкаста «Поредачим». Если вы поклонник аудио и теплого лампового звука, подкаст можно послушать здесь.

Или прямо здесь:

Разговариваем с Сергеем Антоновым — шеф-редактором потока «Статистика» в Тинькофф-журнале, одним из авторов нашего чудесного канала «‎Паша и его прокрастинация», автором «‎Дурного словаря». А теперь еще — соавтором нашей рассылки. У микрофона Паша Федоров.

«Самая большая беда журфаков, что при поступлении не надо сдавать математику»

ПФ: У этого выпуска сразу же есть спонсор. Вы офигеете. И спонсор этого выпуска — мы с Серегой. Потому что мы запустили рассылку «‎Работа с данными на минималках»: Серега написал, я спродюсировал. И этот подкаст мы записываем, потому что у нас вышла эта рассылка. Тема оказалась очень интересной. 

Сережа, расскажи, пожалуйста, что за рассылка и почему мы с тобой собрались тут поговорить вообще. 

СА: Мы сделали рассылку для журналистов, авторов, редакторов и маркетологов. В общем, для всех людей, которые пишут или редактируют тексты. И она поможет им вкатиться в дата-журналистику, скорее, даже в основы дата-журналистики. Научим собирать статистику; расскажем, где она лежит; какой можно верить, а какой нельзя, как интерпретировать социологические опросы; как правильно нарисовать доступными средствами график и как это потом все использовать. Повторюсь, все это для людей, которые считают, что они гуманитарии. 

ПФ: Скажи, пожалуйста, а нафига это все нужно? Потому что когда говорят про журналистику, коммерческую редактуру, обычно все учатся писать, учатся переговорам, учатся верстать страницы, базовый html. А тут вдруг какая-то математика, цифры, вот это все. Очень страшно, очень непонятно. И я, как человек, который в универе изучал статистику, хочу сказать, что правда страшно. На статистику мы ходили просто с ужасом. А тут вдруг мы запускаем такую рассылку для пишущих — вообще, как это получилось? Мы же гуманитарии. 

СА: Понятно, что это не высшая математика, не математическая статистика и так далее. Но я вообще считаю что математика, хотя бы базовая, школьного уровня, которую многие упускают, нужна людям, которые пишут. Потому что как минимум надо уберечься от глупых ошибок. Таких, когда люди не могут посчитать проценты от процентов, миллионы путают с миллиардами, проценты с процентными пунктами и так далее — это базовая вещь. 

ПФ: Среднеарифметические и медианы, вот это все…

СА: Да. Представь, человек издает статью, она написана красиво, но внутри фактические ошибки, и заказчика начинает триггерить…

Вторая важная вещь — это про качество, в плане самих материалов. Если уметь искать данные, интерпретировать их, визуализировать — статьи получатся глубже. Не просто писать, например, что «‎по данным соцопросов» или «‎по данным экспертов», а ссылаться на конкретные исследования. При этом говорить, можно ли им доверять или стоит относиться с осторожностью и почему. Чтобы учиться самому искать статистику для подтверждения своих тезисов. Все это важно, так как делает материал глубже. 

Это важный скилл. Он отчасти, наверное, хард, а отчасти софт. Потому что наращивает, в конце концов, математическое мышление. И самая большая беда журфаков, по моему мнению, это то что при поступлении туда не сдают математику. 

ПФ: А нафига она там?

СА: Здесь палка о двух концах. Во-первых, на журфаки начинают идти люди, которые хотят себе более-менее не педагогическую, не научную профессию. И при этом ищут факультет, при поступлении на который не надо сдавать математику. 

ПФ: Мне казалось, на журфак идут люди, которые говорят «‎журналистика это мое призвание, я хочу написать роман». 

СА: Да, но есть те, кто «хочу кем-то быть, кем — не знаю, чтобы это была нормальная работа, в педагоги не хочу, на юриста без блата не поступишь, остается журфак». И вот человек идет на журфак. Там какое-то весомое количество таких людей есть. Я преподаю на журфаке, и это видно. 

Вторая история — это про то, что я уже сказал: путают проценты и процентные пункты, не могут что-то посчитать. А еще большая беда, которую тоже хотелось закрыть и которую в рассылке мы закрыли, — это что людей вообще не учат делать графики, понимать, какой график когда нужно использовать. 

Я сижу на защите дипломов, и это прямо видно. Просто иногда за голову хватаешься, когда люди пытаются данные из своих исследований как-то визуализировать, а получается у них не очень понятно. Короче, математика нужна даже для гуманитариев. 

«Математика — это и есть то, что ты назвал „‎математика для тупых“. Не для тупых, а для детей»

ПФ: Я учился на экономическом факультете. В смысле, факультет у меня был управления, но направление экономическое. И математика, которую мне давали в универе, это была какая-то прям жесть совсем. Я в школе учился на пятерочки, у меня одна четверка в аттестате, почти отличник. В универе скатился на тройбаны, потому что я перестал понимать математику, хотя я всегда ее очень любил. О какой математике идет речь все-таки? Нужно ли нам разбираться во всех этих… матрицах, что там проходят в универе. 

СА: Нет. Мы не про вышку, не про теорию вероятности. Если просто взять школьный курс экономики и математики, перечитать, этого вполне достаточно. Потому что в статьях иногда встречаешь, как человек пишет цифрой 1000, а дальше «‎тысяч рублей», и думает что он написал «‎тысяча», а на самом деле это миллион. 

Или ключевая ставка была 7%, стала 9%. Автор пишет что она выросла на два процента, хотя на самом деле на два процентных пункта. Это грубая ошибка. 

Я говорю о таких вещах. 

В конце концов, надо бывает что-то посчитать элементарное или понять, что у тебя сумма больше 100% в табличке, а часто оказывается, что это почему-то сложно. 

ПФ: Мне кажется это должно называться что-то типа «‎математическая насмотренность», видеть такие моменты. Потому что я в свое время, года два назад, начал проходить курс от Go Practice про управление продуктом на основе данных. Ты покупаешь курс за 60 тысяч рублей. И в первом же уроке тебе рассказывают, чем среднее арифметическое отличается от медианного. И ты такой, вау. 

СА: Ты будешь смеяться, но это школьная штука. И ее тоже многие не знают. 

 ПФ: Да. Я прохожу и такой — вау. Это же очень круто. Потому что да, мне это кто-то преподавал, но мне сейчас показали, как я могу это применять. И медиану в школе, у меня такое ощущение, что мы как-то по-другому считали. Но может быть, я просто тупой, я не знаю. Вау, это очень круто, классно. Не нужно ли выделять эту математику во что-то обособленное? Потому что, кажется, все сложно с математикой. 

СА: Ты имеешь в виду что значит «выделить обособленно»?

ПФ: Какую-нибудь отдельную науку придумать. Математика для тупых. 

СА: Она так и называется математика. Ты же знаешь, у тебя в школе сначала идет математика, а потом она разделяется на алгебру и геометрию. Вот то что в самом начале — математика, это и есть то, что ты назвал «‎математика для тупых». Не для тупых, для детей. 

Но мы как бы все-таки не про математику, а про математическое мышление. И давай к статистике вернемся. 

ПФ: Вот расскажи, что за математическое мышление, о чем речь вообще идет?

СА: Просто о том, чтобы не воротить голову от цифр, от таблиц. Часто когда человек пишущий, я это видел, встречает таблицу, в которой больше 20 строчек, у него начинает кружиться голова. Хотя на самом деле чем больше таблица, тем, по-моему, круче, потому что из нее можно больше информации достать. Даже если ее просто в текст переработать. Не обязательно в виде таблицы оставить или в график превратить. Поэтому математическое мышление — это не бояться цифр. Понимать и разговаривать с ними на одном языке. 

«Лучше один раз показать что-то в статье картинкой, чем сто раз описывать словами»

ПФ: Отлично. Ты сказал что студенты приносят отвратительные графики. Я могу сказать, что не только студенты. Потому что у меня есть опыт работы и в агентстве, и тоже со студентами, и я видел плохие графики. Я и сам делаю фиговые графики, что тут мудрить. А что ты считаешь хорошим графиком? 

СА: Хороший график, во-первых, доносит мысль автора. Есть какие-то базовые штуки. Например, если нам нужно показать долю от целого, то мы используем круговую диаграмму, всем привычную. 

ПФ: Пирожок?

СА: Pie chart, да. А если нам нужно показать как менялось что-то во времени, мы используем линейную диаграмму. Бывает же, что нужно показать несколько долей от одного большого целого, например десять. У нас есть, например, бюджет России, у которого 20 статей расходов — основных, крупных направлений. И если мы все это запихнем в круговую диаграмму, в pie chart, то получится мельтешение, там будут какие-то мелкие доли, это считываться мгновенно не будет. Тогда, например, лучше делать столбчатую диаграмму и доли столбиками показывать. 

Разговаривать про графики можно бесконечно. И если хочется вкатиться в эту тему — а вкатиться, мне кажется, в нее надо любому человеку, который взаимодействует с аудиторией. Неважно, выступает он или делает презентации, пишет тексты или что-то еще. Здесь нужно две вещи сделать, как в любом деле. Прежде всего, развивать базу. Начать можно с нашей рассылки. Но вообще я люто рекомендую книжку «‎Графики, которые убеждают всех» Александра Богачева. 

Второе важное дело — развивать насмотренность, смотреть, как делают другие. Мы сделаем подборочку телеграм-каналов, на которые можно подписаться, чтобы смотреть крутые штуки. 

Тема глубокая, говорить можно очень долго. Но я считаю, как в любом деле, лучше один раз что-то показать в статье, картинкой. Чем сто раз описывать словами, что вообще происходит. 

ПФ: Помнишь такой мем. Никто… Абсолютно никто… Вообще никто и никогда… Сергей Антонов: говорить о графиках можно бесконечно. Абсолютно то же самое. 

«Часто к государственной статистике есть вопросы»

ПФ: Скажи, пожалуйста, мы договорили, что математика пишущим нужна. Графики — это круто. А где брать все эти данные? Какие-то статистические источники, опросы, можно ли всему этому верить вообще?

СА: Давай разделим вопрос на части. Первая, где брать информацию. Вообще, у нас много так называемых операторов данных. Это те, кто собирает данные. В первую очередь государство. Самый яркий пример — Росстат. Кроме того, это какие-то министерства, ведомства. Очень много всего лежит в открытом доступе. И это не какие-то там гигантские массивы данных, а вполне понятные таблички в экселевском формате. 

Есть куча международных баз данных — начиная от ООН, заканчивая ВОЗ и Всемирным банком, все это тоже в открытом доступе, можно выкачивать, смотреть. 

Можно всегда попросить данные у тех, у кого они есть, и это нормально. Потому что в Т—Ж, когда мы делаем материалы, то без проблем можем прийти, например, к 2ГИС и попросить что нужно, или к «Авито». Скажем, хотим узнать, как менялась цена старых айфонов после выхода каждого нового, а «Авито» это видит. Потому что у компании много данных об объявлениях по продаже айфонов. Вот и мы посмотрели, как меняется каждый раз цена предыдущей модели после того, как выходит новая. В итоге сделали материал, а данные брали у «Авито». 

Другой пример — Headhunter, у которого гигантские базы вакансий. Можешь прийти и попросить, за ссылку, за пиар, естественно указывая всегда источник, кто является оператором данных. 

Что касается того, можно ли верить статистике… 

ПФ: Да, можно ли верить? Мы в России, в 2022 году. 

СА: Можно верить, но не всем данным. Потому что, например, я буквально вчера вечером смотрел большое интервью с демографом Алексеем Ракшой, который очень сильно критиковал последнюю перепись населения. Ту, которая называется «Перепись-2020», но прошла в 2021 году. К ней очень большие вопросы у демографов. 

Перепись проводится раз в десять лет и считается таким эталонным исследованием. То есть статистики каждый год считают население России, а потом проходит перепись, и они все данные подгоняют под перепись. Потому что перепись — это такая идеальная штука. И к последней переписи очень много вопросов в части населения. 

Конечно, часто к государственной статистике есть вопросы. Я не говорю, что она врет, но к ней есть вопросы по некоторым темам. Хотя почти вся статистика в России, которая публикуется официально, делается по международным стандартам, но мы всегда можем сказать, что могут быть приписки на местах. 

Приведу пример. Статистики считают инфляцию, рост цен. Обычно это происходит таким образом. В каждом райцентре тетенька-статистик берет блокнотик, идет в магазин и записывает раз в неделю цены, а потом забивает в компьютер. Все это сводится в единую базу на уровне региона, потом страны. Потом считается средний показатель и так далее. 

По идее, на самом низовом уровне могут возникнуть уже косяки. Каким образом? Во-первых, тетенька пошла в магазин, который ближе всего, а это оказался самый дорогой магазин в поселке — и данные уже сбились. Или тетенька вообще никуда не пошла, потому что ей лень. Она просто накинула 2% к прошлой неделе и сказала, пусть будет так. Когда это произошло один раз, то эта статистическая аномалия не будет заметна на больших цифрах, а если это делают многие, то это уже косяк. 

ПФ: А можно ли это как-то выявить или понять?

СА: Это можно выявить перепроверочными вещами. Сейчас Росстат обещает этим заняться. Каким образом? Они уже вроде экспериментально это делают — например, собирают данные с онлайн-касс. То есть люди платят за товары, это отражается в базах операторов фискальных данных, и сразу видно, что хлеб стоит 28 рублей в таком-то поселке. Если эти данные не бьются с теми данными, которые собирали руками, естественно, появляется повод задать вопросы. И в идеале статистики хотят полностью перейти на данные с онлайн-касс, потому что они честные. Показывают именно то, за какую сумму человек реально покупает товар. 

ПФ: А в каких темах не стоит доверять официальной статистике, потому что будут вопросы к нам на эту тему? Я правильно понимаю, политику мы не берем в расчет сразу?

СА: Есть статистика, и есть социология. В статистике, там, где, вероятно, по каким-то причинам, ошибки в виде каких-то приписок. Например, условный регион, на который спустили задачу снизить смертность от сердечно-сосудистых заболеваний, иначе всех уволят. И он начинает эту смертность перекидывать в другие статьи, мол, эти люди умерли от старости. 

ПФ: Как с коронавирусом было. 

СА: С коронавирусом тоже спорная история. Есть понятие «‎избыточная смертность». У нас там было больше миллиона человек. Избыточная смертность может появиться по разным причинам. Например, потому, что все больницы были перепрофилированы под больных коронавирусом. Соответственно, люди, которые должны были получить плановую операцию, им просто стало плохо, а доктор не смог принять, потому что мест нет в отделении. Это одна история. 

Или у человека был рак, он заболел короной, но умер от рака. То есть ослабление иммунитета резкое спровоцировал ковид. Но в заключении о смерти будет стоять онкология — и это правильно. Потому что указывается именно причина смерти. Здесь много спорных методологических моментов, которые в принципе неразрешимы. 

Это что касается ковида. Но, возвращаясь к твоему вопросу, чему можно и нельзя верить, я думаю, что очень большая критика сейчас идет по поводу численности населения России по итогам переписи, потому что данные вызывают вопросы. 

Что касается соцопросов, там другая история. Во-первых, если соцопрос проведен правильно, сделана грамотная статистическая выборка и так далее, может быть выбор самих респондентов, то есть людей, которые отвечают. 

Недавно я слышал, что ВЦИОМ все чаще сталкивается, когда люди отказываются от ответа. У них спрашивают: «Кому из политиков вы доверяете?», — социологам отвечают: «Я не буду с вами разговаривать», — и уходят. И таких может быть 9 из 10 человек. То есть чтобы набрать выборку в 1600 человек, приходится опрашивать в десять раз больше людей. 

Или люди дают социально одобряемый ответ. Когда тебя спрашивают «‎Обманывать это хорошо?», ты говоришь, что, конечно, нет. Потому что обманывать плохо. Это базовая моральная установка. 

ПФ: Нужно ли бороться с коррупцией в России? Да, конечно, нужно. 

СА: А после этого ты идешь и даешь шоколадку врачу. Поощряя тем самым низовую коррупцию. То есть ты социально одобряемый ответ даешь, но сам при этом можешь думать по-другому или поступать по-другому. 

ПФ: Что мы пока что узнали. Мы узнали, что математика пригодится. Мы узнали, что графики — это круто. Мы узнали, что доверять можно не всей статистике, но в целом доверять можно. Я правильно понимаю?

СА: Например, с ценами я пример приведу. У нас все цены в стране мониторит только Росстат. Если тебе хочется узнать, как обстоят дела во всей стране, то будешь пользоваться его данными. Или всю статистику по смертности от различных заболеваний делает только Минздрав. Если тебе захочется об этом узнать, тебе больше не к кому пойти. Другой статистики по некоторым вопросам у нас для вас нет. Что-то ты можешь перепроверить по альтернативным данным, а что-то нет. И ты вынужден ориентироваться только на государственные данные. 

«Начните с учебника по основам рыночной экономики»

ПФ: Я понял твою позицию. Я понял, почему данные полезны. Мы выяснили, можно ли доверять статистике. А что еще внутри этой рассылки, ради которой мы собрались? Что там еще такого ценного, важного. 

СА: Ну вообще, мы коротко попытались пробежаться по всему. То есть где найти данные, как их обработать, чтобы с ними потом можно было работать. Как их визуализировать. Какие типы графиков бывают и какой выбрать в вашем случае. И как его нарисовать простыми штатными методами. Начиная просто от «Экселя», например, и заканчивая какими-то простенькими программами. 

И соответственно, дальше — как все это применять, если вы, например, автор. Или еще у нас есть отдельное письмо гостевое, как все это применять, если вы маркетолог. Посчитать бенчмарки, прикинуть аудиторию и так далее. 

В общем, полный цикл жизни данных внутри работы редактора, журналиста, маркетолога, копирайтера и так далее. 

ПФ: Короче говоря, менее водянисто, чем наш с тобой разговор сейчас. Правильно?

СА: Очень менее водянисто. Но тем не менее рассылка получилась очень объемная в плане текста. Я пытался более-менее не растекаться по древу. Чтобы это было понятно, но в то же время без воды. И получились письма по 10 тысяч знаков и даже больше. 

ПФ: По объему вышло как моя книжка. 

СА: Наверное. 

ПФ: Да в смысле наверное? Наверное даже больше, чем моя книжка. У меня 110 тысяч. 

СА: Я специально посчитал. У нас в рассылке 140 тысяч знаков. Я надеюсь, что это будет полезно. Потому что письма мы показывали крутым дата-журналистам, с кем я общаюсь. И ребята говорили, что все ок. Я их мнению доверяю. Здесь я синдром самозванца пытался ликвидировать, общаясь с коллегами, мне они подликвидировали. 

ПФ: Макс Ильяхов тоже пырнул рассылку. Сказал, что там внутри говна нет. Я проверил тоже, говна там точно нет. 

Давай так, нам нужно дать подборку советов тем, кто хочет увлечься данными. Не зависит от того, купит он нашу рассылку или нет. Вот он хочет углубиться в эту тему. Какие советы мы можем дать?

СА: Подписаться на телеграм-каналы. Мы сделаем подборочку. Это от дата-журналистов российских. 

Смотреть другие исследования. Читать литературу. Сейчас очень много переводной. Но я все-таки советую поискать хорошую нашу, она есть. Например, книжка «‎Графики, которые убеждают всех», Богачева, которую уже упоминали. Потому что переводная адаптируется зачастую не очень хорошо. Если читаете на английском — ищите оригиналы. 

ПФ: Вот смотри, мне 33 года. Я окончил школу в 2006 году. Это было 16 лет назад. Как мне вспомнить математику, ту самую, про которую ты говорил в самом начале?

СА: Я думаю, надо не к математику идти, а найти хороший школьный учебник по основам рыночной экономики — это будет лучше. Потому что, как правило, в текстах люди сталкиваются больше не с чистой математикой, а с чем-то экономическим — те же проценты, медиана, среднее, как считается. 

ПФ: Надо найти такой учебник и прямо приложить ссылку на него наверное. 

СА: У меня был классный региональный. Здесь издавали, в Белгородской области. Свой. Это было в 90-е годы, когда я учился в школе. И я его с тех пор правда не видел ни разу. Поэтому с ОРЭ начать — основ рыночной экономики, не с математики. Там тем более будет написано языком очень простым, потому что это для школьников. 

ПФ: То есть какой-то кейнсианский крест вспомнить, вот это все. 

СА: Там если это и будет, то написано простыми словами. 

«Грамотная визуализация — это способ коммуникации»

ПФ: Про статистику ты классно говорил, про Росстат, про конкретные исследования, про математику привел конкретные примеры. Тоже хорошо. А вот графики как будто просели немного. Нет мысли, что можно туда добавить?

СА: Графики можно нарисовать «Экселем» или гугл-таблицами. И они будут прямо крутыми. Но проблема в том, что предлагают тебе сделать по умолчанию, это всегда будет гуано. Тебе либо сделает круговую диаграмму автоматически «Эксель», либо столбики. 

ПФ: Либо линию выстроят. 

СА: Да, линейную диаграмму, но, скорее всего, она будет не оправданна для того, что ты хочешь донести в своем сообщении. Я как приводил пример с бюджетом: тебе круговую предложат, а на самом деле там нужно барчарт. 

Плюс тебе стремные цвета бахнут: ядрено-зеленый, ядрено-желтый, ядрено-красный. Хотя цвет — это один из способов кодировки информации. 

ПФ: Красный значит что-то плохое, зеленый что-то хорошее. 

СА: Нет. Тебе дадут разные цвета, в смысле не одинаковые. Хотя на самом деле… Объясню на примере. Представим, у нас есть график расходов бюджета. И мы знаем, что на здравоохранение тратится 10%. И нам важно только это, а остальные статьи не нужны. Тогда нам имеет смысл максимально обесцветить все остальное, а подсветить только здравоохранение. И в заголовке сразу написать сообщение — не просто «Разделение долей бюджета» или «А вот куда тратится российский бюджет», а написать сразу в заголовке, что «‎на здравоохранение уходит десятая часть российского бюджета». То есть мы, во-первых, сразу кодируем сообщение в заголовке. Во-вторых, максимально подсвечиваем то, что нужно показать, и максимально обесцвечиваем то, что не нужно показать. 

ПФ: А если я менеджер в диджитале. И ежемесячно делаю кучу отчетов. Мне пригодится эта информация про графики?

СА: Мы же говорим про способ коммуникации. Неважно, презентацию ты делаешь или статью пишешь. И грамотная визуализация — это способ коммуникации. Когда человек, условно говоря, на презентации на слайд бросил взгляд и сразу все понял. Тебе не нужно даже словами проговаривать то, что ты хотел сказать, что 10% бюджета идет на здравоохранение. Пока он будет выискивать в этом графике, по умолчанию построенном, где это здравоохранение, ты должен словами ему проговорить, что обрати внимание, дружок, смотри, вот здесь зеленым, а все не то что синим, красным, черным, оранжевым. А так он просто один раз посмотрел и сразу все понял. 

ПФ: Давай конкретный пример приведу. Вопрос тебе на засыпочку, товарищ мой. Смотри, у меня есть распределение трафика проекта. И там есть, допустим, 15 источников трафика. Когда мне выгружают откуда бы ни было или строят автоматически диаграмму, получается пирожок, в котором куча малюсеньких долей. Они просто маленькие, не отображаются нормально. Что можно сделать с этим графиком, чтобы он был понятным?

СА: Столбиковый сделать, самый простой. Причем я в таком случае рекомендую горизонтальный. Не вертикальные чтобы столбцы были, а горизонтальные. И ты их потом отсортируешь по убыванию и сразу будешь видеть, что и насколько больше чего. 

ПФ: Смотри, у меня трафик из поиска занимает 90%, и я сделал столбиковую диаграмму. И будет куча мелких-мелких столбиков. А этот будет большой. Но как мне показать что всего пирога он такую часть занимает?

СА: Я бы тогда просто сделал каким образом. Мы делаем один график, без поиска, соответственно, у тебя все остальное пересчитывается. Становится видно, что масштабируется. Но ты где-то например в заголовке кодируешь что речь сейчас только об оставшихся десяти процентах. 

ПФ: Интересный выход. Короче говоря, эта информация пригодится не только тем, кто пишет, но и тем кто в принципе управляет продуктами и менеджерит все такое. 

СА: Конечно, если ты делаешь отчетность, ты в любом случае работаешь с цифрами. И у нас из десяти писем, три про визуализацию: какая она бывает, как ее делать. Вплоть до того, как карты, например, делать — плиточные, российские. И плюс есть у нас письмо отдельное про очистку данных. Когда тебе черт-те что отдали. 

«Эксель», гугл-таблицы, данные — это круто

ПФ: Что такое очистка, расскажи? 

СА: Представь себе, у тебя есть база вакансий. Ты эйчар, тебе сыпятся резюме, и у тебя там 1000 строк табличка, где люди резюме прислали, когда гугл-форму заполнили. Ты получил, таблица сформировалась. У тебя в графе «‎возраст» один человек написал цифрами «‎17», другой словами «‎семнадцать», третий «‎семьнадцать» — словами, с опечаткой. 

ПФ: Еще один написал «‎1989 год рождения»…

СА: Совершенно верно. И тебе, чтобы потом сортировать, смотреть, нужно все в единый вид привести. Приведение в единый вид называется «очисткой данных». Чтобы машина хотя бы штатными средствами «Экселя» могла отсортировать все по убыванию. Для начала тебе нужно это все привести в машиночитаемый вид. Чтобы везде было «‎17» цифрой. И что-то из этого придется делать руками, конечно. Но очень многое можно сделать внутренними сервисами, которые есть в «Экселе» или гугл-таблицах.

ПФ: Короче, «Эксель», гугл-таблицы, данные — это круто. 

СА: Я работаю в гугл-таблицах», потому что так удобнее. Но, по сути, это то же самое, что и «Эксель» — они на 99% одинаковые. Может быть, названия кнопок могут различаться. 

ПФ: Окей, Сергей, спасибо. Мне кажется, я подразобрался. Несмотря на то что продюсировал эту рассылку, я не до конца понимал, насколько это правда полезно. А с учетом того, что я менеджер из диджитала, который постоянно делает отчеты, смотрит графики и страдает от этого, кажется, стоит вчитаться. Вот так Сергей понял, что я не все прочитал до сих пор. Кажется, он меня накажет. 

СА: Паша, я думаю что надо слушателям два посыла дать. Один наш такой корыстный — что надо подписаться. А во-вторых, например, если вы не хотите по каким-то причинам этого делать — денег жалко, например, или мы с Пашей вам не нравимся лично, или просто не хотите, тогда мы просто в описание подкаста положим всяких полезностей и просто качайтесь в этом направлении. Потому что как у профессионального корректора идет кровь из глаз, когда он видит ошибки в объявлениях на столбе или на вывеске, так у людей, которые прокачались в инфографике, идет кровь из глаз, когда они видят некрасивый график. Но это такая приятная боль. 

ПФ: Я подтверждаю. Потому что, когда я собрал табличку с данными, сколько мы заработали денег на этой рассылке, Сережа пришел, сказал «‎бля» и пошел все исправлять. 

СА: В общем не корысти ради, а пользы великой для. 

ПФ: Спасибо большое. В первом выпуске нового сезона мы поговорили о том, зачем людям, которые работают с текстами, с буковками, гуманитариям, нужны данные. С вами был я, Павел Федоров. И наш гость, Сергей Антонов. Сережа, пока. 

СА: Пока-пока. 

Подписаться на рассылку можно здесь.

Подкаст
Поделиться
Отправить
Поделиться