«Уклон в новизну»: как гигабайты информации убивают историю

Известно, что 90% информации было создано за последние несколько лет. Впервые об этом заговорили в 2013 году. Объем доступной человеку информации увеличивается с каждой секундой. Теряясь в потоке музыки, новостей, чужих фотографий, мы забываем то, что происходило с нами вчера.

«Уклон в новизну»: как большие объемы информации убивают прошлое

Каждые два года на протяжении последних трех десятилетий мировой объем данных увеличивается примерно в 10 раз. Представьте, что вы рассматриваете свой альбом, содержащий ваши фотографии с рождения и до 18 лет. Допустим, у вас всего две фотографии за первые два года жизни. Учитывая темпы увеличения количества информации, пропорциональные увеличению объемов мировых данных, за возраст с 6 до 8 лет у вас будет 2 тыс фотографий, 200 тыс – в возрасте с 10 до 12, и наконец 200 млн – с 16 до 18. Это подразумевает, что вы должны были бы делать более 3 фотографий каждую секунду последних двух лет.

Конечно, данная аналогия не совсем точно передает ситуацию с большими данными, однако отражает суть проблемы темпов роста их объема. При анализе информации, подобной описанной в этом примере, становится ясно: чем дальше в прошлом будут находиться данные, тем меньше значения им будет придаваться. Учитывая объемы предшествующих данных, это очевидно: 90% информации было создано только за последние несколько лет.

Именно эта проблема больших данных сейчас анализируется и изучается. Как только вы начнете просматривать информацию в обратном порядке в поисках более долгосрочной картины, вы тут же заметите огромную разницу в количестве новых и старых данных. Такая "близорукость" является частью нынешней структуры, формирующей тенденцию к переоценке последних данных во вред исторической точности.

Чтобы понять всю важность этой проблемы, можно воспользоваться уже разработанными выводами ученых социологов о так называемом "уклоне в новизну" (recency bias), которые описывают тенденцию предполагать, что будущие события будут схожи с недавним опытом. Это вариация уже известной психологам эвристики доступности – предрасположенности основывать свое мышление непропорционально, больше склоняясь к тому, что быстрее и легче приходит на ум. Например, взяв в расчет лишь похолодание нескольких последних сезонов, вы можете предположить, что климат вашей местности становится холоднее. Однако на деле этот вывод может быть основан только при достаточно глубоком анализе температур прошлых лет. В реальности же мы все склонны к подобным суждениям.

Такой же процесс принятия решений наблюдается в более сложных жизненных ситуациях – в экономике, на фондовых рынках, при расчетах успешности компании, в отношениях и, конечно, политике. Краткосрочные анализы не только неточны – они чрезвычайно бесполезны и могут вводить в заблуждение. Кроме того, не стоит забывать, что степень новизны является важным фактором при решении, какую информацию сохранить, а от какой лучше избавиться. Удалить старое и сохранить новое – такова главная тенденция современного цифрового мира, например, постоянно обновляемые поисковые алгоритмы запрограммированы на предпочтение свежей информации.

Предпочтение нового запрограммировано в структуре почти всех окружающих нас технологий, что отчасти базируется на нашем потребительском отношении, привычке менять свой, когда-то "блестящий", автомобиль каждые 5 лет.

Конечно, очевидным решением может быть стремление более тщательно хранить информацию, учитывая какой малый ее объем может продержаться дольше нескольких лет. Однако более важно определить, какая информация стоит хранения, а какую необходимо забыть. Необходима своего рода система "интеллектуального забвения": разработать функцию наших технологий избавляться от большей части недавнего прошлого с целью сохранить целостность общей картины. Такой процесс схож с составлением фотоальбома, но с применением математического подхода. Можно привести множество примеров данных, состоящих из простейших элементов, которые в совокупности имеют наибольшую ценность – последовательности генов, демографические данные, география, физика и т.д.

Либо мы тщательно выбираем сохраняемые данные, которые важны и отражают наше уходящее прошлое, либо их след постепенно будет вытеснен объемами данных в настоящем.

Оригинал статьи

Комментарии