Как методы анализа данных в IT могут помочь в понимании мира вокруг?
В современных организациях для агрегации данных используют специализированные ИТ-системы: хранилища данных (data warehouses) и/или озера данных (data lakes). Принципиальное отличие этих систем в том, что в хранилища данные попадают уже преобразованные и структурировнные, а в озёрах собираются "сырые" данные, которые структурируются и анализируются уже позже.
Весь мир вокруг нас - это же тоже хранилище данных, только вот вопрос, это data lake или data warehouse? ;)
Подумал, что причина многих проблем в том, что мы, выражаясь по аналогии с IT-системами, считаем мир вокруг нас хранилищем данных, хотя по факту он больше похож на озеро данных. Мы часто считаем, что та структура, через которую мы смотрим на мир вокруг, и есть этот мир. Путаем реальность и описание реальности. Хотя окружающий мир - это больше чем те кусочки, на которые мы его “нарезаем”.
А потом, бывает, удивляемся, что жизнь скучная и однообразная. Хотя проблема часто не в жизни, а в том, что мы прогоняем все данные через одну и ту же “скучную” структуру у себя в голове, считая, что эта структура и есть жизнь.
В конце 19 века, говорят, университетский преподаватель отговаривал будущего основоположника квантовой физики Макса Планка связывать будущее с теоретической физикой. Там, мол, все уже известно, осталось уточнить детали. А спустя годы Планк заложил основу для понимания мира на совершенно новом уровне.
В общем, мир - это не хранилище данных с набором реляционных баз данных, а безграничный data lake. И, думаю, мы все подсознательно понимаем это - только при разных обстоятельствах. Кто-то - видя солнце на закате и бескрайнее небо над ним. Кто-то - удивляясь глубине и универсальности физической формулы. Кто-то - смотря на великое сооружение, которое смог создать человек.
https://t.me/vinyavskii_stories