Большие мира сего
Подобно тому, как в соответствии с теорией относительности с приближением к скорости света увеличивается масса тела, объемы цифровых данных с приближением к 100 Тбайт обретают вес и смысл. Примерно 20% от общего объема данных представляет практический интерес, вместе с расшифровкой ценнейшей информации об экономике, социологии, экологии, науке и формирует сферу Big Data ( Больших Данных).
Подобно тому, как в соответствии с теорией относительности с приближением к скорости света увеличивается масса тела, объемы цифровых данных с приближением к 100 Тбайт обретают вес и смысл. Миллиарды событий каждую секунду становятся частью глобального цифрового океана, характеризуя вкусы, намерения, финансовую состоятельность, социальное положение пользователей интернета, но это лишь верхушка айсберга. Основная часть автоматически генерируется системами наблюдения, умными датчиками, сенсорами, RFID-системами, спутниками и т.д. Примерно 20% от общего объема данных, представляет практический интерес, этот огромный пласт вместе с расшифровкой содержащейся в ней ценнейшей информации об экономике, социологии, экологии, науке формирует сферу Big Data ( Больших Данных). Выявление закономерностей и обработка поисковых запросов, видео, транзакций, блогов, текстовых документов, геоданных посредством математического моделирования в режиме реального времени выдает качественно новые знания о процессах, регулирующих рынки сбыта товаров и услуг, недвижимости, полезных ископаемых. Оценка эффективности энергопотребления, развитие транспортной и социальной инфраструктуры, изучение видео с камер наблюдения, геоаналитика дополненные историческими данными дают мощный механизм для прогнозирования природных, социальных, экономических явлений и поиска оптимальных решений в проблемных участках. Многие отрасли уже давно используют предиктивные возможности Big Data, в некоторых эта сфера только начинает развиваться. Перспективы есть даже в пространстве шоу-бизнеса - там были аналитически просчитаны победители конкурсов Евровидения и премии "Оскар" - со стопроцентным попаданием! Как тут не вспомнить предсказание будущего на основе вымышленной науки - психоистории в трилогии Айзека Азимова .
В общем случае Big Data – это одновременно и Большие Данные, и инструменты для работы с ними (Data Science). В соответствии с парадигмой четырех V (Volume, Variety, Velocity и Value) перед специалистами Big Data стоят нетривиальные задачи в области создания математических алгоритмов для выборки и анализа пула данных, для чего необходимы сверхмощные вычислительные ресурсы и высокопроизводительные сети.
Основные направления работы с Big Data:
-
Хранение данных из разных источников и в разных форматах (Data Lake)
-
Предварительная обработка или структурирование
-
Интеллектуальный анализ для выявления закономерностей (Data mining)
Анализ Больших Данных несет прибыль не только корпорациям в их конкурентной борьбе за целевую аудиторию и рынки сбыта, приобретение качественно иных знаний о поведенческих механизмах человека, природных явлениях, рыночных отношениях открывает принципиально новые горизонты для человечества в целом. Выявление и предотвращение терактов и преступлений бытового характера, локализация эпидемий, диагностика и персонализированные клинические решения, эффективное использование сельскохозяйственных площадей, предсказание природных катаклизмов – все эти возможности Больших Данных дают человечеству потенциальную надежду на мир без катастроф, голода и болезней.
Компания Прософт , в рамках работы с Большими Данными, предлагает проверенные стоечные решения для ЦОД с разными видами охлаждения и вычислительную базу для аналитики Big Data.