Для чего нужна Big Data?
Что такое Big Data? Всего лишь модный тренд или удивительный феномен, способный радикально изменить мир? Давайте попробуем разобраться. И начнем с занимательных фактов.
25 невероятных фактов про Big Data
Всего за два дня мы генерируем столько же информации, сколько было создано с начала человеческой истории вплоть до 2003 года.
Свыше 90% всех данных в мире возникли в течение последних двух лет.
Ожидается, что к 2025 году объем существующей цифровой информации вырастет с текущих 3,2 зеттабайт до 40 зеттабайт.
Общий объем получаемых и хранимых бизнес-данных удваивается каждые 1,2 года.
Каждую минуту мы отправляем 204 млн электронных писем, ставим 1,8 млн лайков и загружаем 200 000 фото в Facebook, постим 278 000 твитов.
Один только Google обрабатывает в среднем около 40 000 поисковых запросов в секунду или же больше 3,5 миллиардов запросов в день.
Ежеминутно на YouTube загружается порядка 100 часов видео. На просмотр видеоконтента, загружаемого за один день, у вас бы ушло примерно 15 лет.
Пользователи Facebook ежедневно обмениваются 30 000 000 000 единиц контента!
Высота стопки DVD-дисков с данными, которые за один день генерирует человечество, превысила бы расстояние до Луны ровно в два раза.
Считается, что в AT&T в рамках одной уникальной базы данных сосредоточен самый большой объем информации. База телефонных записей AT&T достигает 312 терабайт и содержит около 2 триллионов строк.
За одну минуту в Интернете появляется 570 новых сайтов.
По оценкам экспертов, к 2025 году в американском IT-секторе будет создано около 1,9 млн рабочих мест для реализации проектов, связанных с Big Data. Каждое место в IT создаст по 3 места в смежных отраслях. Всего благодаря Big Data появится 6 миллионов новых рабочих мест.
Существующие сегодня дата-центры занимают площадь, эквивалентную площади 6 000 футбольных полей.
Компании, отслеживающие «настроения» Твиттера, сообща анализируют 12 терабайт твитов в день.
За период с 2012 по 2014 год количество данных, ежемесячно передаваемых в мобильных сетях, выросло на 81% и достигло 1,5 экзабайта (1,5 миллиарда гигабайт). 53% от этого объема приходится на видеоконтент.
Американское АНБ предположительно анализирует 1,6% мирового интернет-трафика, то есть порядка 30 петабайт данных в день.
Объем рынка Hadoop-сервисов, который на 2013 год составлял 2 миллиарда долларов США, к 2020 году достигнет отметки в 500 миллиардов.
Считается, что количество битов информации, хранящейся в «цифровой Вселенной», превысило число звезд в реальной Вселенной еще в 2007 году.
В 2014 году количество смартфонов (которые собирают и генерируют огромное количество данных) достигло 1,2 млрд единиц, и рост будет продолжаться.
Бум Интернета вещей начнется в 2020 году, когда число подключенных к Интернету приборов достигнет 50 млрд устройств. На сегодняшний день к Интернету подключено «всего» 13 млрд устройств.
В 2011 году было продано 12 млн RFID-чипов. Они используются дня получения данных и отслеживания перемещения объектов в реальном мире. К 2021 году в Интернете вещей будет зарегистрировано около 209 млрд чипов.
Big Data уже сегодня используется для прогнозирования преступлений. Проведенный в Калифорнии пилотный проект с применением анализа Big Data показал точность в 3 раза выше, чем другие методы прогнозирования.
По оценкам экспертов, использование аналитики Big Data в американской системе здравоохранения помогло бы сэкономить до 300 млрд долларов в год. Это примерно 1 000 долларов на каждого американца, включая детей.
Анализ Big Data может обеспечить ритейлу рост прибыли более чем на 60%.
К 2023 году стоимость индустрии Big Data вырастет примерно в 5 раз – до 54,3 млрд долларов США.
Big Data как она естьbig data факты 2015
Можно очень долго рассуждать о плюсах и минусах использования Big Data. Она может стать источником полезной информации или привести к возникновению неприветливой реальности. Мира, где предсказание поступков станет важнее самих поступков.
Подобные страхи не лишены оснований, но нужно понимать, что без рабочей аналитики и ее результатов Big Data – это просто куча бесполезных данных. Нам еще только предстоит научиться эффективно анализировать Большие данные и использовать результаты анализа на практике. Как мы ими распорядимся, зависит только от нас.
Так откуда такой интерес к аналитике Больших данных? Отчасти его можно объяснить потенциальной выгодой для бизнеса. Аналитика Big Data – это:
спрос на мощные, дорогие сервера и хранилища данных — для производителей компьютеров,
обмен огромными объемами информации и дополнительный приток денежных средств – для сектора коммуникаций и облачных сервисов,
больше серьезных контрактов в области разработки и применения аналитических техник – для индустрии IT-сервисов,
дорогостоящие приложения и доработки для уже существующих продуктов — для сегмента контент-менеджмента.
Изменения и потенциальные риски
Развитие механизмов аналитики Big Data изменит привычные роли покупателя и продавца. Раньше мы делали покупки, основываясь на знаниях или представлениях о потенциальном продавце. В будущем продавец будет влиять на поведение покупателя, исходя из информации о потенциальном клиенте. На смену работе с массовой аудиторией придет адресная коммуникация.
Выбор конкретных методов и каналов будет зависеть от данных аналитики. Похожее таргетирование используется и сегодня, но благодаря Большим данным оно станет в разы эффективнее. Миллиардные рекламные бюджеты пойдут на сбор и анализ информации о покупателях. Компании захотят превзойти соперников: собрать как можно больше данных и научиться как можно точнее их анализировать.
К сожалению, погоня за данными способна спровоцировать чрезмерно назойливое поведение со стороны «исследователей». Вероятно, возникнет целая индустрия по «отмыванию» и продаже информации, полученной не совсем легальными способами. Чем больше данных будет собираться и агрегироваться, тем шире станет рынок киберпреступлений. Расширятся и возможности хакеров, так как стоимость информации будет только расти.
Следующие на очереди – правительства, государственные и окологосударственные организации. Слишком велик соблазн использовать аналитику Big Data в прогнозировании поведения людей. Рост стоимости медстраховки из-за наличия реальных вредных привычек – это цветочки. Представьте, что страховая начнет отслеживать всю вашу повседневную активность, проанализирует ее и пересмотрит риски, а значит и выплаты – в большую сторону.
Что делать?
Мы стоим на пороге масштабных перемен. В какую сторону будет развиваться мир после появления более-менее серьезной Big Data аналитики, предсказать невозможно. Главное – понимать, что он изменится очень серьезно. Вряд ли оправдаются оптимистические планы сторонников Больших данных, равно как и апокалиптические видения крайних пессимистов. Мы действительно не знаем, к чему нам готовиться.
Что касается компаний, которые хотят применять аналитику Big Data в маркетинге, им можно посоветовать тактику «осторожного продвижения». Существует такой уровень анализа данных, который позволяет повысить продажи и доходность бизнеса без ущерба интересам потенциальных клиентов. Для этого как раз не нужно сильно углубляться в анализ Big Data. Посмотрите на Amazon, который отлично делает свое дело, рекомендуя дополнительные товары на основе предыдущих покупок. Следуя афоризму Уильяма Оккама, выбирайте самые простые решения.