v¦bo project
Бизнес-данные
Нужно больше данных
Потоки данных
Свойства
Автор: Тюрин Владислав
Дата публикации: 09 сентября 2015
Поделиться
Файлы
Новое
Чем хороши шаблоны, условия для бизнеса на старте, как менеджеры теряют время,...
Как работать по 12 часов в день, какая экономика может себе позволить инновации,...
Абсолютная экономическая эффективность, как статистика измеряет прошлое, ещё...
Поиск
c l i c k ! m e
В публикации рассматривается понятие больших данных с точки зрения потребностей и возможностей бизнеса. Сфера внедрения технологий, основанных на больших данных, обширна. Но именно для бизнеса стоит насущная проблема их обработки исходя из экономической целесообразности и извлечения практической выгоды от больших и разнородных объемов данных. Цель публикации дать представление о больших данных и аналитики, рационального их применения в бизнес среде.

Big managed data

Большие данные – это большой потенциал для бизнеса. Их сбор, хранение, обработка, аналитика требуют внушительных усилий и расхода ресурсов. И это нужно для того, чтобы делать меньше ошибок, и чтобы минимизировать последствия сделанных ошибок. Иными словами, управление большими данными имеет главной целью принятие качественных решений.

А что значит управлять большими данными? Это весьма специфичный ресурс для бизнеса, нуждающийся в пристальном профессиональном внимании и последовательном изучении. Большие данные призваны решать серьезные проблемы и к ним предъявляются повышенные требования. Они должны быть управляемыми, т.е. понятны и готовы к обработке, анализу, форматированию, хранению, мониторингу, представлению. Чтобы стать управляемыми и полезными бизнесу, данные необходимо собирать, структурировать, классифицировать и сохранять.

Разберемся в природе больших данных и попробуем понять, что необходимо, для того чтобы иметь «большие управляемые данные».

Потоки данных

Большие данные обязаны своим появлением и укреплением позиций в мире бизнеса возросшему потоку цифровой информации. В значительной мере её избыток и неизбежность управлять таким потоком заставили задуматься о том, как это сделать наиболее рационально. С другой стороны, очевидные потребности компаний в получении дополнительной информации о рынках, потребителях, конкурентах, работниках, конъюнктуре приводят к поиску новых источников информации. Не стоит забывать, что появилось множество вариантов прямого сбора, в том числе регистрации широко спектра параметров и сведений, которые раньше отсутствовали. Взять хотя бы регистрирующие датчики в мобильных устройствах.

Расширяющиеся инструменты фиксации в различной цифровой и аналоговой форме – это тоже регистрация состояния, которое считывается, сохраняется и обрабатывается. Возросшее количество устройств сформировало сеть цифровых регистраторов, генерирующих гигантские объемы данных. Интенсивно развивающийся «интернет вещей» увеличит массивы обрабатываемых и хранимых данных. Не забудем и о том, что создают большие данные как непосредственно пользователи, так и цифровые устройства самостоятельно по заложенным алгоритмам. Наблюдая плотные потоки информации бизнес видит в них определённые преимущества и хочет ими воспользоваться на законных основаниях.

Феномен больших данных – это не столько результат увеличения некоторой информации в окружающем мире, сколько умение и способность собирать всё больше и больше информации из окружающего мира. Ещё «вчера» управляющий супермаркета вынужден был поставить работника на входе, чтобы считать посетителей для оценки популярности его заведения. А уже «сегодня» он снимает данные о движении посетителя по торговому залу и формирует оптимальный поток покупателей. Возможно ли будет «завтра» прогнозировать время визита конкретного потребителя и его покупки в «умном» торговом пространстве с индивидуальными предложениями и сервисом? Но это не результат какого-то революционного изменения объемов информационного пространства – это результат повышения «плотности» собираемых данных.

Плотность регистрируемых данных – объем данных собираемых об одном объекте (событии, процессе, явлении). Повышение плотности данных – это увеличение объема данных собираемых об одном объекте (событии, процессе, явлении).

Особенность фиксации и регистрации цифровых данных – это дискретность. Каждый конкретный сбор данных – это отдельное событие, в определенной степени независимое от других подобных. Из-за этого набор собираемых данных в каждом событии сбора конечен. Как правило такой набор данных существует в рамках поставленной задачи и зависит от инструментов и методов регистрации. Допустимо говорить о регистрации состояния объекта (события, процесса, явления), как о формировании некоторого набора данных на заданный момент времени. Временные факторы сбора данных о состоянии имеют особое влияние, и они учитываются наравне со множеством других.

Нарастающий объем фиксируемых, собираемых, хранимых, обрабатываемых данных формирует их потоки. Производительность некоторых видов устройств, обильно генерирующих данные, создает проблемы массового обмена данными и их «упаковывания» в некие общие информационно-транспортные каналы или в производительные контейнеры хранения.

Весомая проблема потоков данных – их слабая структурность и связанность.

Скачайте полную версию публикации и дополнительные материалы
по ссылкам в разделе 'Файлы' в левой части страницы.