Сегодня важно не только правильно сформулировать бизнес-задачу по анализу данных, но и обеспечить ее простую и быструю техническую реализацию.
Более 90% участников опроса сталкиваются с задачей анализа больших данных, при этом задача анализа новых источников встает перед ИТ-подразделением как минимум раз в месяц (27%), а в некоторых случаях – несколько раз в месяц (32%), таковы данные свежего исследования «Аналитика больших данных как инструмент бизнес-инновации», проведенного компанией IDC совместно с Hitachi Vantara среди руководителей ИТ-департаментов, представителей бизнес-подразделении и специалистов по работе с данными крупнейших российских организаций со штатом сотрудников не менее 500 человек.
Анализ информации из новых источников необходим вследствие потребности бизнеса улучшать существующие процессы и выводить на рынок новые товары и услуги. Большое количество информации содержится в неструктурированном виде и это задача, которую компании частично научились решать – например, проводить анализ социальных сетей или видеопотоков с камер. При этом количество анализируемой информации будет только увеличиваться – взрывной рост объемов данных уже отмечают 78% из числа опрошенных. «Основным источником роста как структурированных, так и неструктурированных данных является сама компания, — отмечает Алексей Никифоров, технический директор Hitachi Vantara. – Это внутренняя переписка, в том числе с партнерами, оцифровка документов, работа таких систем, как ERP, CRM, SCM, HR, ECM. Для промышленных предприятий актуален сбор данных с различных датчиков и устройств».
Для большинства респондентов (45%) актуальна задача дополнения транзакционных данных другими источниками информации. Интеграция данных транзакционных систем и неструктурированного контента позволяет получить более точную информацию о бизнес-процессах, клиентах, продуктах и услугах. Анализ дополнительной информации крайне важен для учета рыночных рисков, анализа конкурентов и обмена разнородной информацией в экосистеме партнеров и заказчиков. Для эффективного анализа данных необходимо объединить источники и представить их на единой платформе пользователям, которые будут извлекать из них ценную информацию. Единая платформа должна позволять значительно сократить время на подготовку данных к анализу, давать аналитикам данных возможность работать с готовыми наборами данных (datasets), обеспечивать рост пользователей аналитических решении в компании. Благодаря наличию такой платформы должно улучшиться взаимодействие между различными подразделениями внутри компании и с партнерами за счет доступа к единому набору данных. Вследствие роста цифрового взаимодействия стоит ожидать и ускорение цифровой трансформации компании.
Большинство респондентов опроса отметили необходимость единого доступа к информации, которую можно использовать для внутренних и внешних аналитических задач. Существующие на рынке решения позволяют добавлять новые источники информации, но 93,1% компаний отмечают, что не могут подключать новые источники без привлечения ИТ–специалистов. Существующая архитектура решений требует частичного привлечения ИТ-специалистов в 57% компаний; значительного – в 34% компаний. При этом в 2% компаний действующая на данный момент архитектура решений в принципе не позволяет подключать новые источники информации.
«Компания сохраняет свое место на рынке и повышает конкурентоспособность, когда она быстро реагирует на рыночные изменения. В современных условиях это возможно, если компания обладает знаниями, которые содержит в себе информацию, релевантную для ее деятельности. Правильная постановка бизнес-задачи по анализу данных — безусловно, ключевая составляющая процесса аналитики больших данных, но нельзя сбрасывать со счетов и необходимость простой и быстрой технической реализации этой задачи, – комментирует Елена Семеновская, директор по исследованиям IDC в России и СНГ. – Возможность подключения новых источников анализируемой информации без помощи ИТ-специалистов сделает процесс анализа данных более эффективным и простым для растущего числа сотрудников, работа которых включает обработку информационного потока».
Источник