Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Пять стратегий укрощения данных (1)

14, октябрь 2015  — 

Блог Майка Флэннагана ( Mike Flannagan ), вице-президента и генерального менеджера подразделения компании Cisco , занимающегося аналитикой данных

Все мы знаем, что объемы данных растут лавинообразно и что теперь данные находятся буквально всюду. При отсутствии соответствующей стратегии они могут выйти из-под контроля, хотя укрощенные данные — ключ к важнейшей аналитической информации, которая может помочь увеличить продажи, улучшить обслуживание заказчиков и сэкономить немало денег.

К сожалению, в реальной жизни не существует супергероя-аналитика, способного одним движением пальца превратить данные в полезную информацию. А между тем при наличии соответствующей ИТ-стратегии данные могут многое!

Итак, предлагаю пять способов укрощения данных.

Логичный выбор хранилища

Я постоянно общаюсь с заказчиками, которые тратят немалые средства на наращивание емкости своих корпоративных хранилищ ( enterprise data warehouses , EDW ), где по традиции хранятся все данные. Один из них посетовал: мол, на поддержку одного терабайта данных в EDW уходит 100 000 долларов в год, тогда как использование Hadoop обходится всего лишь в 1000 долларов. Ничего себе разница! Реализация решений по выгрузке редко используемых данных из корпоративного хранилища на Hadoop высвобождает ресурсы, которые можно использовать в стратегических целях. Да, теперь данные распределены, но ничего страшного в этом нет, т.к. программное обеспечение интеграции данных создает единый вид, представляя их так, как если бы они хранились в одном и том же месте.

Автоматизация процессов обработки данных

Чтобы бизнес-менеджеры организации могли делать свою работу, им необходима аналитика. ИТ-подразделение Cisco разработало аналитическое решение, которое ежедневно обрабатывает полтора миллиарда записей о заказчиках, помогая сбытовому подразделению выявлять потенциальных покупателей. Чтобы выдать необходимую информацию, ИТ-подразделение должно скоординировать множество задач обработки данных, поступающих от разных приложений и других источников. Если делать это вручную, потребуется слишком много времени и денег. С помощью же инструментария автоматизации рабочих задач все необходимые приложения, процессы и системы подключаются и автоматизируются, что упрощает оркестровку и позволяет осуществлять контроль с единой панели управления.

Выполнение анализа вблизи источника

По традиции, чтобы проанализировать данные, их перемещают в некое централизованное хранилище. При больших объемах данных, генерируемых в разных местах, такое перемещение трудоемко, дорого и требует много времени. Будущее за решениями, способными анализировать данные на границе, без необходимости их перемещения в центр. Те организации, которые станут анализировать данные на границе сети (то есть там, где они генерируются), смогут быстрее принимать необходимые решения.

Объединение источников данных

Дополнение аналитики на границе ( Wi - Fi , видео и т.д.) анализом архивных данных способно улучшить качество принимаемых решений на разных уровнях организации — локальном, региональном и даже глобальном. Например, менеджер локального магазина может делать заказ на пополнение складских запасов, ориентируясь как на наличие товара, так и на характер прошлых продаж. На региональном и глобальном уровнях, где есть доступ к данным о складских запасах и продажах по всем магазинам плюс архивные данные о характере продаж, организация сможет принять решение либо увеличить производство определенных наименований, постоянно распродаваемых со склада, либо снизить цены в интересах повышения продаж.

Предоставление бизнес-пользователям возможности самообслуживания

Никого не удивляет, что данные, поступающие из разных источников (датчики, документы, веб, базы данных), имеют разный формат. Прежде чем задать программной системе какой-либо вопрос, эти данные необходимо очистить и привести к виду, понятному системе. Обычно эта работа выполняется специалистами по обработке данных и занимает немалую долю их рабочего времени. К счастью, существуют такие приложения, как Data Preparation , которые устраняют барьеры на пути бизнес-аналитиков. Такие приложения автоматизируют самую трудную работу по очистке, объединению и концентрации данных без необходимости привлечения специалистов для кодирования и написания сценариев.

О компании Cisco

Cisco, мировой лидер в области информационных технологий, помогает компаниям использовать возможности будущего и собственным примером доказывает, что, подключая неподключенное, можно добиться поразительных результатов.

Чистый объем продаж компании в 2015 финансовом году составил 49,2 млрд долларов. Информация о решениях, технологиях и текущей деятельности компании публикуется на сайтах www . cisco . ru и www . cisco . com .

Cisco, логотип Cisco, Cisco Systems и логотип Cisco Systems являются зарегистрированными торговыми знаками Cisco Systems, Inc. в США и некоторых других странах. Все прочие торговые знаки, упомянутые в настоящем документе, являются собственностью соответствующих владельцев.
Публикации по теме
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
 
Новости Cisco

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.