News

Публикации
	2023 г. – новый этап практического применения CXL, статья
	VMware сдвигает акцент в проекте Capitola на CXL, статья
	Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
	OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
	Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
	UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
	Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
	GigaIO: CDI_решение на базе AMD для высшего образования, статья
	Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
	От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
	EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
	LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
	End-to-end 64G FC NAFA, статья
	Computational Storage, статья
	Технология KIOXIA Software-Enabled Flash™, статья
	Pavilion: 200 млн IOPS на стойку, статья
	CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
	Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
	Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
	SmartNIC – новый уровень инфраструктурной обработки, статья
	Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
	Compute, Memory и Storage, статья
	Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
	Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
	Intel® Agilex™ FPGA, статья
	Weka для AI-трансформации, статья
	Cloudera Data Platform – “лучшее из двух миров”, статья
	Fujitsu ETERNUS DSP - разработано для будущего, статья
	Технологии охлаждения для следующего поколения HPC-решений, статья
	Что такое современный HBA?, статья
	Fugaku– самый быстрый суперкомпьютер в мире, статья
	НРС – эпоха революционных изменений, статья
	Новое поколение СХД Fujitsu ETERNUS, статья
	Зональное хранение данных, статья
	За пределами суперкомпьютеров, статья
	Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
	Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
	DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
	IPsec в пост-квантовую эру, статья
	LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья

Обзоры
	Все обзоры в Storage News

Тематические публикации
	Flash-память
	Облачные вычисления/сервисы
	Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
	Современные СХД
	Информационная безопасность (ИБ), борьба с мошенничеством
	Рынки

Компания Think Big, входящая в корпорацию Teradata, расширяет возможности построения «озер данных» с помощью технологии Apache Spark

18, апрель 2016 — Корпорация Teradata ( NYSE : TDC ), ведущий поставщик решений для аналитики больших данных и приложений для маркетинга , сегодня объявила о том, что компания Think Big , международная консультационная компания, входящая в корпорацию Teradata , обладающая передовым опытом внедрения Apache Spark ™ и других технологий для работы с большими данными, расширяет свои предложения для «озера данных» и управляемых услуг, используя Apache Spark . Среда Spark представляет собой кластерную вычислительную платформу с открытым исходным кодом, которая применяется для разработки рекомендаций по использованию продукта, прогнозной аналитики, анализа данных, поступающих от датчиков, анализа графов и т .д .

Сегодня потребители могут использовать «озеро данных» с помощью технологии Apache Spark в облаке, в общих «стандартных» средах Hadoop, или в ПАК Teradata ' s Hadoop Appliance , наиболее мощной, готовой к работе корпоративной платформе, предварительно сконфигурированной и оптимизированной для работы с потоками корпоративных больших данных.

В то время как интерес к среде Spark продолжает расти, многие компании стремятся не отставать от быстрого темпа изменений и появления новых версий платформ с открытым исходным кодом. Компания Think Big успешно использовала среду Spark для построения корпоративных «озер данных» и написания аналитических приложений.

«Многие организации экспериментируют с платформой Apache Spark, рассчитывая на ее эффективное использование в отношении потоков данных, запросов и аналитики, часто в сочетании с «озерами данных», - говорит Филипп Рассом (Philip Russom), руководитель отдела исследований управления базами данных Института Хранилищ данных. – Однако пользователи быстро осознают, что платформу Spark не так просто использовать, и что «озера данных» требуют больше времени для планирования и проектирования, чем они рассчитывали. В такой ситуации пользователям необходимо обратиться за помощью к консультантам и поставщикам управляемых услуг, у которых есть опыт успешной работы с платформой Apache Spark и «озерами данных» в различных условиях. Компания Think Big обладает таким опытом».

Компания Think Big создает тиражируемые пакеты услуг для развертывания среды Spark, в качестве механизма выполнения для своих «озер данных» и управляемых услуг . При участии своего отдела обучения — Академии компании Think Big — консалтинговая компания также организовала серию новых обучающих тренингов для корпоративных клиентов о среде Spark . Эти тренинги проводятся опытными инструкторами, они помогают руководителям, разработчикам и администраторам освоить работу в среде Spark и с ее разнообразными модулями, например, машинное обучение, графы, потоки данных и запросы.

Кроме этого, отдел обработки и анализа данных компании Think Big предоставляет бесплатные подпрограммы для распределенного группирования K-Modes на основе интерфейса программирования приложений (ИПП) Python среды Spark. Данные программы улучшают объединение в группы качественных данных для сегментации клиентов и анализа оттока клиентов. Этот код будет доступен вместе с другими бесплатными приложениями компании Think Big на странице GitHub .

«Компания Think Big быстро расширяет свою консультационную деятельность из Америки по всей Европе и Китаю благодаря тому, что существует потребность в знаниях, опыте и методиках, способных помочь компаниям создавать «озеро данных» с помощью правильного первоначального применения среды Spark и платформы Hadoop, - утверждает Рон Бодкин (Ron Bodkin), президент компании Think Big. – Развертывание среды Spark должно стать частью информационной и аналитической стратегии. Мы знаем на основании нашего опыта, какие сценарии использования являются уместным, какие вопросы являются правильными, и где ожидать отрицательного влияния на развертывание. Мы понимаем ожидания корпоративных пользователей, а также технологические требования. Мы можем помочь в создании значительной коммерческой ценности, и пользователи среды Spark уже достигают этого в таких сферах деятельности, как многоканальная персонализация потребителей и обнаружение неисправностей в реальном времени в высокотехнологичном производстве».

Задолго до всплеска ажиотажа вокруг больших данных, компания Think Big уже была ведущей в мире компанией, предоставляющей услуги в сегменте больших данных и внедряющей аналитические решения на основе новейших технологий. Сегодня компания Think Big предоставляет управляемые услуги для платформы Hadoop в области поддержки платформ и приложений с четко определенными процессами, надежными инструментами и располагает опытными профессионалами в области больших данных для доступного управления, осуществления контроля и обслуживания платформы Hadoop. Приступая к любому заданию с четко определенными процессами передачи, компания Think Big оценивает и совершенствует работу отделов материально-технического обеспечения производства и перспективного проектирования клиента, что ведет к успешному эффективному развертыванию среды.

Ссылки на новости по теме

• Поддержка сервисных функций среды SPARK , компания Think Big: дополнительная информация- на сайте компании Think Big

• Корпорация Teradata признана лидером в отчете Gartner Magic Quadrant в 2016 г. в сегменте организации хранилищ данных и решений по управлению данными для аналитики – С отчетом можно ознакомиться здесь

О Teradata

Teradata ( NYSE : TDC ) помогает компаниям извлекать максимальную пользу из накопленных данных. Передовое портфолио Teradata в сегменте аналитических решений по анализу больших данных, интегрированных маркетинговых приложений и сервисов помогает организациям получить устойчивое конкурентное преимущество на основе работы с бизнес-данными. Посетите сайт teradata . com .

Публикации по теме
	Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных

	Новости Teradata