Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Создан прототип технологии поиска по геномным хранилищам данных

20, декабрь 2016  —  Российский R&D Центр Dell EMC создал прототип системы хранения и поиска по вариациям генотипа, важного элемента Интернета ДНК – единого облачного пространства для хранения геномной информации по всему миру. Один из компонентов, лежащих в основе решения, iResearch – выложен в открытый доступ.

Российский R&D Центр компании Dell EMC в Сколково создал прототип платформы для хранения и поиска среди различных типов данных – геномных вариантов, описаний, сделанных врачом, электронных медицинских карт, медицинских справочников и классификаторов (онтологий), постоянно растущих баз ассоциаций между геномными параметрами, симптомами болезни, результатами лечения.

Программных средств, позволяющих эффективно работать со столь различными типами данных одновременно, быстро определять прямые или непрямые связи между ними, сегодня не существует. Текущий прототип – важный шаг на пути создания такого инструмента. Элемент ядра технологии доступен по адресу: https:// github.com/iresearch-toolkit/iresearch

В результате проект предусматривает создание такой инфраструктуры, которая даст возможность врачам и исследователям находить ценную для лечения информацию, анализировать ее и обмениваться ею.

Об этом команда разработчиков центра объявила на конференции «Интернет ДНК», прошедшей 13 декабря 2016 года в Москве.

Работа прототипа была протестирована в рамках совместного проекта с центром Интегральной Диагностики Массачусетской больницы в Бостоне (Massachusetts General Hospital) и объединением Partners Healthcare. Выбор партнеров для тестового периода основывался на определенных факторах, необходимых для качественной работы платформы: наличие реального практического опыта применения генотипирования в онкологии для предсказания выживаемости пациентов и для рекомендации методов лечения; баз данных из нескольких тысяч случаев; возможности интеграции с электронными картами, чтобы отслеживать дальнейшую судьбу пациентов.

Размер тестового набора данных составляет 400 ГБ данных (2,5 тысячи образцов генома, 450 млн вариантов), достигнута скорость поиска, позволяющая отвечать в рамках секунды на запросы по индексируемым полям. Команда Dell EMC R & D продолжает работу над обеспечением надежного хранения данных, интеграцией с публичными источниками данных, а также упрощением системы для врачей , чтобы сделать ее максимально удобной.

«После успешного международного тестирования системы нам важно начать сотрудничать с российскими специалистами, клиниками, лабораториями, чтобы понимать, как мы можем адаптировать наши решения к российским реалиям», – комментирует ведущий разработчик в области биоинформатики R&D Центра Dell EMC Россия в Сколково Андрей Запарий.

Зачем генетикам понадобился собственный интернет

Ученым удалось полностью секвенировать геном человека, однако для следующего прорыва в биомедицине исследователям и клиницистам необходимо получить возможность сравнивать геномные данные пациентов с данными других людей по всему миру.

ДНК людей нашей планеты совпадает примерно на 99,9%. Однако генетическое отличие составляет всего 4-5 млн пар нуклеотидов. Разница в 0,1% при сравнении данных генома нескольких людей позволяет объяснить вероятность развития глаукомы, влияние генетических мутаций при раковых заболеваниях и много другое.

Многие генетические вариации человека относительно редки, поэтому важно рассматривать сотни, тысячи и даже миллионы человек для анализа. Прежде всего это касается онкологических и редких болезней. К примеру, мутации в генах BRCA 1 и BRCA 2 могут приводить к повышенному риску возникновения рака молочной железы. В среднем один из 800 человек имеет мутацию в одном из этих генов. Чтобы понять, какие из этих мутаций патогенны, необходимо проанализировать выборки пациентов.

Генетические данные хранятся в медицинских и научных организациях по всему миру, имеют разные форматы и структуру. Объединив всю эту информацию, ученые могут найти ключи к лечению многих болезней (Источник: презентация David Haussler , конференция «Интернет ДНК», 13.12.2016)

С 2013 года сотрудники Международного Альянса по геномике и здравоохранению (Global Alliance for Genomics and Health, GA4GH) работают над c озданием большой облачной базы геномов, которую называют «Интернет ДНК». Приглашенный на конференцию Дэвид Хаусслер, эксперт по биоинформатике Калифорнийского университета в Санта-Круз и один из основателей международного Альянса отметил, что Альянс объединяет университеты, медицинские организации, научные центры и крупнейшие IT-компании с целью создать технологическую инфраструктуру для интеграции разрозненных баз по всему миру в единую систему.

****

R&D Центр Dell ЕМС специализируется на создании решений для облачных вычислений и технологий аналитики больших данных для решения задач в медицине, биологии, других отраслях. Центр сотрудничает с российскими университетами, государственными учреждениями, российскими и международными компаниями в сообществе «Сколково». В числе партнёров московского Центра компания Parseq Lab, Санкт-Петербургский Академический университет – научно-образовательный центр нанотехнологий Российской академии наук (СПб АУ НОЦНТ РАН, Академический университет), Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ). Он также является участником Глобального альянса по геномике и здравоохранению.

Публикации по теме
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
 
Новости Dell ЕМС

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.