Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Новая технология Fujitsu на базе Искусственного интеллекта Wide Learning обеспечивает высокоточное обучение даже при несбалансированном наборе данных

4, октябрь 2018  — 

Fujitsu Laboratories Ltd. объявила о разработке Wide Learning, технологии машинного обучения, способной принимать точные решения даже в условиях отсутствия необходимого объема данных.

Искусственный интеллект (ИИ) в настоящий момент используется в различных областях, но точность ИИ может быть достаточно низкой в тех случаях, когда объем анализируемых данных недостаточен или несбалансирован. Технология Wide Learning компании Fujitsu позволяет принимать более точные решения по сравнению с используемыми ранее разработками, а процесс обучения становится более равномерным даже тогда, когда анализируемые данные не сбалансированы. Высокие результаты работы достигаются за счет того, что технология извлекает гипотезы с высоким уровнем важности, собирая большой набор гипотез, образованных всеми комбинациями элементов данных, и затем контролирует степень влияния каждой гипотезы на основании перекрывающихся близких гипотез. Кроме того, т.к. гипотезы записываются в виде логических выражений, специалисты также могут понимать причину того или иного решения.

Новая технология Wide Learning компании Fujitsu позволяет использовать ИИ даже в таких областях, как медицина и маркетинг, когда данные, необходимые для принятия решения, отсутствуют в нужном объеме.

За последние годы ИИ-технологии нашли применение в самых разных областях, включая медицину, маркетинг и сферу финансов. Предполагается, что в будущем будет возможно принятие решений на основе ИИ для поддержки работы и автоматизации задач в этих сферах. Однако существует одна проблема, которая препятствует развитию потенциала технологии. Она заключается в несбалансированности данных. В зависимости от конкретной отрасли, может возникнуть ситуация, когда будет трудно получить необходимый объем данных для обучения ИИ по целям, на основании которых он будет принимать решение. Это, в свою очередь, приводит к тому, что многие технологии не могут предоставить результаты обработки данных с высоким уровнем точности для последующего практического использования. Более того, основная причина, по которой сдерживается развитие ИИ, заключается в том, что даже если он обеспечивает достаточно точное распознавание, эксперты и даже разработчики не могут объяснить, почему ИИ предоставил тот или иной ответ.

Технологии ИИ на базе глубинного обучения, как правило, делают высокоточные решения за счет обучения на основе большого объема данных. Однако в реальных условиях существует множество примеров, когда необходимый объем данных отсутствует. В таких случаях технологии ИИ трудно сделать точное решение. Более того, модель машинного обучения для существующего ИИ на базе глубинного обучения представляет собой модель черного ящика, которая не может объяснить причины решений ИИ, что создает проблему с прозрачностью решений.

Таким образом, в будущем необходимо будет разработать новую ИИ-технологию, которая сможет делать точные решения на основе несбалансированных данных и будет достаточно прозрачной.

Учитывая эти требования, Fujitsu Laboratories разработала Wide Learning, технологию машинного обучения, способную делать точные решения даже в условиях несбалансированности данных.

Два основных преимущества технологии Wide Learning.

1. Она создает комбинации элементов данных для извлечения больших объемов гипотез

Эта технология рассматривает все примеры комбинаций элементов данных в качестве гипотез и затем анализирует уровень важности каждой гипотезы на основании коэффициента попаданий. Например, при анализе тенденций, кто покупает определенные продукты, система объединяет все типы примеров элементов данных для тех, кто сделал или не сделал покупки, например, незамужняя женщина в возрасте от 20 до 34 лет с водительскими правами, и затем анализирует, сколько имеется попаданий в данных тех, кто сделал покупки, когда эти примеры комбинаций взяты в качестве гипотез. Гипотезы, которые имеют коэффициент попаданий выше определенного уровня, рассматриваются как важные гипотезы и получают название « массив знания ». Это означает, что даже если объем данных недостаточен, система может извлечь все гипотезы, которые заслуживают внимания, что может способствовать открытию ранее не рассматриваемых объяснений.

Рис. 1: Составление списка гипотез и извлечение « массива знаний »

2. Она регулирует уровень влияния массивов знаний для создания точной модели классификации

Система создает модель классификации на основе нескольких извлеченных массивов знаний. В ходе этого процесса, если элементы массива знаний часто перекрываются с элементами, создающими другие массивы знаний, система контролирует уровень влияния для того, чтобы уменьшить их влияние на модель классификации. Таким образом система может обучить модель, способную выполнять точные классификации, даже если данные, отмеченные как правильные, не сбалансированы.

Например, в случае, когда мужчина, который не совершал покупки, создает большинство набора данных покупок, если ИИ обучен без контроля уровня влияния, то тогда массив знаний, который включает наличие или отсутствие водительских прав, независимо от пола, не будет оказывать большого влияния на классификацию. С помощью нового метода уровень влияния массивов знаний, включая мужской пол в качестве фактора, ограничен из-за перекрытия этого элемента, тогда как влияние меньшего количества массивов знаний, которые включают наличие водительских прав, становится больше при обучении, создавая модель, которая может правильно распределять по категориям как мужчин, так и наличие водительских прав.

Рис. 2: Настройка влияния массивов знаний при создании модели классификации

Fujitsu Laboratories провела испытание этой технологии в таких областях, как электронный маркетинг и медицина.

В результате проведения испытания с использованием эталонных данных, используемых в области маркетинга и медицины, которые были предоставлены Репозиторием UCI (UCI Machine Learning Repository ( 1 ) ), эта технология повысила точность на 10-20% по сравнению с технологией глубинного обучения. Она успешно снизила вероятность того, что система пропустит покупателей, которые с высокой долей вероятности могут подписать на услугу, или пациентов с медицинскими показаниями примерно на 20-50%. В маркетинговых данных (в испытаниях использовалось порядка 5 000 записей покупателей) только порядка 230 записей относились к покупающим заказчикам, что делало этот набор данных несбалансированным. Эта технология уменьшила количество потенциальных покупателей, не включенных в маркетинговые акции, с 120, результат анализа с помощью технологии глубинного обучения, до 74.

Более того, т.к. массивы знаний, которые составляют основу этой технологии, имеют формат с логическим выражением, способность объяснить причину принятия того или иного решения также является полезной для специалистов. Даже если определено, что в модель необходимо внести изменения по результатам новых данных, имеется возможность сделать более соответствующие правки, т.к. специалисты могут понимать причину этих результатов.

Fujitsu Laboratories в будущем продолжит использовать эту технологию для обработки задач, для которых необходимо указание причин для решений, принятых системами на базе ИИ, включая финансовые транзакции и медицинские диагнозы, и задач, связанных с редко появляющимися явлениями, включая мошенничество и выход из строя оборудования. Компания поставила перед собой задачу начать коммерческое использование новой разработки в качестве технологии машинного обучения с поддержкой проекта Fujitsu Human Centric AI Zinrai в 2019 финансовом году.

[1]  Репозиторий UCI - всемирно известный репозиторий, которые предлагает различные наборы данных для использования при оценки и сравнении технологий машинного обучения.

Ресурсы

•  Блог Fujitsu: http://blog.ts.fujitsu.com

•  Следуйте за Fujitsu на Твиттер: https :// twitter . com / Fujitsu _ RUS

•  Найдите Fujitsu на Facebook: https://www.facebook.com/fujitsu.ru

•  Медиасервер Fujitsu: http :// mediaportal . ts . fujitsu . com / pages / portal . php

•  Самые свежие новости Fujitsu: http :// www . fujitsu . com / ru / about / info - center / press / index . html

О компании Fujitsu

Компания Fujitsu – японская компания-лидер рынка информационных и коммуникационных технологий (ICT), предлагающая полный спектр технологических продуктов, решений и услуг. Около 140 000 сотрудников Fujitsu обслуживают заказчиков в более чем 100 странах мира. Наш опыт и мощь информационных и коммуникационных технологий помогают строить будущее общества вместе с нашими клиентами. Согласно опубликованным отчетам за финансовый год, завершившийся 31 марта 2018 года, совокупная выручка компании Fujitsu Limited (TSE:6702) составила 4,1 трлн. йен (39 млрд. долларов США). Для получения дополнительной информации посетите веб-сайт http://www.fujitsu.ru

Fujitsu EMEIA

Fujitsu реализует концепцию интеллектуального общества, ориентированного на человека, в котором инновации воплощаются в жизнь посредством объединения людей, информации и инфраструктуры. В Европе, на Ближнем Востоке, в Индии и в Африке (регион EMEIA) 27 тысяч высококвалифицированных сотрудников компании строят цифровое будущее, применяя свои знания в области бизнеса и цифровых технологий и создавая новые ценности совместно с партнерами. Мы помогаем нашим заказчикам вступить на путь цифровой трансформации с помощью сервисов, использующих преимущества искусственного интеллекта, Интернета вещей и облачных технологий, обеспечивая высокий уровень информационной защиты. Для получения дополнительной информации посетите интернет-страницу http://www.fujitsu.com/fts/about

Названия других компаний и видов продуктов, упомянутые в настоящем документе, являются товарными знаками или зарегистрированными товарными знаками своих законных владельцев. Данное информационное сообщение содержит сведения, которые действительны на момент публикации и могут быть изменены в любое время без какого-либо предупреждения.

Публикации по теме

ADODB.Field ошибка '80020009'

BOF èëè EOF èìååò çíà÷åíèå True, ëèáî òåêóùàÿ çàïèñü óäàëåíà. Äëÿ âûïîëíÿåìîé îïåðàöèè òðåáóåòñÿ òåêóùàÿ çàïèñü.

/news_take.asp, line 0