Публикации
Защита высокоскоростного Ethernet WAN, статья
Pure Storage: платформа хранения для клауд эры, статья
Резервное копирование как основной компонент информационной безопасности, статья
Гиперконвергентная система AERODISK vAIR, статья
Big Data Flash – новый сектор AFA, статья
AI – следующая волна компьютеризации, статья
Veritas Access: программно-определяемое хранилище для неструктурированных данных, статья
Brocade Fabric Vision: новые возможности , статья
Cisco: машинное обучение для ИБ, статья
Рынок серверов: первое положительное полугодие после четырех с половиной лет снижения поставок, новость
Toshiba представляет однокорпусные SSD-диски на основе 64-слойной 3D флеш-памяти, новость
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Технологии ИСП РАН изменят лицо Интернета

13, март 2017  — 

Технологии “Талисман” и “Текстерра”, разработанные Институтом Системного Программирования РАН, способны изменить лицо глобальной информационной сети Интернет. Эти разработки предназначены для анализа больших массивов данных социальных сетей.

“Текстерра” – технология многоязычного интеллектуального анализа текста. В ее основе – программный комплекс, способный накапливать и анализировать информацию, устанавливать взаимосвязь между понятиями и проводить интеллектуальный анализ текстов. При этом “Текстерра” опирается на объем понятий и терминов, почти на порядок превышающий размеры Британской энциклопедии, и может при необходимости расширить свою базу знаний еще больше. В результате при использовании этой технологии возможно вычислять лексически сходные тексты, принадлежащие перу одного автора или написанные по единому плану, содержащие сходные семантические конструкции, и, таким образом, выявлять факт и структуру информационных “вбросов”.

Система “Талисман”, в свою очередь, позволяет отследить и выявить фиктивные аккаунты, служащие для распространения недостоверной информации, спама, имитации массовой активности – ботов. Анализ производится по полным и неполным данным, указанным в профилях социальных сетей, социальным связям аккаунтов, подпискам, спискам друзей и читателей. В результате анализа определяются такие демографические атрибуты, как возраст пользователя, а также семейное положение, уровень образования и так далее. Если значения тех или иных атрибутов не вписываются в создаваемый программным комплексом алгоритм, можно с серьезной долей уверенности говорить о том, что выпадающий из схемы профиль социальной сети принадлежит не живому человеку, а создан искусственно. Дальше приходит на помощь “Текстерра”, позволяющая вычислить множества ботов, созданных одной рукой либо ведущихся по одному лекалу-методичке.

Также технология “Талисман” позволяет на основании анализа неполных данных с использованием информации из социальных сетей вычислить примерное место проживания пользователя, его принадлежность к определенному социальному слою, приверженность той или иной идеологии и другую полезную информацию.

“Анализ такого постоянно меняющегося массива данных, как информация в соцсетях, сегодня – насущная необходимость, – отмечает директор ИСП РАН Арутюн Аветисян. – Это и маркетинговый инструмент, позволяющий оценивать аудиторию, выстраивать закономерности, помогающие работать адресно с разными возрастными и социальными группами. И во многом – инструмент безопасности. В последние десятилетия неограниченная интернет-анонимность стала источником угрозы для отдельных людей или компаний, для целых народов и стран. Работа в этом направлении способна в корне изменить ситуацию”.

Важным, по мнению директора ИСП РАН, является также этический аспект применения разработок института, сохранение тайны личных данных и неприкосновенности частной жизни.

“При применении подобных технологий необходимо, чтобы не нарушались права пользователей социальных сетей, не разглашались персональные данные”, – уточнил Денис Турдаков, заведующий отделом Информационных систем ИСП РАН. – Мы проводим научные исследования, дорабатываем “Текстерру” и “Талисман”. Всеобъемлющий анализ соцсетей пока затруднен, прорыв еще предстоит, но ждать его осталось недолго”.

В настоящий момент совершенствование этих программных комплексов продолжается, наращивается их функционал и мощность. В недалеком будущем внедрение разработок такого рода может серьезно изменить лицо глобальной информационной сети и культуру Интернет-общения.

Справка

Институт системного программирования Российской академии наук (ИСП РАН) – научно-исследовательская организация, специализирующаяся в области системного программирования. Институт разрабатывает технологии мирового уровня в таких областях, как операционные системы, компиляторные технологии, параллельные и распределенные вычисления, технологии верификации и тестирования программного обеспечения, анализ и обработка больших объемов данных, семантический поиск и др. Среди долговременных отечественных партнеров Института – ГосНИИАС, Вымпелком, Квант, Орион, среди зарубежных – Samsung, Huawei, Dell EMC , HP E , Intel, Nvidia, RogueWave, LinuxFoundation. Со многими из них созданы совместные лаборатории.

Одна из главных задач ИСП РАН – подготовка кадров высшей квалификации в сфере ИТ. На базе Института функционируют собственная аспирантура и кафедры в МГУ, МФТИ и ВШЭ. Также ИСП РАН реализует совместные проекты с ведущими университетскими и исследовательскими центрами: Кембридж (Великобритания), Карнеги-Меллон (США), INRIA (Франция), Университет Пассау (Германия) и др.

Публикации по теме
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
 
Новости ИСП РАН

© "Storage News" journal, Russia&CIS
Редакция: 115516, Москва, а/я 57; тел./факс - (495) 233-4935;
www.storagenews.ru; info@storagenews.ru.