Рейтинг
0.00

REG.ru Хостинг

20 читателей, 499 топиков

Глубокое обучение в авиационной безопасности



Статистика несчастных случаев показывает, что около половины авиакатастроф происходят в конце полёта — во время захода на посадку и самой посадки. Одна из основных причин аварий — нерациональное использование энергии, часто приводящее к потере управления, удару хвостом о взлётно-посадочную полосу, жёсткой посадке и прочим нештатным ситуациям. В этой статье мы расскажем, как исследователи из НАСА анализируют авиационные инциденты для своевременного выявления рисков и увеличения безопасности полётов.

Анализ авиационных происшествий
Под энергией воздушного судна подразумевается вид удельной энергии, применяемой для анализа траектории полёта самолётов и ракет. Она зависит от веса, скорости полёта, высоты, тяги, подъёма и сопротивления. Всё это требует тщательного контроля со стороны экипажа, задача которого — не допустить возникновения опасных инцидентов.

Анализ происшествий, связанных с авиационной безопасностью, важен во многих ситуациях. Например, работающий на коммерческую авиакомпанию аналитик заинтересован в поиске первопричин этих инцидентов. Результаты его работы помогут повысить надёжность полётов, информировать о необходимости профилактического обслуживания, отслеживать человеческие факторы для улучшения обучения пилотов и так далее.

Сейчас инциденты авиационной безопасности анализируются вручную: группа экспертов исследует вызвавшие их причины, произошедшие в полёте. Но такой подход теряет свою эффективность с ростом объёма данных. В одном только Национальном воздушном пространстве США выполняется более 9 миллионов регулярных пассажирских рейсов в год. За 1000 рейсов на короткие и средние расстояния происходит около 900 инцидентов по регулированию безопасности. И эти цифры постоянно растут!

Поэтому специалисты из НАСА решили разработать систему, которая будет анализировать данные полёта в автоматическом режиме. Для определения ключевых событий в наборах данных они предложили использовать прекурсоры (предшественники). Прекурсор — это любое связанное с инцидентом и предшествующее ему событие. Прекурсоры помогают понять основные причины инцидента и предпринять необходимые меры. Их изучение даёт ответы на вопросы: «Когда появилось опасное состояние?» «Что такое опасное состояние?» «Существуют ли корректирующие операции для его устранения?» «Какова вероятность того, что произойдёт инцидент?»

Предложенный метод использовался для определения прекурсоров при непредвиденном превышении скорости самолёта (авиационный инцидент). Рассмотрим подробнее, как с помощью прекурсоров можно анализировать такие происшествия. На рисунке ниже показан этап посадки самолёта.



На расстоянии около 40 километров от взлётно-посадочной полосы большинство датчиков показывали нормальные значения — состояние было безопасным и вероятность инцидента близка к нулю. Приблизившись к высоте 750 метров на расстоянии 20 км самолёт стал поворачивать, чтобы выровняться относительно полосы, и тогда было установлено слишком высокое значение скорости. Прекурсором к этому событию является увеличение вероятности авиационного инцидента. К высоте 600 метров скорость была скорректирована (уменьшена). На это указывает падение вероятности неблагоприятного события. Однако начиная с 450 метров вероятность снова растёт, поскольку задерживается выпуск закрылок. Из-за этого скорость полёта снова становится высокой при приближении к отметке высоты 300 метров, на которой было отмечено происшествие. Таким образом можно обобщить данные полёта и дать объяснение ключевым событиям, случившимся до инцидента.

Поиск прекурсоров — задача обучения с незначительным привлечением учителя (weakly supervised learning). Обычно у нас есть доступ к метке, которая указывает на происшествие, связанное с безопасностью полёта. Эту метку можно извлечь из системы отчётности по авиационной безопасности (aviation safety reporting system, ASRS), где члены лётного экипажа и авиадиспетчеры сообщают о происшествиях; или же из автоматически генерируемых отчётов о полётах. Хотя у нас есть метка инцидента, метки для прекурсоров обычно недоступны, что усложняет задачу. Чтобы решить эту проблему, исследователи из НАСА предложили использовать многовариантное обучение (Multiple-Instance Learning, MIL), которое с помощью меток инцидента выводит метки прекурсоров с временным шагом.

MIL обычно использует набор данных, сгруппированных в виде пакетов. Метки пакетов известны, но неизвестны метки отдельных объектов. Задача MIL — обучить модель для прогнозирования меток пакетов или меток объектов (или и тех и других). Обычно делается предположение, связывающее метки пакетов с отдельными экземплярами: если в пакете есть хотя бы один положительный объект, то пакет помечается как положительный (положительный = указывающий на авиационный инцидент). Если же все экземпляры отрицательные, то пакет считается отрицательным. В стандартной формулировке не учитывается временная связь между объектами, поэтому исследователи создали новую модель глубокого временного многовариантного обучения (deep temporal MIL, DT-MIL) для расширения структуры MIL и добавления временных рядов. Этот подход также можно применять для очень больших наборов данных с использованием параллелизма графических процессоров.

Основная идея
Единственное доступное наблюдение для решения задачи MIL — общие данные о полёте, в которых указывается, произошёл ли авиационный инцидент. Цель — используя эту высокоуровневую информацию (метки пакетов данных) идентифицировать связанные с инцидентом события низкого уровня (метки отдельных объектов), произошедшие во время полёта. Поскольку полёт продолжается в течение определённого конечного периода, все события коррелируют друг с другом во времени. Их динамика часто бывает неравномерной: например, раскрытие дросселя за миллисекунды меняет частоту вращения двигателя, в то время как на определение заметного увеличения скорости полёта требуется несколько секунд. Или если неожиданно меняется ветер, требуется гораздо больше времени, чтобы увидеть его влияние на поведение самолёта. Поэтому важно рассматривать отдельные объекты данных вместе с контекстом.

На рисунке показана предложенная исследователями НАСА идея, согласно которой каждый полёт — это временной ряд с меткой пакета, указывающей на наличие или отсутствие авиационного инцидента. Отдельные объекты определяются как события, произошедшие в определённый момент времени T с учётом всех предыдущих (прекурсоров).


Модель DT-MIL
Как сказано выше, DT-MIL используется для поиска прекурсоров. Чтобы эффективно моделировать отдельные объекты, применяется специальный тип рекуррентных нейронных сетей с управляемыми рекуррентными блоками (Gated Recurrent Units, GRU). GRU похожи на блоки долгой краткосрочной памяти (long short-term memory, LSTM), но имеют более простую структуру. Это позволяет уменьшить объём вычислений и упростить реализацию модели.

Архитектура DT-MIL схематично изображена на рисунке ниже. Данные временного ряда (Xi) обрабатываются блоками GRU, которые преобразуют их скрытые состояния и передают на полносвязные слои (fully connected layers, FCL). Рекуррентные слои (RNN) фиксируют временные зависимости между объектами, а полносвязные слои используются для расширения возможностей аппроксимации. Логистический слой извлекает вероятности объектов, которые затем объединяются в слое агрегации для получения метки пакета. Модель можно обобщить для нескольких меток, если использовать множество независимых логистических слоёв, за которыми будут следовать слои агрегации MIL для каждого класса.


Прототип DT-MIL построен с помощью TensorFlow. В качестве оптимизатора использовался ADAM со скоростью обучения 0.002. Ко всем параметрам модели применялась регуляризация L2 с коэффициентом 0.01.

Эксперименты
Набор данных
Для исследования применялись данные, полученные с помощью метода обеспечения качества полётов (Flight Operational Quality Assurance, FOQA) за период с апреля 2010 года по октябрь 2011 года. Информацию предоставила пожелавшая остаться неизвестной частная авиакомпания. Данные содержат показания большинства сенсорных измерений на борту: скорость полёта, высота, тяга, мощность двигателя, расход топлива, тангаж, крен, давление, температура и многие другие. Частота выборки составляет 1 Гц. Чтобы устранить изменчивость характеристик самолёта, рассматриваются только модели Airbus A319 и A320.

Авиационный инцидент
В работе исследователей НАСА в качестве авиационного инцидента и рассматривается значительное превышение скорости (high-speed exceedance, HSE). Он определяется как:
скорость полёта на высоте 300 м (в контексте) > целевая скорость (в контексте) + допуск

Временной контекст включает в себя одну морскую милю траектории полёта по обе стороны от контрольной точки в 300 метров. Это помогает идентифицировать полёты, в которых действительно наблюдалось устойчивое превышение скорости и игнорировать зашумлённые данные. Если указанное выражение выполняется, то полёт помечается положительной меткой с авиационным инцидентом HSE.

Обучение модели
Модель обучалась на описанных выше данных, которые случайным образом разделены на обучающую, проверочную и тестовую выборки в пропорциях 50%, 30% и 20% соответственно. Данные были нормализованы, чтобы иметь нулевое среднее и единичную дисперсию.

Результаты
Количественные результаты

Для сравнительной оценки используются следующие базовые модели:
  • MI-SVM: модель на основе метода опорных векторов, являющаяся наиболее близкой по своей реализации к DT-MIL. Она помечает пакеты как положительные и отрицательные так же, как описано в разделе «Основная идея».
  • MI-SVM (с привязкой ко времени): в отличие от обычной MI-SVM здесь учитывается временная связь между объектами.
  • DT-MIL (без привязки ко времени): не содержит в себе рекуррентные блоки GRU.
  • DT-MIL (неглубокая): не содержит полносвязных слоёв.
  • ADOPT: алгоритм автоматического обнаружения прекурсоров во временных рядах (automatic discovery of precursors in time series, ADOPT) из предыдущей работы НАСА. Работает на основе обучения с подкреплением.
Количественные результаты показаны в таблице. В качестве метрики используется область под ROC-кривой (area under the receiver operating characteristic, AUC).


Видно, что предложенная DT-MIL модель достигает высокой точности в прогнозировании неблагоприятных событий. Её варианты без привязки ко времени и полносвязных слоёв также достигают неплохих результатов, превосходя MI-SVM и ADOPT.

Заключение
На этом работа исследователей не заканчивается. В дальнейшем они планируют провести более тонкую настройку модели и разработать с её помощью приложения, способные повысить безопасность полётов. Среди них: система принятия решений для лётного экипажа и авиадиспетчеров, а также конвейер обработки данных в реальном времени. Они помогут аналитикам, пилотам и диспетчерам оперативно обеспечивать авиационную безопасность и избегать возможных проблем ещё на этапе обучения персонала и проектирования самолётов.

Если вы планируете разрабатывать своё решение с использованием глубокого обучения и хотите ускорить процесс вычислений — воспользуйтесь высокоскоростными GPU NVIDIA Tesla V100 на наших облачных серверах (от 90 рублей в час).
www.reg.ru/cloud-services/cloud_gpu

REG.RU рекомендует




Danger, danger, high performance: ускоряем Python по максимуму
www.reg.ru/blog/uskoryaem-python-po-maksimumu/

Как защитить свой компьютер и смартфон от взлома: советы специалистов REG.RU
www.reg.ru/blog/kak-zaschitit-svoj-kompyuter-i-smartfon-ot-vzloma/


Генерация аниме с помощью нейросети StyleGAN
www.reg.ru/blog/anime-generation-with-stylegan/


Фантастический домен .COM и кто в нём обитает
www.reg.ru/blog/fantasticheskij-domen-com-i-kto-v-nyom-obitaet/


Нейросети VS Правило 34: AI научились скрывать обнажённых людей
www.reg.ru/blog/neyroseti-vs-pravilo-34/


Нет бэкапа — жди факапа, или Почему важно вовремя делать резервные копии
www.reg.ru/blog/net-bekapa-zhdi-fakapa/


Панды в Премьер-лиге
www.reg.ru/blog/pandas-in-premier-league/


Серьёзный бизнес или развлечения? Для чего клиенты REG.RU создают сайты
www.reg.ru/blog/dlya-chego-klienty-regru-sozdayut-sajty/

Какие сайты самые популярные: исследование REG.RU



Аналитика от наших специалистов

В честь приближающегося Дня рождения компании аналитики REG.RU провели исследование сайтов клиентов и разделили их по тематикам. Для анализа было выбрано 2 миллиона интернет-проектов в различных доменных зонах. При помощи нейросети пользовательские сайты распределялись по видам контента, и в результате выявилось два десятка тематических категорий.

Топ-10 категорий сайтов
На лидирующей позиции — интернет-проекты о строительстве и ремонте. Они составили 12,7% от общего числа. Кстати, согласно другому исследованию REG.RU о доменах российских предпринимателей, близкие к теме строительства “stroy” и “dom” стали одними из самых популярных слов в доменных именах. На втором месте обосновались деловые сайты — проекты юристов, банков, деловые СМИ, а также сайты о маркетинге, аудите, консалтинге и страховании и другие проекты преимущественно B2B-сегмента (9,3%). Третье место с чуть меньшим результатом заняли интернет-магазины и информационные ресурсы о бытовых товарах и технике (9,2%).

www.reg.ru/company/news/9649
Единая платформа для разных пользователей
«За 13 лет работы REG.RU стал лидером по предоставлению услуг хостинга и регистрации доменов в России. Сегодня услугами компании пользуется два миллиона клиентов. Представленная аналитика — возможность увидеть, насколько разнообразна наша пользовательская база. В ходе исследования мы увидели проекты самого разного уровня. Это ещё раз показывает, что продукты REG.RU востребованы среди профессиональных разрабочиков, веб-студий, создающих невероятные интернет-ресурсы, и среди обычных пользователей, начинающих предпринимателей, которые своими силами решают бизнес-задачи, в том числе и создают сайты», — комментирует генеральный директор REG.RU Алексей Королюк.

www.reg.ru

Майское обновление «Облачных серверов» — бэкапы



Бэкапы «Облачных серверов»
Привет!
Отличная новость — у нас появились бэкапы!
Бэкап — снимок сервера, который создаётся по расписанию, пригодится при повреждении базы данных или при ошибках во время обновления.

Один раз в неделю автоматически создаётся снимок сервера в промежутке 00:00–06:00 по московскому времени. Всего 2 снимка, каждый хранится 14 дней. Бэкап создаётся без остановки сервера. Подробнее о том, как это работает в статье «Резервное копирование на Облачных серверах».

С 15 мая до 17 июня бэкапы будут бесплатно работать на всех серверах, кроме тарифов Cloud-7 и Cloud-8.

Что будет после 17 июня
17 июня бэкапы станут платными. Мы напомним вам заранее и отключим их, чтобы списания не начались неожиданно.
www.reg.ru/vps/cloud

Облачные серверы от REG.RU выходят из беты



Облачные серверы от REG.RU выходят из беты!
REG.RU объявляет о выходе услуги «Облачные серверы» из стадии бета-тестирования. Облачные серверы — это новый формат VPS на виртуализации KVM с почасовой оплатой от 0.27 рублей в час (179 рублей в месяц). За время бета-тестирования пользователи оставили 4 600 отзывов со средней оценкой 4,5 балла. Это позволило наполнить продукт ключевыми возможностями и достигнуть высокого уровня стабильности. В планах развивать его, и первое крупное обновление мая — бэкапы. Они бесплатны до 17 июня 2019 года.
www.reg.ru/vps/cloud

Домены со скидкой и хостинг бесплатно в главных акциях мая!



Подарки с каждой регистрацией домена!
Начните бизнес с быстрым и защищённым сайтом! Зарегистрируйте домен в REG.RU и получите в подарок 2 месяца использования быстрого хостинга и SSL-сертификат на 1 год. Подробнее
.FUN, .SPACE, .TECH и другие IT-домены от 64 рублей!
Зарегистрируйте необычный домен для своего стартапа, IT-блога или развлекательного портала по минимальной цене!
www.reg.ru/company/promotions/672

1 месяц хостинга бесплатно при переносе сайтов в REG.RU
Перенесите свои сайты на обслуживание в REG.RU и получите
1 месяц бесплатного использования производительного хостинга или VPS.
www.reg.ru/company/promotions/5123

Необычный домен в зоне .XYZ за 99 рублей
Зарегистрируйте оригинальный и универсальный веб-адрес
в доменной зоне .XYZ. Он станет хорошей платформой для сайта дизайнерского агентства, веб-студии, а также личного сайта фрилансера.
www.reg.ru/company/promotions/5165

Адрес в зоне .ICU всего за 50 рублей!
Домены в зоне .ICU (“I See You”, «я вас вижу») отлично подойдут для сайтов с обзорами, новостями, а также ресурсов-агрегаторов с отзывами.
www.reg.ru/company/promotions/5146

Лучшие конференции и форумы мая
Узнайте о самых интересных и полезных IT-событиях месяца
и прокачайте ваши профессиональные навыки. Все важные анонсы вы найдёте в разделе «Мероприятия» на сайте REG.RU.
www.reg.ru/company/events/

Сайт для бизнеса — это легко!



Создание онлайн-магазина — проще, чем кажется
Несмотря на высокий уровень интернет-проникновения в России, многие до сих пор уверены в том, что создание собственного интернет-бизнеса — это всегда очень сложно. Мы пошагово расскажем, как легко и быстро запустить собственный онлайн-магазин или любую другую коммерческую площадку.

3 шага для вашего сайта
1. Регистрация домена. Сегодня любой сайт и бизнес начинается с регистрации домена. Выбор различных зон огромен: вы можете зарегистрировать домен, который будет очень точно отражать вашу сферу. Например, если вы хотите продавать кофе или различные аксессуары для любителей этого напитка, то вам лучше всего подойдёт домен .COFFEE. В свою очередь, для интернет-магазина модной одежды и обуви лучшим выбором станет веб-адрес в зоне .BOUTIQUE. Кроме того, вы можете воспользоваться сервисом REG.Pic, в котором искусственный интеллект подберёт вам подходящий домен.
pic.reg.ru
www.reg.ru/domain/new/

2. Создание сайта. Тут у вас также есть выбор: вы можете пойти по более простому пути — создать сайт в конструкторе или подобрать готовое решение на CMS, а можете заказать разработку сайта у веб-студии или фрилансера. Всё зависит от располагаемых ресурсов: если денег совсем нет, а стартовать хочется как можно скорее, то подойдёт и бесплатный конструктор сайтов.
www.reg.ru/web-sites/website-builder/
www.reg.ru/web-sites/

3. Добавление контента. Конечно, вы можете и сами написать тексты или красиво сфотографировать ваши товары. Но всё же лучше оставить это профессионалам. Проще всего специалиста будет найти на специальных фриланс-биржах, таких как Fl.ru, Freelance.ru, Weblancer.net, Text.ru и других.

Последние штрихи
Кроме домена, контента и платформы также важно позаботиться о защите сайта. Поэтому желательно подключить SSL-сертификат и антивирус VirusDie. Первый будет шифровать данные, которые передаются между браузером пользователя и вашим хостингом, а второй — защищать ваш сайт от различного вредоносного ПО.
www.reg.ru/web-sites/

Страхование хостинга: защитим сайт и обеспечим бесперебойную работу!



Страхование хостинга: защитим сайт и обеспечим бесперебойную работу!

Блокировка сайта — риск, который должен учитывать каждый предприниматель. Даже временная недоступность сайта может привести к крупным убыткам. Услуга «Страхование хостинга» поможет владельцам онлайн-бизнеса быстрее реагировать на жалобы и запросы о блокировке. Если от пользователей или организаций поступит жалоба на ваш сайт, мы максимально быстро свяжемся с вами и предоставим всю информацию. Вам нужно будет только прокомментировать жалобу или принять требуемые меры и сообщить об этом нам.
www.reg.ru/user/welcomepage

Выявление болезни Альцгеймера по речи пациента с помощью ИИ



Искусственный интеллект — не только голосовые ассистенты и роботы-художники. Сегодня машинное обучение готово приносить пользу всему человечеству, сохраняя здоровье людей. Компания REG.RU открывает цикл статей о вычислительных методах диагностики и лечении различных заболеваний.

Болезнь Альцгеймера (БА) — нейродегеративное заболевание, которым страдают десятки миллионов пожилых людей во всём мире. Только в США ежегодные расходы на лечение этой болезни составляют до 290 миллиардов долларов. Разработка и применение методов выявления БА по речи человека полностью возложены на опытных врачей. Облегчить им задачу могут стандартные технологии машинного обучения, которые применяются для обнаружения скрытых пространств (latent spaces) в данных. Предлагаем вам ознакомиться с переводом статьи о разработке метода выявления этой болезни.

Описание проблемы и задачи
Основная цель — научиться анализировать фразы, сказанные пациентом, и выделять из них особые признаки, указывающие на присутствие болезни. Признаки отдельных слов состоят из семантической, морфологической и синтаксической информации. Задача тематического моделирования (тематизации) — вместе с этими признаками обнаружить также скрытые семантические структуры. Раньше для решения этой проблемы применялся сложный метод обширного преобразования признаков (extensive feature engineering, EFE). Но современные алгоритмы машинного обучения могут обнаруживать скрытые пространства в данных без применения EFE.

В основе разработанной модели лежит Латентное размещение Дирихле (Latent Dirichlet allocation, LDA). Оно использует статистику наборов слов (bag-of-words) и позволяет определить тематику текстов на основе скрытых переменных. В LDA каждый документ рассматривается как распределение вероятностей по темам, а каждая тема — распределение вероятностей по всем словам в словаре. Предполагается, что оба в качестве априори имеют распределение Дирихле.

Для семантического анализа слов существует программный инструмент word2vec, который основан на векторном представлении слов и дистрибутивной семантике. Авторы предположили, что создание гибрида моделей LDA и word2vec позволит выявлять отличительные признаки речи при заболевании Альцгеймера. Было создано три новых варианта гибридных моделей. Общий принцип их работы заключается в следующем: сначала исследуется тематическое распределение слов в модели LDA, а затем полученная информация включается в модель word2vec в процессе её обучения.

Модели обучаются на стандартных датасетах, и после этого применяются для классификации медицинских данных. Такая архитектура может применяться и для других проблем классификации текста, а не только для выявления БА.

Цели проекта состоят в следующем:
  • эффективно дополнить word2vec латентным размещением Дирихле для классификации;
  • повысить точность выявления болезни с помощью автоматических методов.

Подробнее
www.reg.ru/blog/detection-of-alzheimers-disease-by-the-patients-speech-with-ai/