Что по нарушениям?
The Шаттл / 24 июня 2019
Студенческий центр анализа данных ДВФУ (СЦАД ДВФУ) запустил новый проект – Монитор инцидентов. На графике можно увидеть, какие нарушения и в какой период были совершены студентами из разных школ и корпусов.
v 0.1 — 6 апреля. Релиз монитора инцидентов.
v 0.2 — 15 июня. Добавлено нормирование.
v 0.3 — 25 мая. К монитору инцидентов добавлены курсы, тип обучения. Добавлены топы нарушений по школам.
v 0.4 — 28 мая. Добавлен монитор динамики нарушений по школам.
v 0.5 — 30 мая. Разделение всех диаграмм по вкладкам.
v 0.6 — 3 июня. Оптимизация работы чекбоксов на мониторе инцидентов. Добавлена нормировка динамики нарушений по школам.
v 0.7 — 7 июня. Перевод всех диаграмм на новый движок.
v 0.8 — 8 июня. Оптимизация диаграмм под мобильные устройства. v 0.9 — 24 июня. Автоматическая нормировка. Добавлено количество студентов в каждой школе.
Пропускной режим – нарушения, связанные с утерей пропуска или попыткой попасть в корпус любым способом без записи в журнале посещаемости;
Алкоголь – пронос алкоголя в корпус, его хранение и употребление или нахождение в состоянии алкогольного опьянения на территории кампуса;
Курение – курение в неположенных местах или разжигание открытого огня в помещениях;
Дорожное движение – нарушения ПДД на территории кампуса, в том числе неправильная парковка;
Экстренные службы – вызов пожарных, полиции, скорой, службы газа и т.п. без причины;
Некорректное поведение – неуважительное общение с персоналом гостиниц и ДВФУ;
Другие нарушения – в основном использование запрещенных электроприборов и нарушение санитарных норм;
Иные происшествия – протечки, пожарная тревога и прочее.
Монитор инцидентов работает в режиме реального времени и автоматически обновляется каждую неделю. СЦАД получает от охранного предприятия отчеты, обрабатывает их и извлекает данные по школам, корпусам и видам нарушений.
На графике по горизонтали расположен период времени (год, месяц), по вертикали — количество нарушений.
Как это работает с точки зрения IT?
Мы присоединились к еженедельным рассылкам отчетов, которые предоставляет частное охранное предприятие, и научились извлекать из него информацию об инцидентах.
С помощью скрипта на сервере СЦАД из писем извлекаются файлы в соответствующем формате. Файлы конвертируются из docx, doc (файлов Microsoft Office Word) в обычный текстовый документ. Далее происходит разбиение этого документа на разделы.
«Наш алгоритм ищет в тексте подстроки, которые соответствуют заранее заданным шаблонам. Эти шаблоны называются регулярными выражениями», – прокомментировал один из разработчиков центра анализа данных.
Каждый раздел посвящён определенному виду нарушений и общежитию. Из документа выделяется описание самого нарушения. Затем из этого описания алгоритм узнаёт, когда произошёл инцидент и кто был его участником, если такой был.
Обезличенные данные – это данные, из которых убрали подробности о личности нарушителя и обстоятельства инцидента. В результате остается только тип нарушения, общежитие, время и школу, если удалось определить.
Каждый раздел посвящён определенному виду нарушений и общежитию. Из документа выделяется описание самого нарушения. Затем из этого описания алгоритм узнаёт, когда произошёл инцидент и кто был его участником, если такой был.
Зачем это нужно?
В ДВФУ Data-аналитикой стали заниматься с октября 2018 года для развития внутривузовской среды. Изучение потока данных об учащихся и сотрудниках позволяет «держать руку на пульсе» и понимать, что может улучшить жизнь в университете.
Напомним, что Студенческий центр анализа данных совместно с SocialDataHub уже проводил работу с использованием большой аналитики. В рамках исследования они составили и проанализировали социальные графы (схемы общественных отношений) каждой школы,
СЦАД нужны люди!
Data-scientist
— Хорошее владение Python;
— Желательно разбираться в мат.статистике и машинном обучении.
Мобильные разработчики
— Навыки работы на swift;
— Опыт разработки android-приложений.
Web
— Опыт разработки на php.;
— Желателен опыт с vue.js;
— CSS, HTML.
UI/UX дизайнеры
— Опыт работы с figma/sketch;
— Владение Adobe Photoshop
Инженеры
Сфера интересов:
— Знание информатики (представление информации, языки программирования, моделирование);
— Знание физики (слаботочные электрические цепи).
Обязательные навыки:
— Сборка различных схем на Arduino, Raspberry pi;
— Программирования на Arduino, Raspberry pi;
— Создание 3D-моделей для печати.
Вопросы можно задать Сергею Приходько.