Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Услуги лаборатории ТиМПИ

Услуги лаборатории ТиМПИ

ТиМПИ

July 04, 2023
Tweet

More Decks by ТиМПИ

Other Decks in Science

Transcript

  1. [email protected] | [email protected] | +7 (812) 328-33-37 | dscs.pro
    ЛАБОРАТОРИЯ ТЕОРЕТИЧЕСКИХ И МЕЖДИСЦИПЛИНАРНЫХ
    ПРОБЛЕМ ИНФОРМАТИКИ

    View Slide

  2. 2/14
    Размещение Вашего теста или опроса в нашем приложении ВКонтакте
    Статистика по приложению:
    • Всего более 123 000 пользователей
    • Добавлено 9 тестов
    • Посещаемость приложения доходит
    до 4 000 уникальных посетителей в
    сутки.
    • Больше 14000 завершённых
    прохождений тестов

    View Slide

  3. 3/14
    Автоматизированный веб-скрейпинг
    Пример: оценка параметров (рискованного) поведения
    Парсинг данных различных сайтов для проведения Ваших маркетинговых
    исследований, анализа конкурентов и т.п. У нас есть опыт выгрузки больших объёмов
    данных с сайтов различного уровня защищённости.
    Пример результата работы: данные о продавцах Wildberries на 17.06.2022.

    View Slide

  4. 4/14
    Статистический анализ данных, обработка данных, разработка моделей машинного обучения
    Пример: многоклассовой классификации постов пользователей в социальной сети
    Описание данных:
    • Количество постов: 1568 (1797)
    • Количество слов: 39628
    • Самый длинный пост: 1539
    • Самый короткий пост: 2
    F1-микро F1-макро Точность
    RuBERT (усреднённый эмбеддинг)
    Информационные 0.5234 0.5156 0.5947
    Эмоциональные 0.5175 0.4912 0.5455
    Побудительно-деятельностные 0.6873 0.5721 0.7026
    RuBERT (максимальный эмбеддинг)
    Информационные 0.4672 0,4390 0,5347
    Эмоциональные 0.4569 0.4489 0.5726
    Побудительно-деятельностные 0.6053 0.4875 0.6223
    LSTM нейронная сеть
    Информационные 0.3587 0.3438 0.3587
    Эмоциональные 0.3387 0.3452 0.3387
    Побудительно-деятельностные 0.3863 0.3401 0.3863
    Задача:
    - многозначная (multi-label) классификация +
    многоклассовая (multi-class) классификация
    - многоклассовая классификация
    Модели:
    - одна двухслойная нейронная сеть LSTM + три
    однослойных нейронных сетей LSTM
    - предобученный эмбеддинг RuBERT + трехслойная
    полносвязная сеть
    Реализация: TensorFlow + Python 3 + DeepPavlov
    Oliseenko V.D., Eirich M., Tulupyev A.L., Tulupyeva, T.V. BERT and ELMo in Task of Classifying Social Media Users Posts //
    International Conference on Intelligent Information Technologies for Industry. – Cham : Springer International Publishing.
    2022. vol 566. P. 475–486. Doi: 10.1007/978-3-031-19620-1_45

    View Slide

  5. 5/14
    Проведение поисковых научных исследований
    dscs.pro/publikacii

    View Slide

  6. 6/14
    Проведение исследований с применением методов анализа данных
    Веб-сервис доступен
    по ссылке:
    leapp.dscs.pro
    Пример: оценка параметров (рискованного) поведения

    View Slide

  7. 7/14
    Затраты
    Методы
    профилактики
    и лечения Оценка параметров
    поведения
    Респонденты
    Результаты
    опросов
    Данные об эпизодах
    поведения
    Оценка риска
    Пример: оценка параметров (рискованного) поведения
    Проведение исследований с применением методов анализа данных

    View Slide

  8. 8/14
    Оценка выраженности личностных особенностей
    Пример: веб-сервис по анализу социальных сетей
    Комплекс
    sea.dscs.pro
    • Ведётся работа над комплексом на основе
    веб-фреймворка Django для агрегации
    сведений и анализа профилей
    пользователей в социальных сетях
    «ВКонтакте»
    • Внедрены в комплекс:
    o классификация текстовых постов
    пользователей как основа для оценки
    выраженности психологических
    особенностей пользователей
    o функциональность по визуализации и
    интерактивному взаимодействию с
    социальным графом пользователей с
    подсчётом метрик взаимодействия
    (количество общих друзей, подарков,
    лайков и комментариев)

    View Slide

  9. 9/14
    Разработка web-сайтов любой сложности
    Калькулятор доставки груза Отслеживание посылок
    Расчёт стоимости поездки на машине
    Отслеживание морских контейнеров
    О проекте:
    Портал представляет собой
    набор инструментов,
    оптимизирующих деятельность
    компаний, осуществляющих
    коммерческие перевозки:
    автоматизированные трекинг
    контейнеров и поиск компаний-
    перевозчиков; оптимизация
    маршрутов перевозки и многое
    другое. Более 2000 посетителей
    в сутки.
    Портал доступен
    по ссылке
    сargotime.ru
    Пример: информационно-логистический портал Cargotime.ru

    View Slide

  10. 10/14
    Разработка Telegram-ботов
    Как следует поступить в данной ситуации?
    Пример: QR Авто Бот — сервис для оповещения водителей

    View Slide

  11. 11/14
    Вариант 1:
    утечка персональных данных
    Вариант 2:
    связь через безопасный QR-код
    Разработка Telegram-ботов
    Пример: QR Авто Бот — сберегаем персональные данные

    View Slide

  12. 12/14
    @QRAutoBot
    Привет!
    Не могли бы Вы
    перепарковать
    машину?!
    Вместо номера телефона
    безопасный QR-код!
    Разработка Telegram-ботов
    Пример: QR Авто Бот — сервис для оповещения водителей

    View Slide

  13. 13/14
    Символика лаборатории

    View Slide

  14. 14/14
    dscs.pro
    Наши контакты
    @tics_lab @ticslabs

    View Slide