Инфопространство,
Москва, 16 сентября 2019
10 сентября 2019

Расписание UseData Conf и доклады о базах данных на HighLoad++ 2019

Карта применения систем на основе ML

Мы хотим составить карту ближайших применений систем на основе машинного обучения и опубликовать её. Попробуем разобраться, где уже всё готово для новых сценариев развития, но народ не додумался. А может, есть области, где технологии пока не готовы, но осталось совсем чуть-чуть до прорыва, открывающего возможности для новых применений.

Окончательную версию документа мы будем составлять на UseData Conf, но будет здорово составить предварительный список. Заполните форму, чтобы принять участие в создании карты.

Базы данных и системы хранения на HighLoad++ 2019 

Jose Cores Finotto из GitLab.inc расскажет об изменениях в проекте High Availability (HA), разработанном совместно с Ongres. Обновления были выпущены полгода назад, и за это время в GitLab накопилось достаточно данных о пользовательском опыте.

Один из создателей системы Vitess, Sugu Sougoumarane, расскажет об архитектуре проекта. Инструменты Vitess удобны для запуска на Kubernetes, они легко масштабируются с помощью прозрачного шардинга, позволяя группировать связанные данные с использованием материализованных представлений. Сугу наглядно продемонстрирует всю мощь материализованных представлений в изолированной среде.

Основатель Percona Пётр Зайцев выступит с докладом «Путь к Open Source DBaaS с помощью Kubernetes». DBaaS (Database as a Service) наиболее быстрорастущий подход к использованию баз данных во всем мире. Но многих смущает в этом подходе привязка к конкретному cloud-провайдеру. Пётр расскажет о создании DBaaS-эквивалента на основе Open Source-технологий Kubernetes Operators. Мы увидим, что уже работает, а над чем разработчики Percona продолжают трудиться. 

Доклады UseData Conf

Артём Селезнёв из МегФона расскажет, как контролировать процесс разработки проекта ML с помощью DVC (data version control). Этот инструмент позволяет контролировать версии данных и обученных моделей, а совместно с git он может обеспечить контроль версий. Артём расскажет об опыте использования DVC в МегаФоне для решения персональных задач и для командной работы. Вместе рассмотрим эксплуатацию DVC, начиная с первой настройки и до создания управляемых пайплайнов для проекта, которые позволяют перемещаться по проекту и восстанавливать процесс работы в выбранной точке.

Использование ML для прогнозирования позволяет сэкономить немалые деньги. Иван Исаев из Altariх расскажет о том, как прогнозируются инциденты в процессе бурения. В системе, созданной в Altarix, использовался xgboost и приведения MDM из 4 источников. В результате применения этой системы число осложнений при бурении удалось сократить на 50% и добиться экономии около 500 тысяч долларов в расчете на одну скважину.

Подключайтесь!

Советуем подключиться к соцсетям UseData Conf. Так вам будет удобно следить за тем, что происходит в Инфопространстве в день конференции. Будем выкладывать презентации докладов и другие полезности. 

Подписывайтесь:

На сегодня всё! До скорого!