Инфопространство,
Москва, 16 сентября 2019

Machine Learning for Code
Обработка текстов на естественных языках

Доклад принят в программу конференции
Егор Булычев
source{d}

Инженер по машинному обучению в стартапе source{d}, где работает с "big code", естественными языками и deep learning. Один из разработчиков платформы для распределенного обучения моделей на основе нейронных сетей Велес (https://velesnet.ml) — это было во время работы Егора в Samsung Research Russia.
После этого занимался разработкой систем предсказанием демографии и рекомендационных систем в штаб-квартире Самсунга в Южной Корее. Давным-давно активно занимался робототехникой, участвовал в соревнованиях по роботехнике и разрабатывал системы технического зрения для беспилотников.

egor@sourced.tech
https://www.linkedin.com/in/egor-bulychev-028237118
Тезисы

Разработка софта — это сложный многогранный процесс.

Вы услышите:
* почему применение машинного обучения к исходному коду так сложно? Почему почти ни одна из задач не может быть решена без использования методов для обработки естественных языков? Какие сложности надо преодолеть на этом пути?
* код-ревью — почему мы тратим так много времени на него? Как оптимизировать этот процесс и избавить разработчиков от "глупых" задач? Какие существуют решения на основе машинного обучения и как выкатить их в продакшн?
* поиск похожих репозиториев — почему поиск для исходного кода работает плохо? Как искать похожие по смыслу и решаемым задачам репозитории?
* поиск разработчиков с похожим опытом — как формализовать похожесть? Как извлечь необходимую информацию из кода? Какие методы позволят решить эту задачу?

Другие доклады секции Обработка текстов на естественных языках