Инфопространство,
Москва, 16 сентября 2019

Поиск аномалий в анкетных данных на примере ФИО Обработка текстов на естественных языках

Доклад принят в программу конференции
Георгий Шушуев
ЦФТ

Ведущий дата-аналитик в компании ЦФТ.

shyshyev@gmail.com
telegram: @g0ohan
Тезисы

Вы, наверняка, сможете понять, что из этого не является корректным ФИО вашего клиента, а лишь чьей-то фантазией:
- Бутнару Иурии
- Сашка Седлай Коня Аккуратно
- Eyide Lucky
- Пулотов Аслам Ахмат Жон Угли
- Бэбэлэу Ион
- Устаю Уже Ильясович
- Камаз Уралов
- Перцулиани Вепхвиа

А как этому научить машину?

В докладе расскажу, как мы вычисляем Чебурашек и не только среди миллионов анкетных данных и причём тут цепи Маркова, нейронные сети, языковые модели и машинный перевод.

Доклад будет полезен всем, кому интересен поиск аномалий, и тем, кто хочет иметь реальные анкетные данные о пользователях в своей базе.

Другие доклады секции Обработка текстов на естественных языках