Поиск аномалий в анкетных данных на примере ФИО Обработка текстов на естественных языках
Доклад принят в программу конференции
Тезисы
Вы, наверняка, сможете понять, что из этого не является корректным ФИО вашего клиента, а лишь чьей-то фантазией:
- Бутнару Иурии
- Сашка Седлай Коня Аккуратно
- Eyide Lucky
- Пулотов Аслам Ахмат Жон Угли
- Бэбэлэу Ион
- Устаю Уже Ильясович
- Камаз Уралов
- Перцулиани Вепхвиа
А как этому научить машину?
В докладе расскажу, как мы вычисляем Чебурашек и не только среди миллионов анкетных данных и причём тут цепи Маркова, нейронные сети, языковые модели и машинный перевод.
Доклад будет полезен всем, кому интересен поиск аномалий, и тем, кто хочет иметь реальные анкетные данные о пользователях в своей базе.