Тезисы
Везде, где есть контент, генерируемый пользователем, рано или поздно возникает необходимость этот самый контент как-то фильтровать, и делать это довольно быстро и качественно.
В рамках доклада рассмотрим, в каких случаях требуется предварительная проверка, как работать с разными типами контента, какие инструменты использовать, в каком порядке, где набрать датасет и что делать, если одна из ваших ML-моделей стала показывать погоду на Венере вместо хоть сколько-то адекватных скоров. Также поговорим об общей производительности пайплайна и как укладываться в SLA по времени.
Аудитория
Backend-developer, analyst, data-scientist.
Уровень сложности
Advanced.
Презентация (на Я.Диске)
Профессиональный разработчик. Стаж в IT 15 лет, из них 11 — в бэкэнде, четыре года увлекается машинным обучением. Последний год работает с классификацией и фильтрацией контента в Яндексе. О чём и расскажет на CodeFest.