Проанализировать обращения в роспотребнадзор
Собрать датасет заявок с сайта http://zpp.rospotrebnadzor.ru/Forum/Appeals 2000 заявок.
Провести предобработку текста (отчистить от телефонов, емеил адресов, спец символов).
Сделать тематическое моделировани LDA, либо другим способом.
Используя coherence score получаем подобрать оптимальное количество топиков. Визуализировать и проинтерпретировать полученный график.
Визуализировать частотность топиков от в документе, кол-во слов в документев в зависимости от топика, облако тегов в зависимости от ключевых топиков.
Пример результата:
https://webdevblog.ru/vizualizaciya-tematicheskogo...
В результате получить юпитер ноутбук, с ссылкой на Google Collab.