Python. Скрипт для локального запуска из пичарма для парсинга хтмл
Нужен примитивный скрипт для работы с локального устройства:
1. скрипт смотрит все html файлы в директории в которой находится
2. при запуске просит указать следующую запись:
<div class="col"><div><div class="font-16 text-dark text-truncate">
*
</div><div class="font-14 text-muted line-clamp-2 mt-1" style="min-height: 42px;">
*
</div></div><div class="mt-2"><div class="font-12 text-truncate"><b>
*
</b</div></div></div>
это хтмл код любого документа, начинающийся и оканчивающийся с каких то тегов - любых, которые указал пользователь, где * - это нужная колонка с тем что мне нужно видеть в итоговой CSV таблице.
3. один хтмл на одну CSV таблицу с тем же название что и хтмл.
4. важно чтобы парсер игнорировал пробелы и переносы строк при парсинге, но только не при работе с информацией помеченной *
В итоге получается такой простой скрипт для парсинга содержимого сохранённого хтмл файла (любого каталога)