У меня есть несколько сайтов, на них пишут комментарии.
----------------------------------------
Я хочу перестать читать чужие комменты совсем. И при этом не уехать в Магадан (не попасть в бан комнадзора).
----------------------------------------
Что сейчас сделано.
Было уведомление по смс если хостеры пишут в письме слово "комнадзор". Можно восстановить, но я смски редко читаю.
Есть просмотр всех комментов на одной странице. Быстренько перейти что-то ответить (часто пишут нормально) или стереть нафиг. Вручную через wincsp я стираю; читаю новые комментарии я на одной странице; отвечаю прямо на странице источнике.
В чем проблема?
1. Если хостер написал "на вас накатал абузу комнадзор исправьте" - надо удалить коммент за сутки. Иначе, бан аккаунта.
2. Я против политики и религии и всех холиваров на своих сайтах. Мне сетевые войны не нужны от слова совсем.
3. Мне хочется всё автоматизировать.
Что я хочу.
Я хочу написать программу в паскале, которая после запуска на десктопе (или консоли) скачивает комменты с разных хостингов и сайтов по ftp или ssh и проводит их анализ. Физически все новые комментарии хранятся в одном месте в текстовом файле. Таким образом программа должна скачать текстовой файл, автоматически провести анализ комментариев на соответствие всему законодательству РФ, стереть неугодные комментарии (тоже в текстовом файле), залить всё обратно. Заодно орфографические и синтаксические ошибки исправить, автоматически. И так каждые 10 минут.
В чем сложность?
Совсем не понятно какие базы брать или у комнадзора своя есть. Логично, насобирать список стоп слов (матершинные слова, наркотики, политические термины и личности, суициды). Я понимаю только где маты взять. Ну наркотики списком.
Так же, для некоторых сайтов возможно поставить запрет на размещение телефонного номера в контактах. Ссылки у меня еще при первой проверки запрещены. Может что-то еще ставить на запрет автоматом?
Всё - больше ничего умного в голову не приходит.
То есть окончательный вопрос в том, как разбить на подзадачи анализ комментария, чтобы он соответствовал законодательству рф и не вызывал срача в комментах, то есть не был провокационным.
----------
ВАжно, забыл уточнить меня интересует анализ только комментариев с моих личных сайтов. Не со всего интернета.
-------------------------
Решено: забил, сделал перебором словарика. Всем спасибо.