Решено: Как автоматически обрабатывать комментарии?

Любые обсуждения, не нарушающие правил форума.

Модератор: Модераторы

Re: Как автоматически обрабатывать комментарии?

Сообщение Лекс Айрин » 24.06.2016 13:50:56

pupsik, это другой вопрос.
Аватара пользователя
Лекс Айрин
долгожитель
 
Сообщения: 5723
Зарегистрирован: 19.02.2013 16:54:51
Откуда: Волгоград

Re: Как автоматически обрабатывать комментарии?

Сообщение azsx » 24.06.2016 14:15:56

1. Анализировать тематику (вот ваш суицид, мат и т.д.)

а как анализировать призыв к суициду в коменте?
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как автоматически обрабатывать комментарии?

Сообщение SSerge » 24.06.2016 18:25:41

azsx писал(а):а как анализировать призыв к суициду в коменте?


Текст закона то был прочтен?
Куда-там "призыв к суициду". Формально под ограничение попадают даже стишата типа "Маленький мальчик по стройке гулял", комментарии "убейся ап стену" и (!!!) любые высказывания относительно глупости того кто это сделал. Премия Дарвина под запретом этого закона.
SSerge
энтузиаст
 
Сообщения: 971
Зарегистрирован: 12.01.2012 05:34:14
Откуда: Барнаул

Re: Как автоматически обрабатывать комментарии?

Сообщение Лекс Айрин » 24.06.2016 18:39:15

SSerge, если честно, все это настолько бесполезно, что не верится, что будет какая-то выгода от этого -- запретный плод сладок(((
Аватара пользователя
Лекс Айрин
долгожитель
 
Сообщения: 5723
Зарегистрирован: 19.02.2013 16:54:51
Откуда: Волгоград

Re: Как автоматически обрабатывать комментарии?

Сообщение azsx » 24.06.2016 19:06:59

Премия Дарвина под запретом этого закона.

в том то и дело, что у меня логика отказывает. Понятно, что на наркотиках мне надо искать любое стоп слово + контакт или описание чувств, например. А что мне искать в словарях на суицид?
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как автоматически обрабатывать комментарии?

Сообщение SSerge » 24.06.2016 19:25:41

azsx любые словечки из разряда mortal: двинул кони, склеил ласты, убился, порезал, вены, горло, кровь, кишки, рас... Чё-то увлёкся...
SSerge
энтузиаст
 
Сообщения: 971
Зарегистрирован: 12.01.2012 05:34:14
Откуда: Барнаул

Re: Как автоматически обрабатывать комментарии?

Сообщение pupsik » 24.06.2016 21:39:33

SSerge ага... Первый есть :lol:
azsx в двух словах не описать. А в 3-х = нобелевка/шнобелевка. Я к тому что даже есть есть наработки просто так не поделятся (сами используют). Из открытых источников инфы мало (в принципе есть).
Можно начать с: https://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D1%8F%D0%B4%D1%80%D0%BE
Потом почитать теорию вероятности, попробовать нейронки.
pupsik
энтузиаст
 
Сообщения: 1154
Зарегистрирован: 20.08.2014 16:20:13

Re: Как автоматически обрабатывать комментарии?

Сообщение azsx » 25.06.2016 01:13:56

SSerge спасибо, буду думать.
Я к тому что даже есть есть наработки просто так не поделятся (сами используют).

среди селшников, например, принято нанимать админа, который в том числе сидит и вычитывает комментарии вручную. А кто-то всё таки юзает скрипты? Вы лично используете?
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как автоматически обрабатывать комментарии?

Сообщение pupsik » 25.06.2016 01:53:20

azsx хочу то не знаю что, хочу так не знаю как. Сделаю так не знаю как.
Есть фриланс. Вот и поинтересуйтесь там.

среди селшников, например, принято нанимать админа,
а вот это самая замечательная идея. И эвристика, и логистика, и "посылатель в длинный путь". Одно плохо: деньги берёт и нервишки шалят.
pupsik
энтузиаст
 
Сообщения: 1154
Зарегистрирован: 20.08.2014 16:20:13

Re: Как автоматически обрабатывать комментарии?

Сообщение azsx » 25.06.2016 10:17:59

azsx хочу то не знаю что, хочу так не знаю как. Сделаю так не знаю как.

это не про мою задачу. Я может быть запутано объясняю, но что на выходе получить я знаю. Только я не силен в этих анализах текста русского языка.
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как автоматически обрабатывать комментарии?

Сообщение Mirage » 25.06.2016 16:29:14

У IBM есть продукт LanguageWare.
Сам видел, как с помощью этого продукта в небольшие сроки писали анализатор постов в Твиттере на предмет положительного, либо отрицательного отношения автора к определенным персонам.
Затем на основе анализов строились прогнозы, которые неплохо сбывались.
Вобщем, продукт вполне рабочий, но дорогой.
Возможно, стоит поискать бесплатный аналог.
Mirage
энтузиаст
 
Сообщения: 881
Зарегистрирован: 06.05.2005 20:29:07
Откуда: Russia

Re: Как автоматически обрабатывать комментарии?

Сообщение Verx0Laz » 25.06.2016 20:10:56

Технически, задача делится на три этапа: 1) выгрузка в файл массива комментариев для последующей обработки 2) обработка по словарю и выделение сообщения, в котором найдена искомая группа символов 3) создание списка подозрительных сообщений с возможностью их открытия из программы в браузере с целью дальнейшей модерации
=== Только это средство поможет, мягко говоря, не всегда!!
Если спамер не полный олух, не лентяй, и сам знаком с программированием (а это в среде спамеров не редкость), уж он-то легко напишет алгоритм замены русских символов на аналогичные английские по случайному алгоритму (плюс вставка всяких служебных и прочих символов между букв, вариантов - море). В итоге он сможет закакать весь форум за пять минут абсолютно уникальными сообщениями, с сильно затрудненной возможностью обнаружения.

С подобной атакой, имхо, есть только одно средство борьбы.
1) нанять усидчивого и толкового модератора, либо самому им стать
2) закрыть возможность добавления комментов без регистрации
3) цмс сайта должно иметь средство тотальной зачистки - удаления пользователя вместе со всеми его сообщениями (или на три дня в инвиз а потом кирдык)

А насчет программы, способной реализовать подобное в режиме автомата.... 1) Подозреваю в первые же дни запуска кучу случайных жертв и имиджевые потери.
2) горькое чувство понимания, что на любой хитрый скайнет найдется свой Джон Конор с левой резьбой ))
----
В качестве инструмента анализа сайта можно попробовать подключение из программы напрямую к базе с возможностью работы с нею на уровне SQL... это будет чуть красивее и эффективнее, чем парсинг текстового файла. Если конечно хостер позволяет работать с базой напрямую. И если в ЦМС уже не реализовано что-то подобное
Аватара пользователя
Verx0Laz
постоялец
 
Сообщения: 125
Зарегистрирован: 11.09.2007 11:24:07

Re: Как автоматически обрабатывать комментарии?

Сообщение pupsik » 25.06.2016 23:40:42

уж он-то легко напишет алгоритм замены русских символов на аналогичные английские по случайному алгоритму (плюс вставка всяких служебных и прочих символов между букв, вариантов - море).
это спам, а не нежелательный контекст.
По поводу п.1. Это решается ручной обработкой "проблемных вопросов" и хранением истории действий.
п.2 горечи не будет - если не афишировать работу программы. Ведь желание взлома происходит из-за возможности. Т.е. вроде как вызов: есть обработчик контекста, почему бы его не ломануть...
pupsik
энтузиаст
 
Сообщения: 1154
Зарегистрирован: 20.08.2014 16:20:13

Re: Как автоматически обрабатывать комментарии?

Сообщение azsx » 26.06.2016 03:31:40

Подытожу. Буду считать, что в моих комментах запрещены политика, религия, маты, наркотики, порно, суицид.
Понятно, что политику, религию и маты проще искать по словарю. Только у меня нет словарей на политику (в том числе и экстремизм) и религию.
Наркотики - весьма однотипные объявления, на них мне нужны весь пул запросов на контакты + словарь запрещенных препаратов с синонимами (также словаря нет). Здесь правила будут принципиально сложнее, так как по отдельности слова законны, а так подтекст налицо, типа "есть чо, телефон ***". Оптимальным решением будет запрет постинга любых контактов + словарь стоп слов на нарко вещества. Умнее ничего придумать не могу.
Порно - дохлый номер. Есть список адалт терминов, но меня волнуют не спамеры которые пишут однотипно, а всякие запреты на пропаганду гомо в СПБ, например. Они пишут завуалировано. хз как их отлавливать.
Также не понятно как искать суициды. Запретить все термины связанные со смертью и сразу 3+ писать на сайте?
---
Здесь правда есть еще такая проблема, это уже придирки. В комментариях часто продают наркотики. Любые споры о политике, религии или национальности - вредны. Суициды мне попадаются только простые, типа: "нет денег - продай почку". Их можно ловить по словарю. Другого ваще нет.
Есть маты, много, на всех подряд.
зы
так что предварительно останавливаюсь на словаре с возможностью поиска связки терминов из вариаций значений.
azsx
энтузиаст
 
Сообщения: 959
Зарегистрирован: 16.11.2015 06:38:32

Re: Как автоматически обрабатывать комментарии?

Сообщение Verx0Laz » 26.06.2016 18:50:12

Пример пхп-класса для матофильтра на регэкспах (регулярных выражениях). Написано без выкрутасов и густо откомменчено. Это к вопросу о том "как это люди делают". Было бы не плохо перевести это на паскаль, может кто возьмется.
https://github.com/rin-nas/php-censure/blob/master/Text/Censure.php
Аватара пользователя
Verx0Laz
постоялец
 
Сообщения: 125
Зарегистрирован: 11.09.2007 11:24:07

Пред.След.

Вернуться в Потрепаться

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 27

Рейтинг@Mail.ru