![]() |
![]() |
#1 |
Новичок
Регистрация: 21.12.2016
Сообщений: 2
Спасибо сказали: 0
|
![]() разрабатываю информационную систему - инструменты для детектирования материалов экстремистской направленности, для чего мне необходимо будет добывать каким либо образом эти материалы в сети из которых будет формироваться база, из материалов (фалов) будет сформирована специальная хеш сумма, после обработки сами материалы мне не нужны, то есть копии я хранить не буду, из данных базы сами материалы получить назад невозможно, значит о распространении речи не идет, а вот момент добычи этих файлов меня смущает.
Собственно вопрос: а не буду ли я перешагивать где планку закона, все ли будет легально в моей деятельности? Если я обнаружил в сети материал, обязан ли я сообщать в органы об этом? есть ли тут к чему придраться? раз я планирую скачивать файл к себе (хотя можно даже без сохранения на диск)? почитав 114-ФЗ от 27.06.2002г. "О противодействии экстремистской деятельности". что "хранение в целях массового распространения" - это не мой случай; Но прочитав это: "На территории Российской Федерации запрещается распространение экстремистских материалов, а также их производство или хранение в целях распространения. В случаях, предусмотренных законодательством Российской Федерации, производство, хранение или распространение экстремистских материалов является правонарушением и влечет за собой ответственность." Опять возникает вопрос: так хранение запрещено или нет? подробности зачем все это нужно: Минюст подготовил гигантскую базу запрещенных материалов но совершенно не позаботился о том чтобы её можно было в действительности эффективно применять на практике. Представите: вы собираетесь опубликовать некий найденный вами в сети материал и ищите его в базе минюста, но не находите так как название вашей копии материала изменено или в нем отсутствует информация об авторе или издателе Или еще более частый и самый сложный случай: Например вы имеете фрагмент текста, скажем абзац, цитата, глава и вы не можете установить источник информации, как вы можете установить относится ли материал к запрещенным? да ни как, у вас нет возможности иметь под рукой копии всех материалов из списка экстремистских а если бы они и были у вас, представьте как сложно было бы в нем отыскать ваш текст, учитывая что далеко не все запрещенные материалы существуют в виде распознанного текста. А цитаты достаточно, для возбуждения уголовного дела... Я сам практически не ухожу со страницы со списком: экстремистских материалов и регулярно пересматриваю опубликованные мной и пользователями моего сайта материалы, но даже несмотря на это, на моем сайте нашелся материал содержащий цитату встречающуюся в одной из запрещенных книг... Я чуть ли не целиком изучил этот список (запр. материалы), что уже немалая головная боль любому блогеру, редактору или администратору сайта и все равно этого было недостаточно... Получается полная лажа: так как есть закон и база но осуществление законности, хоть и очень хочется, крайне затруднено из-за отсутствия банального сервиса для детектирования и распознавания данных материалов. В целях противодействия экстремистской деятельности я разрабатываю программное средство: базу и инструмент для распознавания экстремистских материалов (определения отностится ли тестируемый материал или цитата к запрещенным) Первый: Детектор запрещенных материалов Инструмент определения принадлежности материала к экстремистским. Сервис позволяет обнаружить используемые в исследуемом тексте точные цитаты встречающиеся в запрещенных материалах. Как работает: просто вставляете текст а сайт показывает в нем цитаты используемые в запрещенных материалах. Второй: Поиск запрещенных материалов программа - сканер может просканировать ваш компьютер или выбранный каталог и выявить известные ей файлы из списка запрещенных материалов. Как работает: Для всех файлов в исследуемом каталоге вычисляется специальная хеш сумма и сравнивается с данными нашей базы. Дополнительно сравниваются имена исследуемых файлов с возможными названиями файлов из базы. |
![]() |
![]() |
![]() |
#2 |
Новичок
Регистрация: 21.12.2016
Сообщений: 2
Спасибо сказали: 0
|
![]() Инструменты, оболочка и механизм детектирования уже есть, только база пустая, а для базы нужны собственно сами «запрещенные материалы»
Основной упор именно на текст, тут уже и модуль для сайтов создается который автоматически может проверять размещенные\размещаемые сообщения, статьи, комментарии или цитаты на сайте, чтобы в режиме реального времени информировать пользователя о содержании текста. Вся проблема в наполнении базы, сами тексты мне вряд ли кто предоставить — значит надо выискивать их самостоятельно… Что бы лучше понять в чем дело можете непосредственно ознакомиться с работой данных инструментов В надежде изменить ситуацию я запускаю несколько сервисов на своем сайте (подробное описание по ссылкам): Первый: Детектор запрещенных материалов Инструмент определения принадлежности материала к экстремистским. Сервис позволяет обнаружить используемые в исследуемом тексте точные цитаты встречающиеся в запрещенных материалах. Как работает: просто вставляете текст а сайт показывает в нем цитаты используемые в запрещенных материалах. Второй: Поиск запрещенных материалов программа - сканер может просканировать ваш компьютер или выбранный каталог и выявить известные ей файлы из списка запрещенных материалов. Как работает: Для всех файлов в исследуемом каталоге вычисляется специальная хеш сумма и сравнивается с данными нашей базы. Дополнительно сравниваются имена исследуемых файлов с возможными названиями файлов из базы. Последний раз редактировалось linker; 22.12.2016 в 00:00. |
![]() |
![]() |
![]() |
Теги |
материалами, направленности, работа, экстремистской |
Опции темы | Поиск в этой теме |
|
|