5 ноября 2010
Запись из категории 'Плагины'

Плагин для поиска скопированных текстов В предыдущей статье о том, как проверять тексты на уникальность, я написала о плагине, при помощи которого это сейчас делаю.

Хочу предупредить – это не самый точный вариант, если нужно что поточнее – пользуйтесь специальными программами. Плагин ищет копии текста только по Гуглу.

Преимуществом этого плагина считаю то, что тексты проверяются прямо из админки блога – то есть их можно проверить по случаю, затем посмотреть итог, обработать этот итоговый отчет, направить письма всем, кому следует.

А потом постараться забыть об этом конфликте, и вспомнить только при одном из следующем входов в админку – благо, отчет с вашими пометками там будет висеть.

Хочу сказать, что я на скорую руку русифицировала плагин. :)

Хоть я и постаралась перевести все целиком, возможно, что-то пропустила. В самом переводе может быть 3-4 небольших недочета, я не везде уверена в переводе – поправлю со временем.

Так что у вас есть выбор – скачать плагин на английском или на русском.

Внимание: не скачивайте мой русифицированный файл, если у вас английский WP. В плагине так все было устроено, что у вас получится часть текста на русском, а часть на инглише.

Настройка плагина WP-Kradeno

Итак, после распаковывания архива с плагином и копирование его на сервер, активизируем плагин. Потом идем в настройки.

Плагин WP-Kradeno В настройках у нас следущее:

Плагин WP-Kradeno

Вообще тут изначально все заполнится автоматически, можно ничего не трогать, да и переведено мною на русский – и не просто так, а с пояснениями. Но повторюсь:

1 – Урлы ваших сайтов через запятую, эти адреса будут исключены при проверке. Естественно, сперва нужно указать адрес блога, на котором вы все это настраиваете. Можно еще указать адреса рассылок или блогов, куда вы делаете кросспост.

2 – Количество запросов к Гуглу (надо полагать, что в секунду? я плохо в этом разбираюсь, но у меня стоит 2000).

3 – Параметр, который указывает, сколько процентное совпадение текста для вас уже является критическим. У меня стоит 0,3 – это 30% совпадение.

4 – Кнопка, которая сбрасывает все настройки до исходных.

Поиск скопированных текстов с помощью плагина WP-Kradeno

После того, как все настроили, идем искать врагов скопированные у нас тексты. Кнопка с отчетами WP-Kradeno (или в моей интерпретации WP-Украдено) находится в разделе “Записи”.

Плагин WP-Kradeno Нажимаем ее и видим много букв, кнопку и галочку.

Плагин WP-Kradeno

Буквы дублировать не буду, зря что ли писала, если интересно – прочитаете (и про галочку тоже).

Жмем на кнопку “Начать проверку”. Ждем несколько секунд.

Плагин WP-Kradeno

И получаем какие-то странные цифры.

Плагин WP-Kradeno

Нажимаем “обновить”. А потом еще раз на кнопку “Начать проверку”. И снова странные цифры.

Плагин WP-Kradeno

Не пугайтесь. Все работает. Но смысл цифр вам объяснить не смогу. Вам придется нажимать на кнопку несколько раз (10-15, может, больше, если у вас тысячи записей), пока в итоге вы не получите следующее.

Плагин WP-Kradeno

На протяжении этих ваших “танцев с бубнами” около кнопки, внизу будут появляться найденные копипасты. После того, как полностью все проверите (а можете и раньше), начинайте работать с этими копипастами.

Что можно делать с отчетами? Рассказываю.

Плагин WP-Kradeno

1 – Это показатель того, на сколько процентов совпадает текст на найденной странице (адрес ее я закрасила на скриншоте) с вашей статьей.

2 – Ссылка страницы вражеского сайта, на которой найдена копия.

3 – Кэш Гугла, на основании которого делалась проверка.

4 – Ссылка вашей статьи, которую скопировали.

То есть сначала вы все это сопоставляете и принимаете решение, что вы будете с этой информацией делать дальше. Вариантов два – “забить” или разбираться. Этому посвящу отдельную статью, а пока посмотрим, что мы можем пометить в отчете.

5 – Галочки для групповых действий над записями.

6 – Пометить найденный копипаст как игнорируемый. Т.е. вам по каким-то причинам не интересно, что найдена такая копия.

7 – Пометить найденный копипаст как сворованную статью. Тогда рядом с ним будет видна красная предупреждающая надпись (я показала ее красной стрелочкой).

8 – Пометить копипаст, как исправленный. Это если вы написали хозяину сайта, позаимствовавшего ваш контент, а он стер статью или ссылку поставил на нее. Учитывайте, однако, что иногда недобросовестные сайтовладельцы возвращают потом все как было – как только вы отвернетесь. А в этом отчете статус уже нельзя будет отменить. Откровенно говоря, это статус вообще будет виден только в базе, а в админке – нет.

9 – Пометить данный копипаст, как согласованный.

10 – Исключить этот сайт из всех найденных записей.

Отмечу тут с грустью, что такое количество статусов в отчете значение не имеет. Потому что – внимание! – статусы 6, 8, 9 и 10 просто убирают помеченные ими строки с глаз долой. Вы больше их никогда не увидите. Плагин будет игнорировать при очередной проверке эти адреса, не выводя их в отчете, а просмотреть эти записи вы нигде не сможете – по ним, видимо, ведется какая-то внутренняя база.

С другой стороны, если не исключать часть записей, то на странице с отчетом скоро невозможно будет развернуться. Да и письма писать замучаетесь, понятно, что после какого-то определенного уровня, предела, нужно просто забыть про сайт-вор, если его владелец не идет вам на встречу и у вас нет серьезных намерений идти с ним в суд.

В общем, невозможность посмотреть всю базу когда-либо найденного, даже уже исключенные записи – это очевидный минус плагина.

Напоследок скажу, что плагин выводит свою статусную строку на главную страницу админки WP. Хочу предупредить, что перевела я эти статусы криво, поскольку большинство из них не дошли до моего ума. Но со временем все поправлю (когда засеку косячный перевод у себя в блоге).

Плагин WP-Kradeno

Чего не хватает в плагине:

  • возможности просмотреть уже обработанные записи, составить по ним отчеты,
  • возможности полностью стереть базу проверок,
  • возможности добавлять коротенькие заметки к каждой строчке (например, указать, куда и когда было отправлено письмо и что на него ответили),
  • возможности проверять в других поисковиках,
  • более понятной расшифровки циферок, которые появляются во время проверки.

Комментируемые статьи


Комментарии:
19 комментариев к записи "Плагин для поиска плагиата и копипаста – WP-Kradeno"
anemona оставил(а) комментарий 6 ноября 2010 в 10:11 #

Пожалуй, больше всего не хватает все-таки, проверки в других поисковиках. Но оно и ясно – создатель все-таки с Запада, хоть и болгарин =)


Dashline оставил(а) комментарий 6 ноября 2010 в 10:23 #

Может, муж Олли доделает их плагин, тогда можно будет им пользоваться. У них там и Яндекс и Гугл.

А вообще почему мне хватает этого плагина пока – Гугл быстрее Яндекса в индекс статьи берет, да и не все дубли исключает (хотя злостных копипастеров он вообще игнорирует, как мне кажется). Алгоритмы другие, но я и не хочу все обязательно знать. Мне это вредно для психики. :D Если мне приспичит точную проверку делать буду пользовать ту программку от Етекста.

Вчера, кстати, пропалила блоги фломастера в жж-шках и на дайри ру (написала на них абузы, жду, чем кончится). Представляешь, там был копипаст с блогов (моих и других девчонок с вебледи) – копировал по абзацу-два, а потом ссылку ставил из середины на свой г-но сайт. Удивляюсь, почему Гугл до сих пор такой мусор в выдаче терпит (этот плагин признает 50-60% совпадение с фломастерским сайтом), все-таки он русский язык знает гораздо хуже, чем Яндекс.


anemona оставил(а) комментарий 6 ноября 2010 в 12:09 #

Это с помощью плагина пропалила? Нормально. Все-таки попробую поставить плагин, я на днях проверила некоторые свои сайты программкой с etxt, но я только выборочные статьи проверяла – терпения на все не хватило, да и комп грузят со страшной силой все эти плагиатусы.


Dashline оставил(а) комментарий 6 ноября 2010 в 12:22 #

anemona, ага, с помощью него нашла несколько + в яндексе проверяла параллельно на авторство статьи, на которые находились копипасты, и тоже наткнулась. В общей сложности получилось 4 его г-но блога пока. Один уже в мусоре, который на дайри. Правда, я уверена, что будут и еще – новые.


Вадим оставил(а) комментарий 8 ноября 2010 в 12:23 #

Спасибо, попробую.


anemona оставил(а) комментарий 12 ноября 2010 в 6:08 #

Что-то я расстроилась слегка – плагин установила, настройки сделала как у тебя на скрине, но когда запустила проверку – ничего не произошло, никаких цифирок вообще. Только надпись «Выполняется…» и внизу «Идет проверка…» Я уже и на другой сайт пробовала ставить – то же самое. Минут 20 висело без изменений. Остановила, обновила страницу, опять запустила проверку и опять ничего… :(


Dashline оставил(а) комментарий 12 ноября 2010 в 6:13 #

Марина, обидно и мне :( Наверное, дело в настройках сервера? Попробуй циферку запросов уменьшить (вдруг, поможет?) Вообще в оригинальной инструкции он пишет, что она и по 10 минут может так работать, как ты описываешь, но 20, наверное, все же перебор. Или это из-за версии WP может быть. У тебя какая стоит?


anemona оставил(а) комментарий 12 ноября 2010 в 6:39 #

Там, где проверяла – 2.9.2 , а на остальных – 3.0
Попробую цифры поменять – отпишусь потом *YES*


Dashline оставил(а) комментарий 12 ноября 2010 в 6:48 #

У меня на 2.9.1 все работает, так что это дело в сервере, скорее всего.


anemona оставил(а) комментарий 12 ноября 2010 в 7:33 #

Даша, попробовала оригинальную версию плагина – выдал отчет, может плагин криво встал в первый раз *UNKNOWN*


Dashline оставил(а) комментарий 12 ноября 2010 в 7:40 #

Может, я чего-нить намудрила с ним (я только на этом блоге использую свою русскую версию).

Ну, хорошо, что работает хотя бы инглиш версия, я рада. *WASSUP*


anemona оставил(а) комментарий 12 ноября 2010 в 8:16 #

Даша, я в шоке :o У меня столько натырено статей (проверила свою народную медицину)- это целый день придется убить на переписку к копипастерам – ссылки где есть, а где нету. На блоге все нормально – никто не позарился, а остальные надо проверять. Единственное радует – автор того, что успела проверить – все-таки я.


Dashline оставил(а) комментарий 12 ноября 2010 в 8:22 #

Марина, ничего страшного, это просто ты давно не проверяла – накопилось за несколько месяцев. Львиную долю из этого можно будет удалить в результате переписок, какие-то просто нужно проигнорировать, если ссылка есть открытая.

Ты, главное, помягче с ними *SUSEL* :D . Там процентов 70% даже не подозревают, что они кому-то навредили.


anemona оставил(а) комментарий 12 ноября 2010 в 9:01 #

Да я уж поняла, что спокойнее надо относиться ко всему. Вчера написала письмо в клуб на я.ру, где моя статья висит – сегодня уже сняли, и в поддержку писать не пришлось.
Суперполезный плагин, несмотря на то, что Гоша не силен в русском языке.


Raila оставил(а) комментарий 22 января 2011 в 12:34 #

Девочки, а я в последнее время вообще перестала проверять. Целее нервы будут. Копируют-то в основном жж и тому подобное. Запаришься им всем письма писать. Да и не понимают многие мой праведный гнев. Одна дама мне ответила «я вашу статью не воровала, я ее скопировала». Извините, это не одно и то же?!!
В общем, я решила то время, которое раньше тратила на поиски копи-пастеров, потратить на развитие сайтов. Как говорится, у кого тиц, тот и прав.


Dashline оставил(а) комментарий 22 января 2011 в 12:45 #

Raila, а зачем на это нервы тратить? Я просто составляю список людей и пишу письма стандартные. *MAIL* Целью в этом случае вижу – минимизировать ущерб, а не полностью искоренить копипаст (что действительно бесполезно). Например, тем, кто поставил открытую ссылку – не пишу вообще. Не пишу также владельцам г-но блогов (на них лучше жалобу в яшу отправить – найти на сайте злоупотребления поисковым спамом и нажаловаться). Остальные обычно реагируют нормально – 70-80% людей снимают статьи или проставляют ссылки. *WASSUP*

Вообще давно не проверяла, но считаю, что чаще раза в месяц этого делать не нужно.

В общем – смотря как подойти к делу. Но совсем забивать на это не следует, мне кажется. Ты же не оставляешь квартиру открытой для всех, а блоги – это тоже наше имущество, его нужно беречь по мере возможностей. ;)


Raila оставил(а) комментарий 22 января 2011 в 15:08 #

Толку от этих писем? Вот одна барышня в клубе на Я.ру копирует мои статьи. На мое письмо ответила – ну я же ссылку ставлю!!! А толку мне с ее ссылки? Я сама таких могу понаставить сколько угодно.
Причем уже второй раз с ней переписываюсь. Первый раз она вообще ссылки не ставила. Те статьи, что я у нее нашла она в тот раз удалила.
Сейчас смотрю – весь мой блог скопирован в ее г-но-клуб.
И что я с ней сделаю? Написала еще раз, только она по-моему не понимает категорически.


Dashline оставил(а) комментарий 22 января 2011 в 15:19 #

Юля, ты очень во-первых негативно реагируешь (нужно равнодушнее к этому относится, по-деловому). А во-вторых, комментарий Марины – выше твоего первого комментса прочти. Если копируют в Я.ру, то не нужно бодаться с пользователями – сразу не сняли – пишешь в администрацию и все. Там (в Я.ру) на два счета удаляют копипастеров.

И спокойнее, хладнокровнее нужно к этому относиться. Тогда гораздо все успешнее складывается. Как только ты начинаешь на людей наезжать – они перестают тебя слушать. Ну скопировали статью, это же не делает всех их поголовно пропащими людьми. А если по незнанию? А если наоборот им кажется, что они тебе пользу приносят? Смысл ругаться и обличать? Выключай эмоции, когда садишься копипаст смотреть. Это же не конец света, правда?

Пиши сухо, вежливо, толково – опиши ситуацию, предложи снять статью, напиши (без грубости!), что если не снимут, обратишься в администрацию, хостерам и т.д. и т.п.

И не стоит ждать 100% результата. Да, не все реагируют, иногда бывают неудачи. Но если не заморачиваться и не злиться, то 70-80% это приличный результат, чтобы потратить немножко сил на письма.

PS: Юль, если ты мне просто ищешь дружеского сочувствия – то я тебя очень хорошо понимаю и сочувствую. *KISS* А то иногда даешь советы, а оказывается, что нужны были просто ответные эмоции. Но если нужен результат – весь мой алгоритм действий перед тобой, и он работает (на 70-80% ;) ).


Raila оставил(а) комментарий 22 января 2011 в 18:26 #

Не, Даш, я с тобой полностью согласна :) Просто так не наезжаю никогда. Я всегда сначала вежливо и спокойно прошу удалить статьи. И только когда люди сопротивляются – «мой клуб, что хочу, то там и публикую». Тогда я уже начинаю злиться. *SUSEL*

Сейчас, кстати, перечитала свой комент – выглядит он очень эмоционально, да :) Но на самом деле эмоций не так много.

А комент Марины я проскочила :) И правда, в поддержку напишу, да и всё :)

Спасибо за алгоритм действий *KISS*
В принципе, по выдаче я всегда выше, чем в ЛИ-ру и Я-ру.
Но все равно как ты верно заметила «хочется, чтобы мои статьи люди читали у меня на сайте» :)


Поговорите со мной

Имя: 
E-mail: 
Ваш вебсайт (если есть): 
Правила комментирования
Комментарий: