Тулзы Ленивого — Проверка ссылок, подарок к 23-му

Всех с праздником, прошедшим. Отладка, будь она не ладна, особенно по edge—gprs, заставила на сутки задержать публикацию поста. Ну да ладно, лучше поздно, чем никогда.

Анонсированная в Твиттере страничка нашла своё воплощение. Итак, встречайте Тулзы Ленивого.

Пока всего один инструмент есть, Проверка ссылок. Эта тулза жила у меня больше года (а может и двух) в закрытом режиме, тулза полезная.

Для чего?

Есть у меня правило, при покупке ссылок: «Если сомневаешься в качестве ссылки, откажись и купи другую». А выше указанный инструмент позволяет автоматом отсеивать ссылки, в которых я сомневаюсь, по очевидным факторам (визуальным, фильтр url).

Как использовать?

Опять же, ничего сложного.

  1. Идём в sape (или другую биржу) в интерфейс оптимизатора на страницу Новые заявки (можно и старые прошерстить, но не рекомендую, если уж купили — пусть висят) и Экспортируем страницы, на которых предлагают купить ссылки (Экспорт всех данных → URL страницы → TSV (остальные галочки снять)).
  2. Открываем отданный сапой файл текстовым редактором и копируем его содержимое в textarea тут.
  3. Получаем список сомнительных ссылок. Я, как правило, сразу отказываюсь от них в сапе.

Всё, этап для которого нужна эта тулза закончен. Далее можете устроить проверку УВ, YP, GC. От не прошедших отбор — смело отказывайтесь, ведь на их место найдутся ссылки, которые его пройдут. А это позволяет нам сказать что такие ссылки будут более качественные.

Для чего использовать?

Решать Вам. Все мои ссылки перед покупкой в обязательном порядке проходят эту проверку, и те что для тица и другие, что для серпа.

Благодарности

Делать платной тулзу или принимать донатионы мне не позволяет совесть. Так что пользуйтесь в своё удовольствие.

Лучшая благодарность — небольшой пиар в вашем блоге или твиттере. Ответную ссылку получите из блока ЯППБ справа ;)

ps. заметите глюки, пишите в комментариях.

Ленивый бомж

Аватар пользователя Гость
#1 24 Февраль 2010 - 20:30

Ленивый, извините что не в тему а что у вас за плагин стоит, который выводит ЯППБ???


Аватар пользователя Ленивый бомж
#2 24 Февраль 2010 - 20:40

Просто пхп-снипет, который инклудит файл .html, который генерируется php скриптом, запускающимся по крону.


Аватар пользователя Гость
#3 24 Февраль 2010 - 20:50

а напишите подробнее пжл 351715126, буду благодарен, хотел такую к себе на сайт


Аватар пользователя Ленивый бомж
#4 24 Февраль 2010 - 20:56

Куда уж подробней?

Парсите ЯППБ, преобразуете в нужный вам формат, инклудите в нужный блок на сайте. Всё.

ps. аськой не пользуюсь.


Аватар пользователя Гость
#5 24 Февраль 2010 - 21:14

А что тулза то чекает?


Аватар пользователя Ленивый бомж
#6 25 Февраль 2010 - 16:57

Я объясню тут, так как вопросов достаточно много накопилось и не все поняли фразу фильтр url.

Вбиваем адреса в тулзу:
http://site.ru/forum/
http://site.ru/webcatalog/
http://site.ru/links/index.html
http://site.ru/showthread.php?p=1

Да же не опытный seo-шник посоветует не покупать с этих страниц ссылок. Тулза как раз пытается автомтом вычислить максимум таких сомнительных урлов.

Как писал, порой и нормальные сайты попадут, но всегда на их место можно найти замену.



А можно подробнее про это? Есть какая-то открытая официальная инфа от поисковиков что URL вида http://site.ru/webcatalog/ имеет меньший вес как донор? И кто эти СЕО-шники, что советуют не покупать с них ссылки?
Или вы имеете ввиду что нежелательность проявляется только в ключевых словах в URLe (типа links, webcatalog и пр.)? Тоже бред, т.к. обозвать что угодно можно хоть как.


Аватар пользователя Ленивый бомж
#8 1 Март 2010 - 15:48

Это из опыта. Тулза прежде всего для очистки от страниц движков со стандартным ЧПУ.

Пример. Мы знаем что со страниц, где мало контента ссылки в теории должны работать хуже. Мы находит такие движки и по признакам исключаем эти страницы (например cat_id=, /links), тем уменьшая процент покупаемых ссылок с таких страниц.

Я считаю что это логично.


Аватар пользователя Михаил
#9 24 Февраль 2010 - 22:11

Тнтересная тулза, а можно хоть чуть-чуть раскрыть ее алгоритм? Чтоб при продаже ссылок не влететь в "удалено urls" ?


Аватар пользователя Ленивый бомж
#10 25 Февраль 2010 - 16:58

Полностью 100% страниц под фильтр не попадут, только если специально ЧПУ на сайте заточить под тулзу.


Аватар пользователя Программист
#11 24 Февраль 2010 - 23:32

Можно подробнее о том что делает данная тулза? И как по url можно определить не качественность ссылки?


Аватар пользователя Ленивый бомж
#12 25 Февраль 2010 - 16:59

Аватар пользователя Моторокер
#13 24 Февраль 2010 - 23:44

> Получаем список сомнительных ссылок. Я, как правило, сразу отказываюсь от них в сапе.

Что такое "сомнительных ссылок"? Каковы критерии сомнительности?


Аватар пользователя Ленивый бомж
#14 25 Февраль 2010 - 16:59

Аватар пользователя Антонинка
#15 25 Февраль 2010 - 1:49

Спасибо за полезную тузлу. Поюзаем:)


Аватар пользователя Сергей
#16 25 Февраль 2010 - 5:54

Попробовал , проверил ссылки, пару штук ваша тузла отбраковала. Хоть и не нашел ничего подозрительного, правда были косвенные подозрения. Оттолкнулся все же от авторитета разработчика. Хотелось бы использовать не вслепую, по каким характеристикам бракуется?


Аватар пользователя Ленивый бомж
#17 25 Февраль 2010 - 17:00

Как раз косвенные подозрения подкрепляют мою мысль: «Если сомневаешься в качестве ссылки, откажись и купи другую».

http://lazyhomeless.ru/node/25#comment-1175


Аватар пользователя Kaerdan
#18 25 Февраль 2010 - 7:35

Как я понял тебе нужны человекоподобные url?

Пошел пользоваться. Спасибо.


Аватар пользователя Ленивый бомж
#19 25 Февраль 2010 - 17:01

Мне? Мне нет.

Оптимизаторам не помешают. Тулза немного на другое нацелена, на скрипты, движки со стандартным ЧПУ.


Аватар пользователя SabaN
#20 25 Февраль 2010 - 8:20

Тоже присоединяюсь к вопрошающим о алгоритме скрипта.


Аватар пользователя Ленивый бомж
#21 25 Февраль 2010 - 17:08

Аватар пользователя Алтайский блогер
#22 25 Февраль 2010 - 10:18

Хорошая тулза. Спасибо.


Аватар пользователя Content Provider
#23 25 Февраль 2010 - 10:31

Ввел URL страницы, выдало: Что-то совсем тут плохо! Наверное, с ГСов покупаем ссылочки?

При том, что ТИЦ 130 (естественный, без всякой сапы), сайт в ЯК (взяли бесплатно), домену 4 года.
Страниц в поиске по Я.вебмастер -- 8К+
Сайт ссылками не барыжит (только контекст и продажа баннеров).

Если это -- ГС, покажите мне тогда белый и пушистый сайт :)

P.S. офф: капча каким модулем делается? Можно ссылку на страницу модуля на сайте Друпала?


Аватар пользователя Ленивый бомж
#24 25 Февраль 2010 - 17:02

На маленьких объёмах можно не смотреть на надпись. Тулза рассчитана на обработку больших списков url. Я сам ей пользуюсь, скармливаю тысячами ;)

http://drupal.org/project/captcha


Аватар пользователя Content Provider
#25 27 Февраль 2010 - 16:35

Ага, спасибо за ответ.

Было бы удобно, если бы у вас стоял http://drupal.org/project/comment_notify
Иначе приходится заглядывать смотреть, ответил кто-то или нет.


Аватар пользователя Ленивый бомж
#26 27 Февраль 2010 - 20:06

Готово ;)

Хороший модуль.


Аватар пользователя Гость
#27 25 Февраль 2010 - 10:57

Тоже интересен принцип отсева плохих ссылок.
Что исключаем?


Аватар пользователя chii
#28 25 Февраль 2010 - 11:54

вчиталась в каменты.. а какие еще бывают диагнозы, кроме "можно купить более хорошие"? =)
алгоритм не понимаю, но с моими выводами совпадает 100% - часть ссылок у меня хреновая, зато дешевая - эксперименты ставлю. )
а скорость работы подсказывает мне, что он просто проверяет урлы по базе, на сами сайты не ходит, да? видела такой gbl у бурундука, а этот по какому принципу составлен?


Аватар пользователя Ленивый бомж
#29 25 Февраль 2010 - 17:10

http://lazyhomeless.ru/node/25#comment-1175

На сколько помню, у Бурундука большой чёрный список. Здесь белые-чёрные списки не используются.


Аватар пользователя Антон
#30 25 Февраль 2010 - 12:29

работает просто - отсеивает всякий хлам - в url forum, user, topic и т.д., отсеивает так же страницы, у которых УВ мог измениться (в url page), страницы без контента - user, search

в общем - хорошая тулза, буду пользоваться при покупке ссылок, но старые из-за неё снимать не стану)))


Аватар пользователя chii
#31 25 Февраль 2010 - 12:38

нифига - урлы на такую мусорность проверяются саповским плагином. это было бы глупо ) их вроде вообще не покупают, не?


Аватар пользователя Антон
#32 25 Февраль 2010 - 13:07

у меня в сапе сайт с некоторыми такими урлами - все продается нормально


Аватар пользователя Ленивый бомж
#33 25 Февраль 2010 - 17:12

Ага.

Старые ссылки снимать не следует. Если ссылка провисела два года, то очень глупо от неё отказываться из-за такого фактора.


Аватар пользователя Truth Hunter
#34 25 Февраль 2010 - 14:23

Ленивый, афигенская тулза!
Если не совсем лениво, сделай плиз исключение для урлов Jooml-ы вида: /index.php?page=shop.browse&category_id=3&option=com_virtuemart&Itemid=8
Тулза режет их за слово "category", но в этом случае это не показатель того, что это страница категории, так джумла составляет свои урлы. А ЧПУ, к сожалению, не каждый хостинг выдерживает.
Мне думается, стоит сделать исключение для урлов, содержащих слово "com_virtuemart", т.к. такие магазинчики попадаются в сапе каждый день. А пока добавил у себя промежуточный фильтр, чтобы не показывать такие ссылки твоей шайтан-машине)


Аватар пользователя Ленивый бомж
#35 25 Февраль 2010 - 17:15

Надо подумать, стоит ли.

Одно тут плохо, многим оптимизаторам не нужны такие сапа-магазины. За частую на страницах и контента-то мало.

Надо поискать примеры сайтов. Спасибо за замечание ;)


Аватар пользователя Эмиль Кабанов
#36 25 Февраль 2010 - 23:00

А можно посмотреть на полный список фильтров этой тулзы?


Аватар пользователя Ленивый бомж
#37 26 Февраль 2010 - 0:12

Не планировал палить список, тем более он будет обновляться.


Аватар пользователя Эмиль Кабанов
#38 28 Февраль 2010 - 13:58

Ясно, ну ладно, будем определять его экспериментально :)


Аватар пользователя Ленивый бомж
#39 1 Март 2010 - 15:49

Если есть наблюдения, что можно ещё в него включить, пишите в комментариях или на почту из хуиза.


Аватар пользователя Rudman
#40 26 Февраль 2010 - 10:40

Сорри за нубское мнение, но у меня такое ощущение, что плагин просто тупо проверяет на индексацию и попадание в выдачи Яши :)

Что бы проверить догадки банально прогнал пару сайтмапов :) количество оставшихся страниц после анализа приблизительно везде соответсвует показателю проиндексированных страниц по версии панели вебмастера яши ;)


Аватар пользователя Ленивый бомж
#41 26 Февраль 2010 - 11:58

А скорость работы скрипта вас не удивило?

В принципе полученные вами результаты, доказывает что с отсеиваемых страниц ссылки лучше заменить на менее сомнительные. Яше они тоже не нравятся.

К Яше обращений нет.


Аватар пользователя Tolsty
#42 26 Февраль 2010 - 12:31

Спасибо, попробую!


Аватар пользователя nofollow
#43 26 Февраль 2010 - 16:24

>В принципе полученные вами результаты, доказывает что с отсеиваемых страниц ссылки лучше заменить на менее сомнительные. Яше они тоже не нравятся.
Не совсем так или даже совсем не так. ;) Правильное замечание Rudman легко можно (и нужно:) развить до следующего: проверка индексации страницы в Яндексе плюс Гугле -- является более точным (и более универсальным) определением "качественности" в плане как кандидата в доноры, перекрывая функциональность "эмпирических вариаций", в частности, например, и представленную тулзу (собственно, как и большинство других "автоматических" средств).
Т.е. более простым способом (индекс Я+G) - можно добиться большего эффекта и точности. Хотя, конечно, в плане скорости, помноженной на объёмы для закупки говноссылок - представленная тулза лучше. А для более дорогих и когда есть время подождать проверки индексации - таки индекс Я+Г лучше.
Как вариант, конечно, их скрестить. Но, думаю, в последнем случае количество отсеянных быстро вызовет уныние (и, наоборот - просветление - в осознании процента качественных доноров в сапе ;).


Аватар пользователя Ленивый бомж
#44 26 Февраль 2010 - 17:46

Эта тулза отсеивает у меня процентов 20-40% ссылок, остальные добиваю проверками Винковского плагина.

Ну на счёт уныния, оно давно настало, с тех пор как ещё массово в сапу форумы и каталоги добавляли сеошники. В те времена и появилась идея.


Аватар пользователя nofollow
#45 26 Февраль 2010 - 18:24

Думаю не совсем корректно (заочно) приравнивать форумы к "плохим" (в плане SEO) донорам. Равно как и каталоги. Всё же правильней их делить с учётом того, как поступают ПС (как минимум - декларируют свой подход к этому). Т.е. с учётом модерируемости и условной "трастовости", при наличии в ЯК, с малым количеством исходящих - это вполне нормальные доноры. Даже можно сказать и где-то "рекомендумые" - в плане всё той же "естественности".


Аватар пользователя Антон
#46 26 Февраль 2010 - 20:17

ещё одно пожелание - можешь так подкрутить, что бы в результатах разные ссылки были в разных окнах - то есть, те ссылки, что имеют сомнительные урл не отображались в верхнем окне - типа, эти можно проверить на индексацию, а эти покупать не стоит :)


Аватар пользователя Антон
#47 26 Февраль 2010 - 20:24

сорри, догнал, можно сразу отменить размещение этих ссылок, а потом заново имортировать и оставшиеся проверять на индексацию )))


Аватар пользователя Ленивый бомж
#48 26 Февраль 2010 - 23:06

Я так и делаю, делал так, чтобы себе удобно было.

Если вдруг какой-то другой вывод потребуется, можно написать, реализовать не сложно.


Аватар пользователя Гость
#49 28 Февраль 2010 - 11:07

Спасибо за тулзу. Небольшое замечание.
Можно ли (и стоит ли?), сделать так, чтоб фильтр накладывался на часть урла после самого адреса сайта?
Например: тулза зафильтровала адрес http://xakep-archive.ru/xa/081/124/1.htm, потому что в самом адресе сайта есть подозрительное слово archive (сам сайт конечно стоит того, чтоб его отправить в GBL, но ведь так можно и хорошие сайты удалить).


Аватар пользователя Ленивый бомж
#50 1 Март 2010 - 15:51

Такие сайты попадают редко, но с ситуацией знаком. Когда исключают домены со словом warez или porno, я не особо огорчаюсь.

archive — поправлю, спасибо.


Аватар пользователя Гость
#51 1 Март 2010 - 23:52

Не только archive, про слово tag тоже не забудьте, плиз...


Аватар пользователя Truth Hunter
#52 1 Март 2010 - 14:13

А вот эти партизаны пролезли мимо фильтра :)
http://www.***.ru/electronic/usb_flash_drive/page52
http://www.***.ru/video/tv_plasma_display/page69
http://www.***.ru/portable/mp3_player/page27
и еще пачка похожих


Аватар пользователя Ленивый бомж
#53 1 Март 2010 - 15:54

Вот гады!

Сяду вечером вносить изменения,
тут поможет фильтр по подстроке
/page


Аватар пользователя K-ost
#54 8 Март 2010 - 21:40

Воспользовался вашей тулзой, не все, но отсеял несколько плохих ссылок. Спасибо. Еще было бы удобнее, если бы после проверки, в верхнем окне оставались только "хорошие" ссылки.


Аватар пользователя Ленивый бомж
#55 9 Март 2010 - 1:55

А чем удобнее?

Отказываемся в сапе от плохих и уже работаем далее с остатком, у меня на следующей стадии модуль Винка подключается.


Аватар пользователя K-ost
#56 9 Март 2010 - 2:16

Ну в принципе да, как то сразу не подумал, сорри. Просто я сначала проверить какие хорошие.


Аватар пользователя Гитарист
#57 17 Март 2010 - 1:08

Извините, я не понял. А что делать с плохими ссылками? Вручную проверять теперь каждую строчку в сапе и отказываться? А если список огромный?


Аватар пользователя Ленивый бомж
#58 17 Март 2010 - 2:32

Отказывайтесь от них не глядя, а проверяйте лучше оставшиеся. Среди них тоже шлак есть.


Аватар пользователя Sciper
#59 19 Март 2010 - 20:48

>Извините, я не понял. А что делать с плохими ссылками? Вручную проверять теперь каждую строчку в сапе и отказываться? А >если список огромный?

Возможно вопрос был в другом. Как автоматом пометить все ссылки на сапе и отказаться от них. Там есть специальное окошко, пометить галочкой следующие урлы, загружаете в это окошко список черных сайтов, Пометить - Отказаться.. Вот и все.


Аватар пользователя Ленивый бомж
#60 20 Март 2010 - 17:13

Ага, если вопрос в технике отказа, то присоединяюсь к ответу.


Аватар пользователя сергей
#61 3 Май 2010 - 9:26

Что скажешь насчет этого адреса?
http://iphonew.net/index.php/top/726.msg4933 вроде бы форум но твоей тулзой не палится.


Аватар пользователя Ленивый бомж
#62 3 Май 2010 - 22:57

Есть и на стандартных движках форумы с прикрученным ЧПУ, они тоже тулзой не вычисляются.


Аватар пользователя WeXX
#63 5 Май 2010 - 11:17

Доброго времени суток!
Скажите, пожалуйста, почему не желательно продавать ссылки на фарму? Просто много где натыкался на это данное - не советуют.


Аватар пользователя Ленивый бомж
#64 5 Май 2010 - 13:33

Фарма — считается чёрной нишей. В Америке запрещено торговать таблетками, если у сайта нет лицензии-акредитации (забыл как называется сертификат-разрешение). Соответственно и возможна жёсткая реакция Гугла.

Есть правило трёх «P»: porno, pharmacy, poker. Это скользкие тематики. Лучше держать сдлы подальше от ссылок на такие сайты.


Аватар пользователя WeXX
#65 5 Май 2010 - 13:54

А если ГС на мед тематику?)


Аватар пользователя Ленивый бомж
#66 5 Май 2010 - 15:13

Я бы стал продавать и фарму.


Аватар пользователя Seredovich
#67 3 Июнь 2010 - 12:08

Очень полезная тузла! Вначале проверяю ей, потом модулем винка на индексацию и ВС а уже то что останется проверяю визуально. Большой респект вам.


Аватар пользователя Ленивый бомж
#68 4 Июнь 2010 - 14:59

Я так же делаю ;)



Интересная тулза. Спасибо, по юзаем...

Отправить комментарий

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу. If you have a Gravatar account associated with the e-mail address you provide, it will be used to display your avatar.
  • Доступны HTML теги: <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Строки и параграфы переносятся автоматически.

Подробнее о форматировании

  • Доступны HTML теги: <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Строки и параграфы переносятся автоматически.
CAPTCHA
Опа, спам боты меня задолбали, по этому придёться сложить два числа.
CAPTCHA на основе изображений
Введите символы, которые показаны на картинке.