Seomoz собрал признаки, по которым можно определить спамерский домен, в один большой список. Вот он:

  • Длинные имена доменов
  • .info, .cc, .us и другие дешевые с простой регистрацией доменные зоны
  • Маленький срок регистрации домена (1, реже 2 года)
  • Большое количество блоков рекламы относительно контента
  • Javascript редирект на некоторых страницах
  • Использование сильно коммерческих кивордов типа "mortgage," "poker," "texas hold 'em," "porn," "student credit cards" и подобных
  • Множество ссылок на другие сайты столь же низкого качества
  • Мало ссылок на качественные трастовые сайты
  • Высокая плотность и частота кивордов
  • Мало уникального контента
  • Мало непоискового трафика
  • Домен зарегистрирован на людей/организации, не связанные с трастовыми сайтами
  • Не часто регистрируются в сервисах типа  Yahoo! Site Explorer, Google Webmaster Central или Live Webmaster Tools
  • Редко имеют короткие тематические имена доменов
  • Часто содержат множество субдоменов с кивордами в именах
  • Часто содержат множество дефисов в именах доменов
  • Редко имеют SSL сертификаты
  • Редко зарегистрированы в категориях типа DMOZ, Yahoo!, Librarian's Internet Index и подобных
  • Редко имеют существенное количество поисков по имени сайта
  • Редко попадает в закладки на сервисах типа  My Yahoo!, Del.icio.us, Faves.com и подобных
  • Редко упоминается (и главное редко получает голоса) на социалках типа Digg, Reddit, Yahoo! Buzz, StumbleUpon и подобных
  • Вряд ли у них есть каналы на YouTube, сообщества в Facebook или ссылки с Wikipedia
  • Вряд ли упоминаются на крупных новостных сайтах
  • Вряд ли зарегистрированы в Google/Yahoo!/MSN Local Services
  • Редко имееют реальных почтовый адрес и телефон на сайте
  • Часто имеют имя домена, связанное с е-мейлами из блеклистов
  • Контент часто неоригинальный
  • Вряд ли содержат уникальный контент в форматах PDF, PPT, XLS, DOC
  • Часто ориентированы исключительно на коммерческий контент
  • Редко содержат страницы с копирайтами и прайваси
  • Редко цитируется на других сайтах
  • Клоакинг по user-agent или IP
  • Вряд ли запускают онлайновые или оффлайновые рекламные кампании
  • Редко на них ссылаются через реферальскую ссылку
  • Редко размещаются в доменных зонах .com и .org
  • Практически никогда не размещаются в доменных зонах .mil, .edu или .gov
  • Редко на них ссылаются с сайтов в доменных зонах .edu или .gov
  • И практически никогда не ссылаются на них с сайтов в доменной зоне .mil
  • Редко имеют высокую посещаемость
  • Крайне редко пользователи задерживаются на таких сайтах больше 30 секунд
  • Вряд ли покупают трафик на ППЦ
  • Редко покупают баннерную рекламу
  • Совершенно нереально, чтобы их упомянули или сослались на них в научных статьях
  • Редко создаются на платных движках
  • Часто зарегистрированы на реквизиты, на которые зарегистрировано огромное количество доменов
  • Редко получают ощутимый трафик от повторных визитов
  • Есть вероятность,что на них будут вирусы, спайваре и т.п.

Для сайтов с качественным контентом справедливо обратное.

Читать в оригинале (там чуть больше пунктов): Separating Web Spam from Quality Content - What are the Metrics?



  • http://domohozyaika.com jt

    информация интересная, но это все для блогов, на сайтах редко оставляют комментарии в основном на форуме сидят. А если так много спамеров, зачем делать поле для сайта. Смотрела рейтинг самых популярных блогов мира, там редко встретишь поле для сайта и чаще всего необходима регистрация, чтобы оставит комментарий

  • http://radzevich.info VampiR

    Имхо, 90% от всего перечисленного справедливо только для западных корпоративных блогов.
    Для русскоязычных тут мало, что подходить. Для западного, но не корпоративного – тоже

  • http://fireball-777.in/ fireball-777

    Очевидная информация.
    //Редко на них ссылаются с сайтов в доменных зонах .edu или .gov
    И практически никогда не ссылаются на них с сайтов в доменной зоне .mil // самые странные признаки,у меня вот тоже нет с них ссылок.

  • http://blogproblog.com/wordpress_rss_only_post/ Как отправить пост только подписчикам RSS | Блог про блоги от Дмитрия Донченко

    [...] Как отличить спам от качественного контента [...]

  • http://miku.ws Miku

    .us домен легко зарегать?
    его могут зарегать только резиденты США

    Кстати, одной из самых спамовых/завирусованных доменных зон считается .ws

  • http://dimok.ru/ dimok

    Да, легко регается на любых регистраторах этот домен…

  • http://azakharov.ru/2008/03/20/o-reklame/ СкАЗки – блог Александра Захарова » Blog Archive » О рекламе

    [...] скриптум: • Как отличить спам от качественного контента • Чем болеют блоггеры? • Интервью с Андреем [...]

  • http://www.molchun.ru/?p=1481 Как отличить спам от качественного контента : Блог Молчуна

    [...] Seomoz собрал признаки, по которым можно определить спамерский домен, в один большой список. Вот он Дальше [...]

  • http://divanchick.ru Ленивец

    >>>Большое количество блоков рекламы относительно контента

    Сейчас у многих блогеров столько рекламы висит, что иногда диву даешься, особенно, если при отключенной графике и flash просматриваешь блог. 60% пустого места блин.

  • http://virtual-lab.ru/72-faq-po-bloggingu/ FAQ по блоггингу – Virtual-lab

    [...] Как отличить спам от качественного контента [...]

1

Облако тегов

Связаться со мной можно по почте: dimokru@gmail.com или через твитер @dimokru (9837 фолловеров)

Последние комментарии

    follow me on Twitter

    ТОП комментаторы

    Статистика

    • Рейтинг блогов
    • Участник Blograte.ru