Решил я потестить свои киворды. База постоянно пополняется, так что то, что будет написано ниже, можно считать промежуточным экспериментом.

База кивордов - это важная составляющая работы любого специалиста по продвижению: белого, черного, фиолетового. Не важно, выбираете ли залоговок главной страницы сайта, пишите сообщение в тематических блог или составляете список запросов для продвижения - вам просто необходима база кивордов.

Есть куча бесплатных источников:

» http://direct.yandex.ru
» https://ad.rambler.ru/swrds/wrds.pl
» http://stat.go.mail.ru
» http://inventory.overture.com/d/searchinventory/suggestion/

Есть и платные. Например, популярная последнее время база Пастухова. Базу Пастухова я, конечно, приобрел. Там заявлено 44 млн кивордов - наверное, так оно и есть. Я пропустил эту базу через свой фильтр (отсек слишком длинные запросы и слова типа "dcashjhsdvfjavjabsaj", слишком короткие типа "a b c yo", запрещенные запросы типа "incest" и "preteen", спецсимволы всякие и т.п.) и удалил дубли - осталось 36 млн. Весьма неплохо.

Я "скрестил" его базу со своей - получилось >70 млн. Что же, это еще лучше! Думаю, месяц-другой и базу перевалит за 100 млн.

А теперь я решил сравнить, сколько слов по различным запросам у Пастухова и у меня. Он на сайте дает статистику по своей базе по 9 запросам:

home: 308000
levitra: 1038
teen sex: 1079
teen: 72990
pussy: 27804
porn: 55281
sex: 112407
model: 85391
nude: 70632

Теперь, что лежит у меня в базе (в скобках различие с Пастуховым):

home: 542 693 ( + 234 963 )
levitra: 3 404 ( + 2 366 )
teen sex: 3 787 ( + 2 708 )
teen: 166 534 ( + 92 544 )
pussy: 55 517 ( + 27 713 )
porn: 151 401 ( + 96 120 )
sex: 298 236 ( + 185 829 )
model: 165 521 ( + 80 130 )
nude: 169 432 ( + 98 800 )

Однако у меня нет всех тех данных, что собирает Пастухов: популярность, конкуренция, биды и т.п.



  • http://web3.0log.org/2006/09/02/3-unusual-tricks-to-not-give-se-robots-a-chance-to-waste-all-your-traffic/ samlowry

    Как собрана твоя база?

  • http://dimok.ru/ dimok

    Из всех найденных мною источников. Основной: давно парсю различные сервисы статистики поисковиков.

  • yaman

    в твоей базе ру и en-кеи все вместе чтоль, или только аглицкие?
    продавать планируешь?

  • http://dimok.ru/ dimok

    yaman, только РУ кеев в данной базе нет. Насчет продажы думаю, но пока не продается.

  • http://homelessinkamchatka.blogspot.com/ Nodachi

    Как надумаешь продавать – обязательно отпишись :-)
    Удачи!

  • http://web3.0log.org/2006/09/02/3-unusual-tricks-to-not-give-se-robots-a-chance-to-waste-all-your-traffic/ samlowry

    А как сделан софт работы с базой, и вообще база в каком формате хранится?
    Т. к. на десятках миллионов уже начинаются большие траблы с производительностью в том же мускуле.

  • http://dimok.ru/ dimok

    samlowry, у меня в файлике просто хранится (почти 2гб). Да, не быстро работает, но терпимо – все кеи по одному запросу выдернуть занимает несколько минут (под линухом быстрее). Ща пишем базу с индексом, как положено – тогда все будет значительно быстрее.

  • http://web3.0log.org/2006/09/02/3-unusual-tricks-to-not-give-se-robots-a-chance-to-waste-all-your-traffic/ samlowry

    А на чем пишете? Т. к. просто база – тормозит, шо писец.

    Кстати, глянь топик один в техничке – я недавно там разместил ссылку на энджин какой-то мегабыстрый, который юзает новые фичи мускула 5го. Как раз в масть, вроде бы.

  • http://dimok.ru/ dimok

    samlowry, ява. топег ща гляну.

  • http://darkseo.info DarkSEO

    > samlowry, ява. топег ща гляну.

    dimok, а можно плиз по-конкретней?
    ява оракл?

    просто у меня всего 7кк кеев, поле 50 символов.
    так при выборе по шаблону, в мускуле запрос около 2-х минут идет :(

    и если можно, то что за ссылку разместил samlowry ? (тоже бы почитал)

  • http://dimok.ru/ dimok

    >>ява оракл?
    ява дерби (http://db.apache.org/derby/)

  • http://costa-rica.com Costa-Rica

    dimok, а как с тобой можно в асе пересечься?

  • http://dimok.ru/ dimok

    Costa-Rica, мылом номер кинул

  • demy

    dimok, а можешь поделиться списком запрещенных слов для фильтра или указать на наиболее полный источник?

  • http://dimok.ru/ dimok

    основные:
    lolit
    child porn
    preteen
    undertee
    pedo
    incest

  • http://blog.gtalex.ru/ GTAlex

    Может ещё и регуляркой поделишся которой ты шлак из базы отсеивал ?

  • http://dimok.ru/ dimok

    GTAlex, нет, это мои ноухау в плане фильтрации мусора – несколько десятков регулярных выражений и почти 10 лямов «левых слов».

  • http://ppc-seo.blogspot.com Мониторинг Интернета

    Продавать Собираешься ? Если да то как и по чём ?

  • http://dimok.ru/ dimok

    Мониторинг Интернета, уже продаю месяц как ;) http://actualkeywords.com/ (121 миллион кивордов в базе)

  • http://www.ppc-seo.blogspot.com Мониторинг Интернета

    Заинтересован. Проанализирую.

  • vanya

    dimok, а нет ли у вас базы запросов по изображениям или м.б. знаете какие-нибудь источники, где они есть?

  • http://dimok.ru/ dimok

    vanya, пиши в аську с сайта – попробуем варианты.

1

Облако тегов

Связаться со мной можно по почте: dimokru@gmail.com или через твитер @dimokru (9877 фолловеров)

Последние комментарии

    follow me on Twitter

    ТОП комментаторы

    Статистика

    • Рейтинг блогов
    • Участник Blograte.ru