Как собрать Доски объявлений для своей базы рассылки

 

    Не настолько и сложно это на самом-то деле. Хоть и есть нюансы.Так что давайте с этим вопросом и разберемся.

 

                                     Использование возможностей программы Smartposter

 

   В программу встроена прекрасная возможность эту базу собрать.

 

Жмите эту кнопку                          и четыре поисковые системы в Вашем распоряжении.

 

   А в форме вводите поисковые операторы.

Все основные – описаны в справке к программе, а сам процесс – еще и в специальном видеоролике.

http://www.bspdev.ru/Video/SP_Lesson3/SP_Lesson3.html

 

   Поэтому не буду я «отбивать хлеб» у разработчиков. Они славно потрудились и над этим вопросом. Что не так-то часто и

встречается вообще то…

 

   Преимущества – налицо: система поиска интегрирована в программу, а посему одновременно с собственно поиском:

  • 1.      Проверяет найденные доски на повторы (есть ли каждая из них уже в Вашей БД)

  • 2.      Автоматически находит формы для ввода объявлений.

  • 3.      Да и, заодно уж, и существует ли найденный адрес реально в настоящий момент.

   N.B. Интернет большой, поисковые роботы обходят его достаточно медленно. Волей – неволей найденные адреса вполне могут

уже и несуществующими оказаться. По множеству причин.

  • 4.      Определяет, по ходу дела, и ТИЦ / PR для найденного. Что тоже не вредно, верно?

   Кроме того, есть и еще целый ряд серьезных дополнительных возможностей настройки поиска. Вплоть до загрузки

«Множественных запросов». Есть резоны и с ними разобраться.

 

Так что, уверяю Вас – пользоваться для собирания базы именно этим инструментом – резон есть!

 

      В результате получаете что-то вроде вот такого списка.

 

 

    Вот и все! Загружайте его в нужную Вам рубрику и пользуйтесь на здоровье!

 

                                                   Другие способы собирания базы Досок

 

   А вот это – целая здоровенная специализированная область в Инете. Даже название для этого дела есть. Парсинг.

   Под которым, в данном случае, понимается сбор адресов досок, каталогов, гостевых, блогов и форумов для дальнейшего их

использования.

   Хотя, в сущности, все сводится к двум вопросам:

  • ·         Какие программы использовать

  • ·    Как составить сами поисковые запросы

   Ну и, конечно, множество нюансов выплывает. Которые тоже стоит знать / понимать.

 

N.B. Ну например:

  «Терпение» при таком парсинге у любой поисковой системы кончается довольно быстро. В результате поиск и выдача досок

прекращается, причем, как обычно, в самый неподходящий момент.

   А Вы получаете вопрос примерно такого вида

 

    Что дальше то делать??? Вот – первая проблема.

Поисковые системы стараются ограничить выдачу результатов, а наш интерес – количество этих результатов увеличить, верно?

 

Есть и такой вопрос. Ну, собрали Вы базу. Большущую!

Так ведь ее еще в Smartposter ввести надо. Почистить дополнительно. Настроить предварительно. И, в процессе всего этого,

максимально убрать из нее «мусор». А уж только потом начинать ее настраивать окончательно.

 

    А это как сделать? Вот – вторая проблема…. И вовсе немало «по пути» проблем таких возникает…

Что и создает у некоторых товарищей впечатление жуткой сложности, трудной решаемости задачи собирания собственной базы

Досок объявлений.

    Вот так и сводится проблема к простым решениям: «Где бы найти готовую базу»?  Или: «А у Вас есть такая база»?

            А ведь набрать доски, нужные именно Вам, конкретно Вам, под Ваши конкретные потребности не так то и сложно.

 

N.B. Дело однако в том, что вопросы эти мне постоянно задают. А развернуто ответить на них по ICQ невозможно

по определению. Вот и решил я выложить для Вас хотя бы «основы основ» этого дела.

  

                                                         Какие программы использовать для парсинга

 

Их много на самом деле. Я приведу только две. Бесплатные. Остальные, если потребуется, Вы и сами найти сумеете, верно?

 

                                 AGGRESS Parser 2.0

                                                                                          http://vector-seo.info/

 

 

   Скажу сразу: этой программой я не пользовался толком. Не потому, что плохая. Просто «руки не дошли».

Но отзывы о ней весьма неплохие. Так что, будет желание – разберитесь.

 

                                      Yandex Parser 0.0.0.6

                      http://topperharley.ru/2009/06/yandex-parser-parser-yandeksa-besplatno/

 

   Вот с этой программой я занимался гораздо больше. Потому о ней Вам и расскажу.

 

 

Программа может искать в Яндекс и Google  Выводит все найденное в список формата *.TXT

Проверяет адреса на повторы.

Может выводить адреса как с «полным путем», так и без него.

Загружает запросы либо в кодировке Windows 1251, либо в UTF-8 (Юникод)

  Так что обратите внимание – текст в этом окошке д.б. «читабельным». По русски :)

 

   Есть и еще одна опция – «Сохранять ключи в результате».

Вот ей пользоваться наверное не стоит. Иначе в TXT файл будет перед каждым адресом выводиться примерно такой ключ:

 

 inurl:add.html site:.info title:объявление: http://www.aleksin-info.ru/board/add.html

 

и вводить такой список в Smartposter будет трудновато.

 

И еще пара комментариев к этой программе.

1.      Использовать в программе парсинга есть смысл так называемые «Множественные запросы». Вводятся они кнопкой

 

2.      Есть и регулировка паузы между запросами.

      Я с ее помощью пытался увеличивать «терпение» поисковых систем.

Ставил паузу -14, 29 и 49 секунд. Разницы, к сожалению, не заметил.

 

Вот и все о собственно программе.

Дальше – загружаете запросы и жмете кнопку   J

И любуетесь на процесс нахождения Ваших досок объявлений.

 

А теперь давайте хоть немного разберемся

Как составлять запросы для поиска

 

Сформулируем, что должно быть в любом запросе.

1.      Собственно форма, куда мы наши объявления вводить хотели бы.

В формате .html или .htm

Например: add.html и add.htm

2.      Нужная Вам группа сайтов (домен)

Например: .ru, .ua,.by, info, .org, biz,.com. Или другие (к примеру, национальныеUS, UK, FR, IL) домены.

3.      Слова, содержащиеся в заголовке.

Например: Объявление, Доска объявлений, Добавить объявление, Создать объявление и т.д.

 

   В результате у нас с Вами получилась некая система запросов. Вполне упорядоченная и управляемая.

 

   Вот и давайте её реализуем. Для поиска Досок объявлений.

 

С помощью программы SEO Generator  (http://www.seogenerator.ru/) и «доброго слова» в виде конструкции { | | | }

 

 

N.B. Как видите программу SEO Generator можно (и нужно) использовать не только для генерации Вариантов Ваших

объявлений, но и в данном случае. Для генерации Множественных запросов.

 

  Перечислю чуть подробнее упомянутые выше составные части запросов. Их варианты.

Вы же, в свою очередь, всегда это дело и расширить можете. Или совсем другие варианты применить.  (В варианте для Яндекс)

 

Название формы для ввода объявления:

inurl: add.html, new.html, doska.html, announc_add.html, obyavleniya.html, adddesk.htm, boardadd.html, new.html, addform.html, board_add.html,

dobav.html, add.htm, new.htm, doska.htm, announc_add.htm, obyavleniya.htm, adddesk.htm, boardadd.htm, new.htm, addform.htm, board_add.htm,

dobav.htm

 

Домены сайтов для поиска

domain:. .ru, .ua, .by, .info, .org, .biz, .net, .com

 

Текст в заголовке

title:объявление, доска объявлений, разместить объявление, добавить объявление, создать объявление.

 

А вот Вам и полный текст шаблонов Множественного запроса для поиска Досок объявлений.

С примененной конструкцией { | | | }    Можно просто скопировать их и вставить в SEO Generator

 

    Вариант запроса для Яндекс

 

inurl:{add.html|new.html|doska.html|announc_add.html|obyavleniya.html|adddesk.htm|board.html|boardadd.html|addform.html|

board_add.html|dobav.html|add.htm|new.htm|doska.htm|announc_add.htm|obyavleniya.htm|adddesk.htm|boardadd.htm|addform.htm|

board.htm|board_add.htm|dobav.htm}domain:{.ru|.ua|.by|.info|.org|.biz|.net|.com}title:{объявление|доска объявлений|разместить объявление|добавить объявление|создать объявление}

 

    Вариант запроса для Google

 

inurl:{add.html|new.html|doska.html|announc_add.html|obyavleniya.html|adddesk.htm|boardadd.html|addform.html|board.html|

board_add.html|dobav.html|add.htm|new.htm|doska.htm|announc_add.htm|obyavleniya.htm|adddesk.htm|boardadd.htm|addform.htm|

board.htm|board_add.htm|dobav.htm}site:{.ru|.ua|.by|.info|.org|.biz|.net|.com}intitle:{объявление|доска объявлений|разместить объявление|добавить объявление|создать объявление}

 

      N.B. Разница в синтаксисе запроса (применяемых поисковых операторах).

·         Для Яндексinurl:, domain: и title:

·         Для Google  – inurl:, site:   и  intitle:

 

   Далее – вставляете запрос, жмете   

Получаете на выходе список из более чем 800 вариантов запросов

 

и сохраняете получившийся «Множественный запрос».

 

   N.B. Кстати. Использовать этот множественный запрос можно не только в специализированных программах парсинга, но и

прямо в Smartposter.

   Что, пожалуй, даже и предпочтительней.

 

 

                              Как побороть «мелкие пакости» Яндекс

 

            Восемьсот (!!!) запросов. Да «ни в жисть» у Яндекса терпения не хватит, чтобы сразу их обработать! Обязательно (и не раз) доказательств затребует. Что Вы не робот!

 

   Вот и приходится волей неволей разбивать этот запрос на множество более мелких.

 

   Система примерно такая.

Вот хотим мы «по максимуму» доски найти. Поэтому и обрабатываем все распространенные домены. (domain:{.ru|.ua|.by|.info|.org|.biz|.net|.com})

 

   Я бы посоветовал делать это отдельно.

1.      Первый множественный запрос – только с доменом RU – (domain:.ru)

2.      Второй – с доменом UA (domain:.ua)

3.      И так далее…

 

   Тогда количество вариантов в получившихся у нас запросах сразу примерно до 100 сократится…

Но, и 100 вариантов Яндекс не выдерживает! Так что придется Вам и эти 100 вариантов «порциями» загружать.

 

   И, даже в этом случае, время от времени Яндекс Вас «под подозрение» будет ставить!

Правда, если и в «мелких порциях» запросов он Вас проверять захочет – все уже проще…

Останавливаете поиск. Подтверждаете, что Вы не робот. (Честно, между прочим, подтверждаете!). И запускаете все «по новой».

 

   Вот видите, как оно все: просто, но хлопотно, на самом то деле!

Я обычно, когда базу досок решаю набрать / расширить – сразу целый день для этого выделяю.

    Хлопотно…Хотя и просто… Но хлопотно…

 

   Так что волшебного, «петушиного слова» я не знаю!

Чтобы вот такой – растакой «секретный» запрос составить…Один!

Да чтобы он все – все доски! За один проход!

Из всех - всех поисковиков повытаскивал!

   Не получается так.

Хочется базу новеньким пополнить – волей неволей «впахивать» приходится! Труд свой вкладывать.

 

 

                     Как ввести и обработать списки досок в Smartposter

 

А теперь об очередном (но далеко не последнем вообще то) этапе.

 

Всё! Мучились! Пахали! Составили список досок! Огроменный!

                                                                                       от такой, например:                      Доски_новые.txt

Теперь его обработать надо. Пользу из него извлечь!

 

Создаем для него рубрику. Пусть она называется «Доски для настройки»

 

 

Открываем вкладку «Работа с базой», жмем кнопку «Импорт адресов из файла».

Далее – вводим пути: откуда взять список и куда его ввести.

 

 

 

Получаем в базе вот такую рубрику, в которой теперь и находятся наши новые доски.

 

 

Не впечатляет, верно?

Первое, что с ним надо сделать – почистить от несущестующих уже на данный момент досок.

Делается это многоэтапной их проверкой.

 

1.      Жмем кнопку «Проверить» – Со всеми адресами категории.

Проверяем – существуют ли вообще сейчас адреса.

 

 

Чтобы не просматривать вручную весь список в поисках несуществующих адресов, сортируем список по полю «Статус»     Получаем список, отсортированный по Статусу.

 

 

Выделяем и удаляем Плохие доски. – Только из этой категории и только с выделенными адресами.

 

И список наш похудел с 2301 до 2255 досок.

N.B. Знаете откуда взялись «Плохие» адреса? Вроде Вы всего полчаса назад их из Инета извлекли ведь….

            Поисковые роботы – штука быстрая и производительная. По Интернет то огромен!

И с момента последнего посещения роботом каждой доски проходит какое то время. Оно всегда разное, но оно есть!

            Вот это-то мы сейчас и выявили. Умерли уже некоторые доски. Хотя и живыми числятся.

 

2.      Следующая проверка списка. Проверяем (определяем) ТИЦ и PR.

Со всеми адресами категории.

 

 

И точно так же «плохие» удаляем.

 

     N.B. А эти «плохие» откуда взялись? Вроде бы уже проверяли только что?

Дело в том, что довольно много адресов, по которым были Доски, существуют и сейчас. Только собственно Досок там уже нет.

Вот это мы и выявили сейчас.

 

3.                   Еще проверка. И, одновременно, предварительная настройка полей в формах Досок объявлений.

Загружаем поля. Жмем кнопку  

 

И еще куча «Плохих» выявилась. И с пометкой «Форма не найдена».

 

Плохие – безусловно удаляем.

А вот с пометкой «Форма не найдена» можно двояко поступить: есть время и желание – с каждой Доской отдельно разобраться.

А нет – ну и удалите их. Новые потом добавите. Если желание будет. (Я их в данном случае удалил все).

И список наш в итоге – с 2301 до 1841 доски похудел. Почти на 500 досок уменьшился.

А значит и Вам легче жить в дальнейшем будет. Мусора меньше!

 

 

N.B. Кстати, заметили? И в поле «Название» информация появилась.

А то, в самом начале то, очень уж «голый» какой-то вид у списка был.

 

                                                   Вот, собственно, и все!

                         Предварительная проверка и настройка досок закончена.

 

            Дальше – настройка индивидуальная. Под Ваши потребности.

Заполняете поля в формах, вносите в нужные Вам рубрики и т.д.

 

Но это уже - «песня отдельная»!

Да и у самого разработчика прекрасно и описана, и видеороликами проиллюстрирована.

Поэтому углубляться в нее – не буду!

 

 

Возвращаюсь к «собиранию» досок. Еще немного добавлю…

 

                                      Как собрать базу иностранных досок

 

Вот некоторые наиболее нужные нам домены «ближнего и дальнего зарубежья»

 

BY - Беларусь

UA – Украина

 

US – США

UK – Великобритания

FR - Франция

IL – Израиль

   Да и другие домены при желании найти совсем несложно.

 

А вот примерно как может выглядеть поисковый запрос для США например.

(Поиск досок и каталогов в Google)

 

inurl:{add.html|new.html|board.html|add board.html|board add.html|add form.html|add.htm|new.htm|board.htm|add board.htm|board add.htm|add form.htm}

site:.us

intitle:{board|new board|add board|site|new site|add site}

 

N.B. Запрос конечно ОЧЕНЬ примерный. (У меня нужды в поиске иностранных сайтов никогда не возникало).

   Однако он дает возможность создать и гораздо более толковые запросы. Реальные.

Я просто сам принцип составления таких запросов проиллюстрировал.

 

                      Как правильно ввести текст для оператора  intitle: (Текст в заголовке)

 

1.      Запускаете в Google запрос inurl:new.html site:.us. Прямо в Вашем браузере.

2.      Просматриваете реальные тексты заголовков, находите нужные именно Вам.   Вводите найденные нужные Вам реальные поисковые фразы в оператор intitle:

 

Например: Поисковые фразы для Украины, найденные таким способом, выглядят так:

 

дошка,

оголошення,

новина,

додати оголошення,

дошка оголошень,

додати новину,

дошка безкоштовних оголошень

 

А для США, к примеру, может выглядеть так.

board

new board

add board

site

new link

add site

 

Далее – смело добавляете эти фразы в оператор intitle:

 

И двигаетесь дальше… Создаете список запросов (Множественный запрос), Загружаете его в специализированную программу для Парсинга. Или прямо в Smartposter…. И далее, по всем этапам работ…

  

                         И последний нюанс. Для полного счастья  :)

 

Вот, к примеру, запрос (для Яндекса).

 

inurl:board domain:.ru title:объявления

 

т.е. в адресе должно содержаться «board», домен ru, а в заголовке – слово «объявление» (в любом числе и падеже).

   Ценный запрос, верно?

 

Запускаем… И получаем ровно 1000 досок.

Не выдает он больше! Ограничитель стоит! А ведь Яндекс нам говорит, что нашел 34 тыс. ответов!!!

Ну и как нам  их из него «выцарапать»?

 

 

Вот тут то и выручит Вас хорошее знание поисковых операторов и их творческое применение.

           Не ленитесь! Загляните сюда                                                               Для Яндекс => http://help.yandex.ru/search/?id=481920

                                                                             Для Google => http://www.google.ru/support/websearch/bin/answer.py?answer=35890

 

Посмотрите, что там за «Язык запросов» такой! Поэкспериментируйте!

 

         Вот в данном случае один из выходов – совсем простой! Примените Ваше знание русского алфавита, к примеру. (а, в, в, г, д…)

 

                        Создайте Множественный запрос:

inurl:board domain:.ru title:объявления а

inurl:board domain:.ru title:объявления б

inurl:board domain:.ru title:объявления в

inurl:board domain:.ru title:объявления г

inurl:board domain:.ru title:объявления д

…………………………………………...

inurl:board domain:.ru title:объявления я

 

        Вот и всё! Это же разные запросы?

   Вот и выдаст Вам Яндекс, нет, не в 33 раза больше, конечно. Но уж в 5 – 6 раз - гарантированно!

 

       Просто все, правда?

   Для этого только немножко с Языком запросов надо разобраться. И творчески это дело применить.

 

                            Но Вы же и есть - творцы! Со 100%  гарантией!

                        Творите! Дерзайте! И результат превзойдет все Ваши ожидания!

 

                              УСПЕХОВ ВАМ!!!

            

 

 

ОБЩИЕ БАЗЫ ДОСОК

140 рубрик / подрубрик

СВОДНАЯ БАЗА

Доски Vendedoronline

 и другие доски

214 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество рубрик  - 140

ПОЛНАЯ БАЗА Vend

Доски Vendedoronline

53 Mb

Всего досок              - 1280

Разнесено по рубр.  - 1280

Количество рубрик  - 140

ПОЛНАЯ БАЗА

Кроме досок Vendedoronline

91 Mb

Всего досок              - 3700

Разнесено по рубр.    - 320

Количество рубрик  - 140

 

ТЕМАТИЧЕСКИЕ

БАЗЫ ДОСОК

Доски Vendedoronline

 и другие доски

Internet

24 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик - 8

Авто / Мото

30 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик-11

Бытовая техника

17 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик- 9

Животные и растения

22 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик- 8

Здоровье и красота

25 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик-10

Компьютеры

30 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик-12

Недвижимость

30 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик-11

Отдых и развлечения

29Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик-11

Строительство

23 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик- 8

Телекоммуникации

22 Mb

Всего досок              - 5000

Разнесено по рубр.  - 1600

Количество подрубрик- 8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Новости

30.10.2010 г.

Выложены  5 ТЕМАТИЧЕСКИХ БД: Компьютеры, Недвижимость, Отдых и развлечения, Строи-тельство, Телекоммуникации

29.10.2010 г.

Выложены 5 ТЕМАТИЧЕСКИХ БД: Internet, Авто/Мото, Бытовая техника, Животные и растения, Здоровье и красота

28.10.2010 г.

Выложены на сайт полностью переработанные  и   обновленные   три ОБЩИЕ базы досок

27.10.2010 г.

    Полностью обновлен дизайн сайта "Базы досок для Smartposter"

Подробнее >>>

 

 


                                                                                                                          ©  2007 - 2011 All rights reserved