Парсинг по ключевикам

Тема в разделе "Решение различных задач по парсингу", создана пользователем Upi, 9 май 2014.

  1. Upi

    Upi Member Пользователи

    Регистрация:
    8 май 2014
    Сообщения:
    31
    Доброго времени суток, парсить буду по ключевикам ({key}). Генерирую ссылки для парса используя макрос ({key1}).
    Надо чтобы в CSV выводил: 1 столбец ключевик ({key1}), 2 столбец граница1, 3 столбец граница2 и тд.
    Если по ключевику ничего не нашел, то границы парса пустые. Эдак если перефразировать то соответствие ключевых слов с найденной информацией?

    Заранее благодарю.
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    добавляйте к ссылке вконце текст
    Код:
    [PARAM]:<keys>{key}<->
    получится
    Код:
    site.ru\{key}[PARAM]:<keys>{key}<->
    В шаблоне вывода, в 1-я столбце пишете
    Код:
    [REPLACE(<keys>{get}<|{get})][PARAM][/REPLACE]
    Успехов
     
  3. Upi

    Upi Member Пользователи

    Регистрация:
    8 май 2014
    Сообщения:
    31
    Есть одно но. Если вводить этот макрос в поиск гугла то, гугл ищет всю строку вместе с макросом "ПАРАМ". Как это обойти?
    HTML:
    https://www.google.com/search?client=opera&q=site:http://www.sayt.ru[/url] {KEY}[PARAM]:{KEY}
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    А вы случайно не в wbapp выводите эту строку? для wbapp используется
    Код:
    ##[P]:
    PARAM не может участвовать в ссылке, он служит для передачи дополнительного "текста" к ссылке. Как например в вашем случае.
     
    Последнее редактирование: 10 май 2014
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Это не надо обходить) просто используйте правильно.
    Если требуется передать к ссылке {key} в [PARAM] то в самом шаблоне ссылки должно быть примерно так:
    Парам создается в конце ссылки если отметить пункт "добавлять пункт [PARAM]"
    Ссылки недоступны для гостей
     

    Вложения:

  6. Upi

    Upi Member Пользователи

    Регистрация:
    8 май 2014
    Сообщения:
    31
    Вроде бы все так и делаю. Тут такая штука. Я генерирую ссылки с ключивеками в гугл. С этих ссылок надо перейти в выдаче по первой ссылке в гугле, и спарсить на сайте на который настроены границы парса.
    А теперь в картинках:
    [​IMG]
    [​IMG]
    [​IMG]
     
    Последнее редактирование: 12 май 2014
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    1. Собирать ссылки сайта из выдачи поиска во вкладке "ссылки"
    2. А потом парсить от страницы сайта во вкладке "контент"
     
  8. Upi

    Upi Member Пользователи

    Регистрация:
    8 май 2014
    Сообщения:
    31
    Огромнейшее спасибо, просто не думал что при парсинге ссылок дописывается имя ключа, которое потом можно использовать в CSV в качестве колонки "соответствия". С каждым днем для себя открываю программу, и просто фантастически благодарен автору софта. Не зря купил максимальную версию.
     
  9. matei

    matei New Member Пользователи

    Регистрация:
    14 апр 2013
    Сообщения:
    2
    В помощь трудящимся!! ссылка вывода 100 позиций на одну страницу в гугле)

    Ссылки недоступны для гостей
     
  10. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Критерии поиска google наглядно показаны и описаны в "настройки поиска"
    _https://www.google.ru/preferences?hl=ru
     

Поделиться этой страницей