помощь в парсинге определенного сайта

Тема в разделе "Решение различных задач по парсингу", создана пользователем Root, 10 мар 2010.

  1. alarm

    alarm New Member Пользователи

    Регистрация:
    5 окт 2012
    Сообщения:
    3
    Ошибка моя была в том, что во-первых я пытался получить урл картинки, а не саму картинку - т.е. не вставив в шаблон вывода тег <img>, а во-вторых в том, что я пытался вытащить этот урл из подгружаемой аяксом крупной картинки, а не из ссылки с маленькой картинки, само собой программа этот кусок кода найти не могла, потому что на загружаемой странице по-умолчанию его нет. Вот рабочий пример
    Upd.: в результирующем файле imagesnames не сохраняется, проблема только на предпросмотре. Так что все вопросы сняты)
     
    Последнее редактирование: 5 окт 2012
  2. SpiriT

    SpiriT New Member Пользователи

    Регистрация:
    6 окт 2012
    Сообщения:
    2
    Всем добрый день. Помогите пожалуйста новичку. При пасинге в базу MYSQL Joomla у меня в все ссылки имеют такой вот вид
    HTML:
    <img src="\&quot;images/i/12/09/17/hr6dbody3qcl.jpg\&quot;" border="0" width="\&quot;500\&quot;" height="\&quot;391\&quot;" />
    <a href="\&quot;http://www.canon.com/\&quot;" target="\&quot;blank\&quot;" title="\&quot;Новости" rel="\&quot;nofollow\&quot;"><span>canon.com</span></a>
    Как избавиться от этого \&quot;, поиск и замену делал не помогло.
     
  3. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    то, что вы написали - невозможно. очевидно, плохо делали замену. либо ошиблись в самой формуле, либо заменяли не на том этапе (опорных точек, в которых можно заменять, в процессе парсинга присутствует наверно, с десяток). приложите проект, на практике посмотрим.
     
  4. SpiriT

    SpiriT New Member Пользователи

    Регистрация:
    6 окт 2012
    Сообщения:
    2
    вот мой проект и шаблон вывода
     

    Вложения:

    • proj.rar
      Размер файла:
      7,1 КБ
      Просмотров:
      4
  5. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    к сожалению, я пас. это первый раз когда я вообще ничего в проекте не понял. :) не понял смысла скрипта (он у меня не работает), смысла нескольких границ (№15, повторяющихся) и т.д. и т.п.
    в общем, подождем, что скажут доки.
     
  6. Andrik

    Andrik New Member Пользователи

    Регистрация:
    16 окт 2012
    Сообщения:
    2
    Ребята помогите как полностью спарсить сайт Ссылки недоступны для гостей раздел ОПТ !!!! Нужны цены по всем продавцам.
     
  7. zilon

    zilon New Member Пользователи

    Регистрация:
    24 дек 2011
    Сообщения:
    80
    там чтобы увидеть цены нужно зарегестрироваться и в Content Downloader в окне авторизация/cookis указать данные для доступа
     
  8. olivergreen

    olivergreen New Member Пользователи

    Регистрация:
    28 янв 2013
    Сообщения:
    31
    Здравствуйте!
    Я не могу справится с парсингом порносайта _pussy-king.com_
    Нужные мне данные содержатся в двух частях: описание в тизере (краткое описание статьи. отображаентся при просмотре категории) и собственно сам элемент записи - УРЛ. Мне в одну запись надо спарсить две этих части. Но могу только последнюю: п полному УРЛ. Подскажите пожалуйста как сделать. Спасибо!
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Грузить данные ("и собственно сам элемент записи - УРЛ") можно таким способом Ссылки недоступны для гостей при парсинге со страниц "при просмотре категории".
     
  10. winchester7

    winchester7 New Member Пользователи

    Регистрация:
    24 дек 2012
    Сообщения:
    3
    Может ли кто-нибудь дать готовый проект парсинга закрытых групп вконтакте? Готов заплатить.
     
  11. Cirilo

    Cirilo New Member Пользователи

    Регистрация:
    23 янв 2013
    Сообщения:
    2
    Здравствуйте!
    Подскажите, пожалуйста, есть вот такой интересный сайт: dojki.com, не могу понять как брать урл картинки, а потом к ней соответствующий эмбед код с видео, прошу помощи у более опытных коллег или хотябы пните в нужную сторону, а там может и сам додумаю, заранее спасибо
     
  12. Митич

    Митич New Member Пользователи

    Регистрация:
    31 янв 2013
    Сообщения:
    1
    Доброго дня всем!
    Вчера приобрел таки лицензию. Но никак не могу спарсить товары с сайта. Сканер ссылок практически ничего не находит (находит около 30-50, в то время как товаров около 1000шт.). При попытке задать поля, отображает какой то странный код, в котором нет того что нужно. Сайт Ссылки недоступны для гостей
     
  13. Andiss

    Andiss New Member Пользователи

    Регистрация:
    6 фев 2013
    Сообщения:
    1
    А на платной основе сможете настроить парсер? Для интернет магазина.
     
  14. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Этим занимается Владимир, прошу обратиться в Skype Kagorec.
    Спасибо!
     
  15. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    В фильтре ссылок добавьте
    PHP:
    http://www.titansurgical.com/detail.php?id=*
    этого достаточно чтобы найти именно товарные ссылки.

    [​IMG]
     
  16. DGR

    DGR New Member Пользователи

    Регистрация:
    17 фев 2013
    Сообщения:
    3
    в dwnldimgs при парсинге картинок на сервер в графе $_POST['img_url'] вместо img_url' пишем просто например Ссылки недоступны для гостей?
    в img_folder просто название папки?
     
  17. redfox

    redfox New Member Пользователи

    Регистрация:
    18 фев 2013
    Сообщения:
    35
    Терзают меня смутные сомнения, что товарищу нужно сначала нагенирировать ссылок на страницы откуда потом уже ссылки на товары брать.
     
  18. efimweb

    efimweb New Member Пользователи

    Регистрация:
    8 мар 2013
    Сообщения:
    1
    Пожалуйста подскажите как спарсить все варианты(цвет, цена и т.д) Ссылки недоступны для гостей
     
  19. Akok06

    Akok06 New Member Пользователи

    Регистрация:
    7 окт 2012
    Сообщения:
    12
    Ezinearticles.com articlesbase.com

    Не получается спарсить Ezinearticles.com articlesbase.com. Пробовал 1 поток адвор задержка 15000, всё равно капчу выдаёт. Есть выход?
     
  20. dimasbarabas

    dimasbarabas New Member Пользователи

    Регистрация:
    22 май 2011
    Сообщения:
    5
    Здравствуйте!
    Скажите, а можно с помощью CD спарсить группы/паблики ВК по определенным критериям? Например, с определенным словом в названии/описании или по принадлежности к определенному городу?
     

Поделиться этой страницей