Не знаю как назвать задачу

Тема в разделе "Решения по парсингу популярных сайтов", создана пользователем nikoshot, 16 фев 2021.

  1. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Есть сайт и в частности вот такие страницы
    Пример Ссылки недоступны для гостей
    Страница категории а "типо товары "на ней идут просто как html информация без перехода по структуре глужбе...
    И мне нужно спарсить это и как то разбить на отделльные строки что бы потом из этого можно создать отдельный товар...
    Пример на скрине.. как нужно Ссылки недоступны для гостей
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Используйте повторяющиеся границы, каждый цвет как отдельная строка.
     
  3. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Скажите а вы сможете это сделать платно?
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Проблема в том, что верстка на этом сайте разная на разных страницах (где-то цены под каждым фото, где-то цены перед всеми фото).

    2021-02-16_22-46-29.png

    Я не знаю, как вам в этом случае помочь.
     
  5. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Да так и есть.. Если цены нет под каждым фото то она одна для всех... Пу сути как понимаю снчала можно настроить парсинг на один вид, а потом подправить и спарсить те товары где цекна одна для всех..
    По сути это все равно будет автоматизировано за два захода...
    Подскажите тогда как построить структуру чот бы разбить по строкам
    я что то не до конца понял...
    Или можете мне создать проект что бы например брал данные и разбивал на строки Ссылки недоступны для гостей я вам оплачу..
    А остальное я уже сам попробую разобраться...
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Я не знаю, как парсить товары с этого сайта.
     
  7. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Ок, подскажите тогда где прочитать про это?
     
  8. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Ссылки недоступны для гостей - Основы парсинга контента
    Ссылки недоступны для гостей - Повторяющиеся границы
    Ссылки недоступны для гостей - Как вывести информацию от повт. границы.
     
  9. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Спасибо.. То что нужно..
    Уже получилось то что и хотел но осталась одна деталь и не знаю как или с помощью какого макроса это можно соединить Ссылки недоступны для гостей
    Может я не верно выбрал повторяющуюся границу?
    Я взял <td></td> сделал ее основной повторяющей
    Но на сайте это сделано в таблице и фото находится в одном <td></td> а назание в другом <td></td>
    Вот скрин Ссылки недоступны для гостей
    Как это можно объединить?
    Проект прилагаю если сможете помочь..
     

    Вложения:

    • il-d_ru.cdp
      Размер файла:
      246,3 КБ
      Просмотров:
      1
  10. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Ребята помогите.. осталось совсем чуток...
     
  11. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Ребята нужна помощь... Я создал тему в латном разделе.. но там за одну правку загинают цены 5000-6000.. как по мне это сверх наглость.. + начинают оскорблять( Это вообще не допустимо..
    Этот форму и создан что бы помогать друг другу... Это же не биржа фриланса...
    Я же не прошу все сделать за меня.. почему такое отношение?
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Оскорблять никого не допустимо.

    Отношение такое тоже не хорошо (и у меня часто такое отношение). Это потому, что люди уже устали помогать и хотят за помощь оплаты, к чему рано или поздно многие приходят.

    Предложенная цена человека не устроила. Ему лучше было бы вежливо предложить свою или просто промолчать.

    Если бы мне было не сложно, я бы вам помог. Но я не знаю, как сходу решить вашу задачу.
     
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Я пробовал настроить вам проект. Изучил сайт и структуру. Там помимо разного формата данных еще есть проблемы (которые вы и увидели), которые я не знаю, как решить. Придумывать для этого сайта индивидуальное решение (так как на моей практике это единичный случай) очень дорого и навряд ли кто-то будет тратить свое время и силы на это.
     
  14. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Предложенная цена в 5000 руб человека не устроила, я предлагал. Обьяснил почему такая цена, после ознакомления с кодом сайта.
    Уважаемый nikoshot это сам видел наверняка когда сам пробовал настроить.
    Цены не с потолка берем, но оценивая подобную работу в 100-500руб звучит как оскорбление.

    На форуме никто никому не ОБЯЗАН. Мы помогаем по возможности.

    п.с. вам подобную работу даже на кворке не выполнят за 500руб. - такие расценки были актуальны лет 7 назад.
     
  15. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Ребята, прошу внимательно прочитать о том что я не просил за 500-600 руб настроить мне весь парсинг... Я просил помочь или подсказать как соединить две границы рядом... сделать одну правку...
    Кто то 15000 заряжает кто то 5000... Спасибо я уже сам решил.. все что нужно было это посмотреть это видео
    Парсинг характеристик товаров в случае, когда их имена и значения расположены в разных частях кода
    Можно было просто скинуть ссылку на это видео или сделать это, тут работы для меня было на 10 минут... Только я потратил два дня что бы найти это видео...
    А вы же знаете как это делать.. И скажите разве эта работа стоит 5000 или 15000...
    Вот результат... Ссылки недоступны для гостей
     
  16. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    только я еще предлагал оплатить это...
     
  17. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Я прекрасно понимаю.. По этому и предложил 500-600 за правку.. а не за весь проект...
    Вот у меня возник еще вопрос... Сможете помочь?
    Попадается один пустой цикл повторяющейся границы Ссылки недоступны для гостей и из за этого строки съезжают на одну строку...
    Можно как то этого избежать? Где то есть такой макрос или настройка?
     
  18. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Попробуйте.

    2021-02-19_20-46-50.png
     
  19. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Спасибо то что нужно!
    От себя хочу сказать что в справке и на форуме (в совокупности ) есть ответы на 99% вопросов...
    Но вот найти нужный ответ это бывает сложно, основной поиск на форуме который в вернем правом углу не очень удобный... Я больше пользуюсь следующим способом..
    Начинаю создавать новую тему пишу примерно то что мне нужно Ссылки недоступны для гостей и подтягиваются различные подсказки по похожим вопросам...
    Я большую часть вопрос нашел именно так... А иногда просто не знаешь как задать вопрос что бы найти на него ответ...(
    Если будет желание и время то можете улучшить чуть систему поиска на самом форуме, сделать что бы при поиске всплывали подсказки на похожие темы..
    Потому что например если искать по этому запросу через саодание темы то ответа все равно нет... Ссылки недоступны для гостей
    А вот если вбить этот вопрос именно в поиск то тема находится Ссылки недоступны для гостей
    Еще раз спасибо за помощь.. задонатил 300 р)
     
    Root нравится это.
  20. nikoshot

    nikoshot Member Пользователи

    Регистрация:
    14 янв 2017
    Сообщения:
    115
    Вопрос по скачиванию картинок... Вроде все верно настроил...(
    1) Почему при предпросмотре картинки загружаются по фтп если я это отключил...
    2) Почему вырезана часть пути к картинке
    У меня есть картинка она просто в html коде
    HTML:
    <div class='model_info'><tbody> <tr> <td> <b>Полуобхват</b><br /><table><tr><th> </th><th>S</th><th>M</th><th>L</th><th>XL</th></tr><tr><th>Грудь</th><td>48</td><td>50</td><td>52</td><td>54</td></tr><tr><th>Талия</th><td>50</td><td>52</td><td>54</td><td>56</td></tr><tr><th>Бедра</th><td>52</td><td>54</td><td>56</td><td>58</td></tr></table>Длина изделия: 110</br>Рукав: 61</br>Ткань: низкой эластичности</br> </td> </tr> </tbody> </table> <div> <p>Как сделать замеры</p> <img src=""img/Dress.jpg""></div>
    Я включил настройку Ссылки недоступны для гостей и картинка имеет путь с папкой вида /img/measurements-modal/Dress.jpg
    Но на фтп загружается без папки /measurements-modal/ Ссылки недоступны для гостей
    Еще в настройках выставлено вот так
     

Поделиться этой страницей