Авторизация чтоб увидеть вложения

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем ergoline, 10 июл 2013.

  1. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    Есть форум на котором рега происходит не только по логину и пасу.
    Там еще применяется 2 шагом капча.
    (Только после прохождения этих телодвижений я могу увидеть изображения в постах, да, они идут как атачи).
    мои действия
    1. сделал границы и проект для вывода текста поста и изображений в нем mimg
    <CD_GRAN_1!>;<br>
    <CD_DOCURL!>;
    <NIMG><CD_CYCLE_GRAN_1!></NIMG>; (автор поста, сам пост, ну и изображения, которые идут вложениями)

    2. захожу на сайт через авторизацию которая есть в проге.
    3. жму на куки из вебраузера (да, вложенные изображения вижу)
    4. жму на посмотреть предварительно - там только аватары, да пару ненужных изображений, но все равно жму на парсинг
    получаю
    Ссылки недоступны для гостей

    а может дело в том что не подхватывается такой код изображения(((
    взято после реги на сайте с фокса
    HTML:
    <ignore_js_op>
    
    <img initialized="true" id="aimg_973" src="forum.php?mod=attachment&amp;aid=OTczfGM0YWRkN2NjfDEzNzM0NTgxNzR8MzIwMXw1Mjk%3D&amp;noupdate=yes" zoomfile="forum.php?mod=attachment&amp;aid=OTczfGM0YWRkN2NjfDEzNzM0NTgxNzR8MzIwMXw1Mjk%3D&amp;noupdate=yes&amp;nothumb=yes" file="forum.php?mod=attachment&amp;aid=OTczfGM0YWRkN2NjfDEzNzM0NTgxNzR8MzIwMXw1Mjk%3D&amp;noupdate=yes" class="zoom" onclick="zoom(this, this.src)" inpost="1" alt="0.jpg" title="0.jpg" onmouseover="showMenu({'ctrlid':this.id,'pos':'12'})" width="600">
    
    </ignore_js_op></p><div initialized="true" class="tip tip_4 aimg_tip" id="aimg_973_menu" style="position: absolute; z-index: 301; left: 452px; top: 626.5px; display: none;">
    <div class="tip_c xs0">
    <div class="y">Загружен: 20-02-2011 10:24:16</div>
    <a href="http://chinascript.ru/forum.php?mod=attachment&amp;aid=OTczfGM0YWRkN2NjfDEzNzM0NTgxNzR8MzIwMXw1Mjk%3D&amp;nothumb=yes" title="0.jpg Скачиваний:0" target="_blank"><strong>Скачать файл</strong> <span class="xs0">(67.2 KB)</span></a>
    
    </div>
    <div class="tip_horn"></div>
    </div>
    
    в общем где то косячу, на какой то мелочи...
    или нескольких мелочах.
    с 1 стороны авторизацию прохожу, с другой, по результату - нет
    пример рассматривался на этой Ссылки недоступны для гостей
     
    Последнее редактирование: 10 июл 2013
  2. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    Апнусь.
    хоть обновление и прошло ( кажись связанное с моим вопросом).
    Но все равно.
    Регюсь через браузер cd в браузере все зашибись, передаю куки,
    а перехожу в просмотр парсинга - в выдаче картинок нету.
    Хотя... появились промежутки, где должны были быть изображения.

    но в выдаче все равно написано что я не авторизован(((, а в встроенном браузере я залогиненый.

    те пните меня плиз в чем дело - как то куки не так передаются? ( через плаг к фоксу тоже пробовал), или вывод изображений не настроен? (но они вмдны только для залогиненных)

    То как? плюнуть и не париться или шанс есть?
    Если у администрации будет желание, то смогу отправаить им свои данные реги на сайте - для упрощения, или проект с куками
     
    Последнее редактирование: 12 июл 2013
  3. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    проект улучшил.
    с авторизацией как то можно сказать тоже почти подружились.
    теперь все таки вопрос на счет картинок в посту.
    они идут как атачи к посту и выводятся скриптом.
    пробовал сделать как на видео где парсят картинки которые выводятся скриптом, но такой лафы у себя не пронаблюдал.
    В лучшем случае появился образ незагруженного рисунка в посту ну и место под него( при <NIMG>[GRAN2]</NIMG>

    если же в шабе вывода <DOWNLOADFILE>[GRAN2]</DOWNLOADFILE> то ничего интересного не происходит ( то есть ж.

    ссылка на изображение в доноре имеет вид
    HTML:
    http://ххххххххххххх.ru/forum.php?mod=attachment&aid=OTczfDEwYmI3NGU1fDEzNzQ2NzIxODN8MzIwMXw1Mjk%3D&noupdate=yes
    а это полный кусок вывода изображения в посте
    HTML:
     <img initialized="true" id="aimg_973" src="forum.php?mod=attachment&amp;aid=OTczfDEwYmI3NGU1fDEzNzQ2NzIxODN8MzIwMXw1Mjk%3D&amp;noupdate=yes" zoomfile="forum.php?mod=attachment&amp;aid=OTczfDEwYmI3NGU1fDEzNzQ2NzIxODN8MzIwMXw1Mjk%3D&amp;noupdate=yes&amp;nothumb=yes" file="forum.php?mod=attachment&amp;aid=OTczfDEwYmI3NGU1fDEzNzQ2NzIxODN8MzIwMXw1Mjk%3D&amp;noupdate=yes" class="zoom" onclick="zoom(this, this.src)" inpost="1" alt="0.jpg" title="0.jpg" onmouseover="showMenu({'ctrlid':this.id,'pos':'12'})" width="600">
    
    </ignore_js_op></p><div initialized="true" class="tip tip_4 aimg_tip" id="aimg_973_menu" style="position: absolute; z-index: 301; left: 452px; top: 626.5px; display: none;">
    <div class="tip_c xs0">
    <div class="y">Загружен: 20-02-2011 10:24:16</div>
    <a href="http://ххххххххххххх.ru/forum.php?mod=attachment&amp;aid=OTczfDEwYmI3NGU1fDEzNzQ2NzIxODN8MzIwMXw1Mjk%3D&amp;nothumb=yes" title="0.jpg Скачиваний:0" target="_blank"><strong>Скачать файл</strong> <span class="xs0">(67.2 KB)</span></a>
     
    догадываюсь что осталась мелочь. но пока у меня не хватает идей
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Решено было с помощью "поиск-замена для загружаемого кода"
    Первая строка замены к атачам добавляем метку, решил применить сразу NIMG, поскольку в атачах в основном картинки генерируемые пхп скриптом.
    вторая и третья строка замены приводят в правильный вид адрес аттача (в броузере проверялось)
    Остальное уже пустяковое дело, текст, название темы и т.д.))
     
  5. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    Большое спасибо.
    Уже не знал в какую сторону дергаться.
    по урокам не выходило.
    Буду заниматься пустяковым делом ( в смысле подружить оба проекта)) там где текст и там где рисунки)
    те чтоб рисунки оставались в тексте, а не отдельно
     
    Последнее редактирование: 1 авг 2013
  6. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    Что бы появились картинки в сохраняемом хтмл файл перенес <NIMG> из повторяющихся границ в простые.
    результат - текст сохраняет его видно.
    рисунки то что в теле поста сохраняет на винт, но в хтмл файле их не видать.
    (хотя в csv да - путь указан).
    буду продолжать поиски
     
  7. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    пока что максимум чего я добился это то,
    что парсится текст, загружаются файлы нужных рисунков ( на винт, те, которые в постах, хотя они атачами сделаны - спасибо Кагорцу),
    но...
    хоть я и получаю вроде правильный адрес рисунка для проекта
    file:///d://content/chinascript/123/images/a_hrefhttpchinascriptruspace-uid-205html_target_blank_classxw1elenanova-24.gif
    это наверно регулярка слегка переименовывает назв файла.,
    но не важно.
    важно, что в спарсенном файле,
    выведенном в хтмле этих
    картинок не видно(
    как их вывести чтоб они были видны в спасенном хтмл файле?
    Ссылки недоступны для гостей


    да в доп параметрах загр изобр джпг менял на гиф - одноваленнтно
     
    Последнее редактирование: 14 авг 2013
  8. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    попробуйте так
     
  9. ergoline

    ergoline New Member Пользователи

    Регистрация:
    15 сен 2011
    Сообщения:
    49
    Адрес:
    UA
    Город:
    Kiev
    нет. пока что это не спасло отца русской демократии...
    Ссылки недоступны для гостей
    но вот только что заметил странную вещь
    Ссылки недоступны для гостей
    названия одинаковые хотя рисунки это разные.
    и видимо "другие" занимают чужое место

    так те которые на винте спрасенные не джпг - с ними все в порядке.
    а вот с jpg траблы какие то

    а это просто дополнительное изобр с донора
    Ссылки недоступны для гостей
    ох уж эти китайцы (ну или я (((

    да. в вложении один из файлов, которые получаются.

    меня смущает очень повторение a_hrefhttpchinascriptruspace-uid-205html_target_blank_classxw1elenanova-8.gif на тех местах, где должны быть рисунки из поста донора такого типа
    a_hrefhttpchinascriptruspace-uid-205html_target_blank_classxw1elenanova-{n}.jpg

    правильная ссылка на нужные рисунки есть. только внизу файла, когда описываются атачи. Вместо того, чтоб быть внутри постов(
     

    Вложения:

    • article_1.zip
      Размер файла:
      7,6 КБ
      Просмотров:
      0
    Последнее редактирование: 15 авг 2013

Поделиться этой страницей