Как задать границы парсинга в подгружаемом контенте

Тема в разделе "Разное", создана пользователем vizards, 24 мар 2020.

  1. vizards

    vizards New Member Пользователи

    Регистрация:
    8 апр 2012
    Сообщения:
    8
    Здравствуйте, подскажите по парсингу с помощью GETMORECONTENT
    Ссылка на страницу Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Шаблон вывода
    Код:
    <GETMORECONTENT><URL="[SELF]&page=[LOOP]"><GMC_CYCLE>{TOSTART}{/TOSTART}{TOEND}{/TOEND}{CSEP}{br2}{/CSEP}</GMC_CYCLE><START="<div align={"}center{"}>"><STARTCOUNT="1"><END="[AUTO]div"><ENDCOUNT="0"><PARAMS="usecyclegrans"></GETMORECONTENT>
    Получаю такой код с повторяющимеся границами
    Код:
        <div class="page" style="width:100%; text-align:left">
            <div style="padding:0px 25px 0px 25px" align="left">
    
        <div id="edit6765070" style="padding:0px 0px 6px 0px">
        <!-- this is not the last post shown on the page -->
    
    
    
    <table id="post6765070" class="tborder" cellpadding="6" cellspacing="0" border="0" width="100%" align="center">
    <tr>
        
            <td class="thead" style="font-weight:normal; border: 1px solid #D1D1E1; border-right: 0px" >
                <!-- status icon and date -->
                <a name="post6765070"><img class="inlineimg" src="images/statusicon/post_old.gif" alt="Старый" border="0" /></a>
                01.06.2019, 00:47
                
                <!-- / status icon and date -->
            </td>
            <td class="thead" style="font-weight:normal; border: 1px solid #D1D1E1; border-left: 0px" align="right">
                &nbsp;
                #<a href="showpost.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;p=6765070&amp;postcount=1" target="new" rel="nofollow" id="postcount6765070" name="1"><strong>1</strong></a>
                
            </td>
        
    </tr>
    <tr valign="top">
        <td class="alt2" width="175" style="border: 1px solid #D1D1E1; border-top: 0px; border-bottom: 0px">
    
                <div id="postmenu_6765070">
                    
                    <a class="bigusername" href="member.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;u=414238">F17T</a>
                    <script type="text/javascript"> vbmenu_register("postmenu_6765070", true); </script>
                    
                </div>
    
                <div class="smallfont">Дружище КиноПоиска</div>
                
                
    
                
                    <div class="smallfont">
                        &nbsp;<br /><a href="member.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;u=414238"><img src="image.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;u=414238&amp;dateline=1494440331" width="120" height="150" alt="Аватар для F17T" border="0" /></a>
                    </div>
                
    
                <div class="smallfont">
                    &nbsp;<br />
                    <div>Регистрация: 06.05.2011</div>
                    <div>Адрес: Бор52</div>
                    
                    <div>
                        Сообщений: 930
                    </div>
                    
                    
                    
                    
                    <div>    </div>
                </div>
    
        </td>
        
        <td class="alt1" id="td_post_6765070" style="border-right: 1px solid #D1D1E1">
        
            
            
                <!-- icon and title -->
                <div class="smallfont">
                    <img class="inlineimg" src="images/icons/icon1.gif" alt="По умолчанию" border="0" />
                    <strong>Эмма. (Emma.)</strong>
                </div>
                <hr size="1" style="color:#D1D1E1; background-color:#D1D1E1" />
                <!-- / icon and title -->
            
    
            <!-- message -->
            <div id="post_message_6765070">
                
                <div align="center"><b>Handsome, clever, and rich</b><a href="https://ru.kinorium.com/2031922/" target="_blank"><br />
    <img src="https://b.radikal.ru/b21/1909/cb/88124ca04ac4.jpg" border="0" alt="" /></a><a href="https://www.kinopoisk.ru/film/1244402/" target="_blank"><img src="http://s003.radikal.ru/i202/1312/c5/f52380f77f32.png" border="0" alt="" /></a><a href="https://www.imdb.com/title/tt9214832/?ref_=nm_flmg_act_5" target="_blank"><img src="http://s019.radikal.ru/i607/1312/05/86b73d7c9ae1.png" border="0" alt="" /></a><br />
    <img src="https://b.radikal.ru/b37/1911/d8/d76a74f70ab4.jpg" border="0" alt="" /><br />
    <b><u>Новая экранизация романа Джейн Остин от режиссера-дебютанта Отем ДеУайлд</u></b><br />
    <br />
    <br />
    <b>год: </b> 2020<br />
    <br />
    <b>страна:</b> Великобритания<br />
    <br />
    <b>производство:</b> <a href="https://www.kinopoisk.ru/film/1244402/studio/" target="_blank">Blueprint Pictures, Perfect World Pictures, Working Title Films</a><br />
    <br />
    <b>режиссер:</b> <a href="https://www.kinopoisk.ru/name/1301950/" target="_blank">Отем ДеУайлд</a><br />
    <br />
    <b>автор первоисточника:</b> Джейн Остин<br />
    <br />
    <b>адаптированный сценарий:</b> Элинор Каттон<br />
    <br />
    <b>продюсер:</b> <a href="https://www.kinopoisk.ru/name/22409/" target="_blank">Тим Беван</a>, <a href="https://www.kinopoisk.ru/name/15754/" target="_blank">Грэм Бродбент</a>, <a href="https://www.kinopoisk.ru/name/47917/" target="_blank">Питер Чернин</a><br />
    <br />
    <b>оператор:</b> <a href="https://www.kinopoisk.ru/name/1298944/" target="_blank">Крис Бловелт</a><br />
    <br />
    <b>композитор:</b> <a href="https://www.kinopoisk.ru/name/558266/" target="_blank">Дэвид Швайтцер</a>, <a href="https://www.kinopoisk.ru/name/2256699/" target="_blank">Изобель Уоллер-Бридж</a><br />
    <br />
    <b>художник:</b> Кейв Куинн, Элис Саттон, <a href="https://www.kinopoisk.ru/name/1752899/" target="_blank">Александра Бирн</a>, Стелла Фокс<br />
    <br />
    <b>монтаж:</b> Ник Эмерсон<br />
    <br />
    <b>жанр:</b> драма, комедия<br />
    <br />
    <b>хронометраж:</b> 124 мин. / 02:04<br />
    <br />
    <b>премьера:</b> 14 февраля 2020<br />
    <br />
    <b>премьера (РФ):</b> 9 апреля 2020<br />
    <br />
    <br />
    <b><u>в главных ролях:</u></b><br />
    <br />
    <a href="https://www.kinopoisk.ru/name/4402558/" target="_blank"><b>Таня Рейнольдс/</b></a><a href="https://www.kinopoisk.ru/name/739199/" target="_blank"><b>Джонни Флинн/</b></a><a href="https://www.kinopoisk.ru/name/3360189/" target="_blank"><b>Аня Тейлор-Джой/</b></a><a href="https://www.kinopoisk.ru/name/2400601/" target="_blank"><b>Каллум Тернер/</b></a><a href="https://www.kinopoisk.ru/name/3019941/" target="_blank"><b> Миа Гот</b></a><br />
    <img src="https://a.radikal.ru/a05/2002/80/5ca27c8425f3.jpg" border="0" alt="" /><br />
    <b>Августа Элтон/Джордж Найтли/Эмма Вудхаус/Фрэнк Черчилл/Гарриет Смит</b><br />
    <br />
    а также <a href="https://www.kinopoisk.ru/name/44208/" target="_blank"><b>Руперт Грейвз</b></a> в роли мистера Уэстона<br />
    и <a href="https://www.kinopoisk.ru/name/207/" target="_blank"><b>Билл Найи</b></a> в роли мистера Генри Вудхауса<br />
    <br />
    <a href="https://ru.wikipedia.org/wiki/%D0%AD%D0%BC%D0%BC%D0%B0_(%D1%80%D0%BE%D0%BC%D0%B0%D0%BD)#%D0%9E%D1%81%D0%BD%D0%BE%D0%B2%D0%BD%D1%8B%D0%B5_%D0%BF%D0%B5%D1%80%D1%81%D0%BE%D0%BD%D0%B0%D0%B6%D0%B8" target="_blank">Подробнее о персонажах (<b>спойлеры</b>!)</a><br />
    <br />
    <a href="https://www.kinopoisk.ru/film/1244402/cast/&quot;" target="_blank">и другие</a><br />
    <br />
    <a href="https://www.kinopoisk.ru/film/1244402/video/" target="_blank"><b>трейлеры</b></a><br />
    <br />
    <b><u>съемки:</u></b><br />
    <img src="https://b.radikal.ru/b00/1905/da/04bc1ade5b96.jpg" border="0" alt="" /><br />
    <br />
    <b><u>синопсис:</u></b><br />
    <i>Красивая, молодая и богатая Эмма Вудхаус, будучи уверенной, что никогда не выйдет замуж, выступает в роли свахи для своих подруг и знакомых. Но жизнь преподносит ей сюрприз за сюрпризом. Однажды она отговаривает свою подругу Гарриет выходить замуж за фермера и сватает её с викарием Элтоном. Но тот влюбляется в саму Эмму…</i></div>
            </div>
            <!-- / message -->
    
            
    
            
            
    
            
    
            
    
            
            <!-- edit note -->
                <div class="smallfont">
                    <hr size="1" style="color:#D1D1E1; background-color:#D1D1E1" />
                    <em>
                        
                            Последний раз редактировалось F17T; 22.03.2020 в <span class="time">08:54</span>.
                        
                        
                            Причина: информация
                        
                    </em>
                </div>
            <!-- / edit note -->
            
    
        </td>
    </tr>
    <tr>
        <td class="alt2" style="border: 1px solid #D1D1E1; border-top: 0px">
            <img class="inlineimg" src="images/statusicon/user_offline.gif" alt="F17T вне форума" border="0" />
    
    
            
            
            
            
            &nbsp;
        </td>
        
        <td class="alt1" align="right" style="border: 1px solid #D1D1E1; border-left: 0px; border-top: 0px">
        
            <!-- controls -->
            
            
            
                <a href="newreply.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;do=newreply&amp;p=6765070" rel="nofollow"><img src="images/buttons/quote.gif" alt="Ответить с цитированием" border="0" /></a>
            
            
            
            
            
            
            
                
            
            
            <!-- / controls -->
        </td>
    </tr>
    </table>
    
    
     
    <!-- post 6765070 popup menu -->
    <div class="vbmenu_popup" id="postmenu_6765070_menu" style="display:none">
        <table cellpadding="4" cellspacing="1" border="0">
        <tr>
            <td class="thead">F17T</td>
        </tr>
        
            <tr><td class="vbmenu_option"><a href="member.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;u=414238">Посмотреть профиль</a></td></tr>
        
        
            <tr><td class="vbmenu_option"><a href="private.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;do=newpm&amp;u=414238" rel="nofollow">Отправить личное сообщение для F17T</a></td></tr>
        
        
        
        
            <tr><td class="vbmenu_option"><a href="search.php?s=33e19f9d63957a2482bcb3fe41d1f714&amp;do=finduser&amp;u=414238" rel="nofollow">Найти ещё сообщения от F17T</a></td></tr>
        
        
        
        </table>
    </div>
    <!-- / post 6765070 popup menu -->
    
    
    
        </div>
        
            </div>
        </div>
    
    Как теперь из зтого кода взять логин кто написал пост, текст самого поста и записать в CSV файл?
    Заранее спасибо!
     
  2. vizards

    vizards New Member Пользователи

    Регистрация:
    8 апр 2012
    Сообщения:
    8
    Получаю такой код с повторяющимеся границами
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    12.478

Поделиться этой страницей