в коде появляются лишние кавычки

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем rhjirftyjn, 21 сен 2014.

  1. rhjirftyjn

    rhjirftyjn New Member Пользователи

    Регистрация:
    18 сен 2014
    Сообщения:
    20
    Здравствуйте.
    Подскажите, пожалуйста, как избавиться от лишних кавычек.

    в открытом csv файле спарсенный код выглядит так:

    <h2>Технические характеристики</h2>
    <table><tbody>
    <tr>
    <td rowspan="4"><b>Максимальный размер крерпежа:</b></td>....


    в редакторе html, появляются лишние кавычки, которые портят верстку:

    "<h2>Технические характеристики</h2>
    <p></p>
    <table>
    <tbody>
    <tr>
    <td rowspan=""4""><b>Максимальный размер крерпежа:</b></td>....


    что делать?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    В настройках программы укажите чтоб парсило в csv по старинке, только лишь выравнивая в одну строку.
    [​IMG]
     
  3. rhjirftyjn

    rhjirftyjn New Member Пользователи

    Регистрация:
    18 сен 2014
    Сообщения:
    20
    ((( Еще хуже стало.
    теперь текст идет сплошным потоком и между ними. а надо бы, чтобы по столбцам стоял. в модуле импорта указываю номера столбцов с нужным содержимым.
     

    Вложения:

    • Untitled-2.png
      Untitled-2.png
      Размер файла:
      43,8 КБ
      Просмотров:
      6
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Чтоб [CSVCS] стали разделителями указанными в настройке программы. Отметьте так пункты как на скрине.
    [​IMG]
     
  5. rhjirftyjn

    rhjirftyjn New Member Пользователи

    Регистрация:
    18 сен 2014
    Сообщения:
    20
    спасибо! заработало.
    только не понял, что сделали.
    убрали контейнер ячеек и заменили разделитель на дефис... хотя в коде дефисы не появились.
    зачем этот чекбокс?

    еще раз огромное спасибо.
     
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Привели в нужный формат однострочный для каждого товара
    убрали чтоб внутри кавычки не коментировало (дублировало "")
    Если не отметить то при парсинге например в описании если встретятся пару ; то ваш документ примет забавную форму вместо коректного.
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вообще зря вы вернулись к такому формату (с однострочными ячейками, без экранирования кавычек и т.д.). Эти доп кавычки - норма для CSV!!! И они ни чего портить не должны! Почитайте про формат CSV в интернете, если интересно...
     
  8. rhjirftyjn

    rhjirftyjn New Member Пользователи

    Регистрация:
    18 сен 2014
    Сообщения:
    20
    норма то, она норма, я не против нее. только код вставляется с лишними кавычками. как бы они не появлялись, то с удовольствием ничего не менял бы.
    Форумчане, у кого такие же проблемы были, поделитесь решением: чтобы с контейнером ячеек, но без лишних кавычек.
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Интернет магазин должен их нормально обрабатывать и конвертировать в одинарные!!! Сами подумайте, как можно не экранировать их, это противоречит логике... Решения этого в принципе быть не может.

    Думаю, лучше сменить ваш модуль импорта или магазин на тот, что будет хорошо принимать CSV формат.
     
  10. rhjirftyjn

    rhjirftyjn New Member Пользователи

    Регистрация:
    18 сен 2014
    Сообщения:
    20
    (( так cms не причем, первым делом на редактор cms начал грешить. я копипасти код из ячейки в notepad++ и dreamweaver - одинаково дублируются кавычки.
    ну ладно, проблема то решена.
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    При импорте в CMS (магазин) лишние кавычки автоматически удаляться должны!
    Сдается мне, что кто-то сам себе и нескольким людям проблем устроил на ровном месте =)
     
  12. rhjirftyjn

    rhjirftyjn New Member Пользователи

    Регистрация:
    18 сен 2014
    Сообщения:
    20
    И снова про кавычки. Без контейнера ячеек csv не формируется должным образом. (пробовал разные галочки ставить, удалять и оставлять контейнер, ставил другие символы вместо кавычек в роли контейнера ячеек.)
    С ним - все вроде ок. Но в одном столбце (Характеристики), содержимое оборачивается в эти кавычке при копипасте кода в любой редактор. Во всех других столбцах, эти кавычки исчезают.

    И вот что интересно, в самой ячейке этих кавычек не видно, сохраняю csv в разные форматы: xls, xml 2003 - кавычки сохраняются (( откуда они берутся? вроде файл уже не должен сохранять спецсимволы csv.
    Если не трудно, посмотрите файл проекта. В колонке ХАРАКТЕРИСТИКИ. Дайте совет по удалению их .
    Спасибо.

    ссылки:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     

    Вложения:

    • dewalt_ru 2.cdp
      Размер файла:
      28,6 КБ
      Просмотров:
      1
  13. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Сделайте соответствие настроек как на скриншоте.

    [​IMG]

    п.с. у вас контейнер ячеек указан был " хоть это и правильно, но вам хочется идти оказывается против системы)) то уберите указатель контейнера ячеек и отметьте замену разделителя на черточку, если разделитель встретится внутри ячейки (чтоб не поплыли колонки)
     
  14. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте все!

    Господин, Rhjirftyjn, все, кого я знаю и кто работает с CSV, парсят именно в формат с экранированием кавычек и добавлением контейнера ячеек (программа по умолчанию настроена на работу с этим форматом). Пожалуйста, не придумывайте проблем себе и другим, работайте с ПРАВИЛЬНЫМ форматом CSV (где кавычки экранируются (удвояются)). Если вы испытываете проблемы при редактировании CSV в другом редакторе, простите, выкиньте или настройте его. Все редакторы CSV, включая наш встроенный редактор CSV и MS Excel, должны эти двойные кавычки заменять на одинарные при отображении данных!!!

    Далее вести обсуждения на эту (перетертую много раз) тему, думаю, не стоит... Все пришли к должному формату CSV, ждем и вас... =)

    С уважением к вам, Сергей...
     
  15. rhjirftyjn

    rhjirftyjn New Member Пользователи

    Регистрация:
    18 сен 2014
    Сообщения:
    20
    да речь не о двойных кавычках типа: width=""100%"". речь о кавычках в начале и конце текста из ячеек. они не исчезают. причем только в одном столбце (((
     
  16. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Обратитесь ко мне в скайп, спасибо.
     
  17. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Да, давно пора обратиться к господин Kreol, уверен, дело в некорректной настройке! Спасибо всем...
     
  18. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Вопрос был решен, проблема была в том, что опенкарт обновлялся через модуль хмл, а тот как оказалось не умеет различать переносы строк. Убрали переносы все заработало.
     
  19. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Хорошо что разобрались, но пост №3 указывает содержит скрин формата csv что путало многих здесь помогающих.
     
  20. d15000

    d15000 New Member Пользователи

    Регистрация:
    26 окт 2015
    Сообщения:
    5
    Город:
    СПБ
    У похожая ситуация. парсит но все как то криво не по столбцам. и у меня на странице около 1500символов я хочу записать в ячейку как описание . и получается то не парсит польностью ячейку либо построчно кидает если как у Вас выше написано действия делать. Такого типа страницу парсить решил. в первую ячейку записываю заголовок, во вторую пытаюсь записать в поле "описание" целиком которое начинается с <div id="telo"> и заканчивается </div> и которое нельзя нормально записать. записывает построчко если как у Вас и не целиком, либо вообще не записывает.
     

Поделиться этой страницей