Парсинг таблиц для CSV Price

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Buhoy-DED, 13 ноя 2015.

  1. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    здраствуйте! постараюсь подробно описать! в CSV Price Pro атрибуты такого вида в одной яцейке
    HTML:
    Характеристики|Номинальная мощность| 2 кВт.
    Характеристики|Площадь отапливаемого помещения, м2|20
    Характеристики|Напряжение питающей сети, В|220
    и так далее...все в одной ячейке...
    
    произвожу парсинг таблиц такого вида
    HTML:
    <td width="338"><strong>ТВ-3 Leo</strong></td>
    </tr>
    <tr>
    <td height="29"><div align="left">Напряжение питающей сети, В</div></td>
    <td>220 </td>
    </tr>
    <tr>
    <td height="26"><div align="left">Номинальная потребляемая мощность, кВт
    </div></td>
    <td>3,0</td>
    </tr>
    <tr>
    <td height="29"><div align="left">Площадь отапливаемого помещения, м2</div></td>
    <td>30</td>
    </tr>
    и так далее
    
    ввожу функции автозамены
    HTML:
    </div></td>
    <td>| |
    </div></td>
    <td width="338">||
    <div align="left">|Характеристики|
    <{skip}>|
    получаю почти готовый код такого вида
    HTML:
    
    Характеристики|Модель:
    |ТВ-3 Leo
    
    
    Характеристики|Напряжение питающей сети, В
     |220 
    
    
    Характеристики|Номинальная потребляемая мощность, кВт
    
     |3,0
    
    
    Характеристики|Площадь отапливаемого помещения, м2
     |30
    
    После этого возникают вопросы:
    1. Я правильно делаю или как то замудренно
    2. как убрать пробелы между строк и сделать характеристики и значение на одной строке
    3. Самый больной вопрос...после парсинга CSV файл открывается с ??? кодировки все перепробывал не помогает
    вчера бился с этой проблемой, сегодня, голова уже болит..помогите пожалуйста!
     

    Вложения:

    • 1.cdp
      Размер файла:
      27,2 КБ
      Просмотров:
      11
  2. t@lev@n

    t@lev@n Member Пользователи

    Регистрация:
    16 июн 2014
    Сообщения:
    88
    По второму вопросу, попробуй код поиск-замены:
    Код:
    </td>{br}</tr>|. 
    </td>|: 
    <{skip}>| 
    {br}| 
    re:(\s+)| 
     .|. 
     :|: 
    re:(\s+)| 
    re:^(\s*)(.*?)(\s*)$|$2
    На примере приведённого тобой кода страницы Ссылки недоступны для гостей
     
  3. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    спасибо большое! пробелы убирает даже функция
    HTML:
    {br}| 
    а я вводил <br>| нечего не происходило
    но всё ровно в файле csv одни вопросики ??? чтото с кодировкой или я не так делаю, открываю опен оффис
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Если открываете файл в блокноте и вышеобозначенных вопросиков нет, то проблема скорее всего в редакторе Open Office.

    С уважением к вам, Сергей.
     
  5. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    Скорее всего к Вам вопрос...разобрался почему "????" выходят, настройка>опции программы>кодировки , стояла 1251 это кириллица, поставил 65001 - UTF-8, так вот при сохранении, даже стандартным csv который входит в программу открывает с "????" стоит поставить auto а в опероффисе кириллицу 1251 всё открывает замечательно...СD последней версии - до обновления такого не наблюдал, может как то иначе кодировку выставить...

    Ещё раз спасибо! Программа конечно бомба! Всё делается для того - чтобы нечего не делать)) раньше всё ручками приходилось делать...
     
  6. J!Life

    J!Life Модератор Команда форума Модератор

    Регистрация:
    6 дек 2013
    Сообщения:
    83
    В CD сохранение ставить UTF без BOM
    При открытии в Open Office ставить utf-8
    При импорте в опенкарте выбирать кодировку utf-8

    Если csv файл открывать экселем - там будут "вопросы"
     
  7. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    в том то и дело что ставлю utf-8 в CD как будто он эти файлы и не переводил в utf-8, всё ровно хоть в опеноффисе хоть в стандартной программе открывается в 1251 а пытаюсь открыть в utf-8 одни???? , хотя все настройки именно в utf-8
     
  8. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    вот пример файла, все настройки на utf-8 но открывается файл в 1251
     

    Вложения:

  9. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Попробуйте сделать правильно формат файла а не так как вы описали выше, атрибуты в таком виде и не поддаются импорту.
    Используйте повторяющиеся границы, будет чисто и корректно.
    п.с. в предоставленном csv файле "каша" вместо атрибутов
     
    Последнее редактирование: 13 ноя 2015
  10. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    почему каша...всё упорядоченно...просто все атрибуты в одной ячейке, такой формат CSV Price Pro import/export 4 выводит по другому я не знаю как...и на кодировку это ни как не влияет...сейчас на другом компе попробую...
     
  11. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    Всё разобрался...всем спасибо...на другом компе такая же бяда была...сразу лез в настройки программ искал менял там кодировку, то в других файлах...а оказалось всё на виду...как я даже не заметил не понимаю всё перед глазами было...ещё формат файла можно ставить, задавать, во вкладке "контент" стоял "ANSi" поэтому и выдавало одни вопросы...всё гениальное - просто!
     
  12. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Хорошо что выяснили проблему)
    В предидущем сообщении под словом "каша" имел следующее, отмеченное на скрине.
    Краткое пояснение: Неправильно указана характеристика "Мощность", дублируются характеристики у товара, значения характеристик иногда имеют значения с лишним мусором.
     

    Вложения:

  13. Buhoy-DED

    Buhoy-DED New Member Пользователи

    Регистрация:
    11 ноя 2015
    Сообщения:
    11
    Спасибо большое, тоже заметил, вчера уже всё поправил, опять полез в дебри макроса думал там что не так выставил, оказалось как всегда всё банально просто, какой то нехороший человек заполнял так коряво сайт, с которого я парсил, дубли, характеристики, названия, всё разное и т.д. и т.п....

    Блин программа удивляет, каждые два дня обновления, хотя и этого функционала за глаза!
    Автором огромное спасибо, даже не подозревал раньше о существовании такого чуда...столько времени убивалось на ручное заполнение!
     
    Последнее редактирование: 14 ноя 2015
  14. Куат

    Куат New Member Пользователи

    Регистрация:
    31 окт 2015
    Сообщения:
    14
    Здравствуйте! Как вы сделали характеристики и значение в одной строке?тоже собираюсь импортировать в опенкарт с модулем CSV price pro import/export
     
  15. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    По данному вопросу вам лучше обратиться напрямую к автору сообщения (в Skype Kagorec).

    Я не успеваю всем отвечать.
     
  16. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Да, если у вас возникают трудности с которыми не в силе самостоятельно справиться - обращайтесь в любое время, после 1 января)
    п.с. Куат, я вам в соседней теме советовал DYNAMICVALUE, правда не понимаю как это связано с опенкартом что показано в вашем примере было. Такое надо персонально выяснять, по актуальности вопроса пишите.
     
    Последнее редактирование: 31 дек 2015

Поделиться этой страницей