Содержание
Парсинг
Ссылки
Варианты парсинга сайтов
Решение проблемы "больших сайтов"
В качестве URL можно скармливать SiteMap.XML
, у некоторых есть отдельный файл для магазина
Либо скармливать карту сайта, отфильтрованную регуляркой
- http://www.sin-el.ru/sitemap.xml (товары начинаются с «list_show_»)
"Не надо парсить сайт"
На некоторых есть прайс-лист в Excel (который парсится еще легче)
Некоторые сайты отдают готовую информацию в JSON
Такие ответы быстрые, готовые, и достаточно пройти по IDшникам
Магазины выгружают цены для Yandex Market
Парсить Yandex Market