- PVSM.RU - https://www.pvsm.ru -
Возникла нужда сделать универсальный парсер.
Имеется n сайтов (интренет магазинов), таких как ebay [1], buy [2]. Нужно получить данные такого вида:
Всё должно в примерннотаком порядке:
Данные должны также успешно парсится с любого интрнет магазина, при этом 100% результат должен получаться не меньше чем в 6 случаях из 10.
Первое что пришло в голов, настроить PHP parser по шаблонам. Для этого решил испробовать библиотеку "PHP Simple HTML DOM Parser", поскольку делать шаблоны на регулярных выражениях могло привести не изведанным резуьтатам, плюс библиотека действительно удобная.
Для этого первым дело нужно было найти сам контэйнер в котором содержиться и цена и название и картинка.
С ebay прошло удачно, но дальше, пошло уже на перекасяк.
Начало искалось по title, но у следуещего сайт title был выведен за границы основного контэйнера (ох уж эти верстальщики).
В прочем идея начал сама по себе отпадать, слишком много шаблонов готовить нужно, т.к. на данный момент имеющаяся база интерент магазинов привышает 500, к тому же не хотелось бы получить жалобу от клиента, типо "я вставил линк, а в ответ получил какойто бред". (но от идеи еще не отказался потому что слишком мало других вариантов)
Пока только идея, алгоритм должен происходить в след порядке.
Сделать это в фоновом режиме можно только при помощи ajax, но получим очен долгий отклик браузера, хром и ИЕ возможно даже предложит убить окно.
Да и посоветовавшись с колегой мне сказали что это ТУПО.
В итоге ничего нету.
Хотелось бы услашать дельные советы по этой проблеме.
Есть ли другое решение или стоит продолжать по первому варианту.
Может кто-то разробатывал что-то подобное, умный поиск по странице или поиск адыкватных данных.
Автор: erik91
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/php-2/12462
Ссылки в тексте:
[1] ebay: http://ebay.co.uk
[2] buy: http://www.buy.com
[3] www.buy.com/prod/mxl-condenser-microphone-and-pop-filter-bundle-mxl-2008-pf001/224516871.html: http://www.buy.com/prod/mxl-condenser-microphone-and-pop-filter-bundle-mxl-2008-pf001/224516871.html
Нажмите здесь для печати.