Пишем простенький парсер avito на php — собираем название, телефон, имя

Сегодня мы напишем простенький парсер avito, соберем название, телефон и имя чтобы потом вставить в excel и удобно распечатать.

Таким способом можно отслеживать и свои объявления и объявления конкурентов, т.к. ручками собирать телефоны довольно долго и правильно будет это дело автоматизировать.


Код простой:

Работа со скриптом тоже простая:

- в форму на странице вставляем url рубрики с авито
- нажимаем «отправить»
- собралась страница объявлений  (в файл obj.txt)
- и нажимаем «к следующему объявлению»
-  объявления начинают собираться, по одному объявлению каждые 50 секунд.
- после окончания процесса копируем собранную информацию в эксель таблицу и нажимаем «очистить файл с напарсенными данными».

10 thoughts on “Пишем простенький парсер avito на php — собираем название, телефон, имя

  • 04.11.2017 at 19:10
    Permalink

    Не получает телефон, пишет нет данных

    Reply
    • 20.11.2017 at 13:59
      Permalink


      preg_match("/show-number\W+\"\W+href=\"([^\"]+)\"/siu", $card, $linkPhone);

      поменять на

      preg_match("/js-action-show-number\"\W+href=\"([^\"]+)\"/siu", $card, $linkPhone);

      Они поменяли у себя код, парсер перестал работать.

      Reply
  • 23.11.2017 at 17:25
    Permalink

    Здравствуйте.
    Спасибо за скрипт.
    С какой периодичностью меняют программистs авито код и как понять что именно они поменяли в коде?

    Reply
    • 24.11.2017 at 08:26
      Permalink

      Раз в пол года или реже.
      Скрипт не сложный, можно его разобрать и поэтапно смотреть где он сломался и что парсит и если что-то не выводит то уже анализировать. Он (скрипт) скорее как пример, на базе него уже можно сделать более сложный под свои нужды.

      Reply
      • 24.11.2017 at 09:50
        Permalink

        Спасибо.

        Reply
  • 24.11.2017 at 13:54
    Permalink

    Вы не пробовали парсить с помощью simple_html_dom()?
    У Вас нет подобной статьи про это?

    Reply
    • 02.04.2018 at 09:39
      Permalink

      simple_html_dom() — падает при парсинге большого колиечства контента.

      Reply
      • 10.04.2018 at 10:59
        Permalink

        Да, он требует много оперативной памяти. Можно увеличить лимиты в php.ini

        Reply
  • 20.05.2018 at 18:03
    Permalink

    А ваш скрипт каким образом не расходует много оперативки?

    Reply
    • 21.05.2018 at 10:04
      Permalink

      Не кушает, запустился — сделал свою работу и закрылся. Да и память нынче дешёвая.

      Reply

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">