Парсер страницы

Тема в разделе "Свободное общение", создана пользователем solar_boy, 15 авг 2014.

  1. solar_boy

    solar_boy solar_boy ОргОрганизатор

    Привет друзья!
    Можете помочь?
    Есть некая страница на сайте. С нее нужно выдернуть несколько цифр и сохранить в xml
     
  2. EvilDoom

    EvilDoom EvilDoom ЧКЧлен клуба

    скинь страницу
     
  3. solar_boy

    solar_boy solar_boy ОргОрганизатор

    Вот тестю:
    Код:
    <?php
    
      //Настройки парсера
    
      //URL для парсинга контента
    
      $url = 'http://www.cy-pr.com/news/software/8692/';
     
    
      //Стартовый тег для парсинга контента
    
      //тег который стоит перед началом нужного участка кода для парсинга
    
      //и используется 1 раз
    
      $start = '<div class="l-content">';
    
     
    
      //Конечный тег участка кода для парсинга
    
      //Тег который стоит после нужного участка который будем парсить
    
      $finish = '<br class="clear"/>';
    
     
    
      //Создаём функцию парсера
    
      function parser($url,$start,$finish) {
    
     
    
      //Получаем весь код страницы
    
      $content = file_get_contents($url);
    
     
    
      //Ищем позицию с которой мы будем вырезать код для дальнейшего использования
    
      $position = strpos($content, $start);
    
     
    
      //Вырезаем нужный блок
    
      $content = substr($content, $position);
    
      $position = strpos($content, $finish);
    
     
    
      //Вырезаем код
    
      $content = substr($content, 0, $position);
    
     
    
      //Вырезаем HTML теги
    
      //Для добавления\удаления используемых тегов допишите\удалите теги
    
      $content = strip_tags($content, '<p><a>');
    
     
    
      //Debug (Проверка того, что выводит парсер)
    
    // echo nl2br($content);
    
     
      //Возвращаем напарсеный контент
    
      return $content;
    
      }
    
    
    //Вызываем функцию парсинга
    
      $e = parser($url, $start, $finish);
    
    
    $dom_xml= new DomDocument();
    $dom_xml->loadXML('<car><model>volvo</model><model>Lada</model></car>');
    $path="test.xml";
    $dom_xml->save($path);
    ?>
    В строке вызова функции парсинга я результат записываю в переменную е для того чтобы ее вставить в xml заместо текста <car><model>volvo</model><model>Lada</model></car>
     

Поделиться этой страницей