0/5, Голосов: 0
Закрыто

[Повтор] X-Parser Light – парсер контента по списку ключевых слов

Тема в разделе "Скрипты и программы", создана пользователем Брат, 15 авг 2014.

Цена: 13500р.
Взнос: 1023р.
100%

Основной список: 16 участников

Резервный список: 1 участников

Статус темы:
Закрыта.
  1. Брат

    Брат МодерМодератор Команда форума

    X-Parser Light – универсальный парсер контента(текстов) для дорвеев и СДЛ

    X-Parser Light – это универсальное средство для сбора тематического контента по спискам ключевых слов в любых объемах и для любых задач. Он отлично подходит для работы с генераторами дорвеев, а также автопостерами в различные CMS. Кроме того, продукт может быть использован для сбора исходников под рерайты или материалов для наполнения СДЛ.

    [​IMG]

    При тестировании парсер показывает скорость до 1 мегабайта в минуту, что эквивалентно 1.5 гигабайта в сутки. Собираемый контент отлично подходит для наполнения дорвеев. Если нужно наполнять сайты, требующие более чистого и качественного контента, например СДЛ, можно рассчитывать на 80-90% абсолютно чистых статей. Для фильтрации и обработки контента предусмотрен встроенный менеджер обработки контента.
    X-Parser работает многопоточно. Количество потоков задаете Вы сами. Имеет удобный интуитивно понятный интерфейс и при этом очень гибок в настройке. Все настройки могут сохраняться, как отдельно так и все вместе для максимального удобства работы.

    Возможности X-Parser Light:
    • Автоматическое распознавание тела статьи на любой странице любого сайта (если таковая там имеется))).
    • Удобный редактор для ручной проверки отпарсенного контента при помощи менеджера обработки контента.
    • Возможность парсить контент без разметки (под генераторы дорвеев и т.п.)
    • Возможность парсить контент с формированием базовой разметки на базе исходной разметки донора (выделения, заголовки и т.п.).
    • Возможность на стадии сбора контента фильтровать как статьи, так и отдельные абзацы по собственным фильтрам.
    • Возможность проверки статей на наличие целевого кейворда в теле статьи.
    • Добавление любых поисковых систем для парсинга исходных ссылок.
    • Настройка всевозможных форматов вывода статей для дальнейшего экспорта контента в любые программы для автопостинга контента.
    • Возможность парсить контент на любых языках.
    • Автоматическое определение капчи поисковых систем. Т.е. не зависимо от того какую ПС вы добавите, парсер самостоятельно определит страницу с капчей и отправит ее на Antigate либо предложит ввести ее вручную, в зависимости от выбранных настроек.
    Парсер постоянно обновляется, все обновления в рамках Light-версии бесплатны.
    ВНИМАНИЕ!
    Продукт приобретается официально у автора по фиксированной (оптовой) цене со скидкой для складчиков! Вам будут доступны все официальные обновления от автора!

    Стоимость лицензии - 900 рублей (официальная цена ~2 000 руб.) = скидка 55 %
    Взнос - фиксированный, с учетом интересов клуба ~1 023 руб.

    ! Не менее 10 чел. !

    !!! БОНУС !!!

    Участникам складчины - будет выдана бесплатно лицензия на расширенную версию программы Penguin.

    Penguin – это система обработки баз ключевых слов, служащая для обработки текстовых файлов больших размеров (до терабайта). Под обработкой подразумевается возможность осуществления выборок по ряду условий, фильтрация этих выборок от любого мусора, сортировка, перемешивание, удаление явных и неявных дублей строк, поиск дубликатов строк, осуществление поиска, замены и т.п.

    Стоимость расширенной версии составляет 10$.

    [​IMG]
    Области применения Penguin:
    • Основной, но далеко не единственной, областью применения Penguin является подбор ключевых слов из текстовых баз (файлов), подобных Базе Пастухова, которые можно найти в свободном доступе в сети.
    • Так же он будет полезен, если возникает необходимость извлечь нужные данные из любого списка или файла, или очистить его от ненужных элементов.
    • Вполне возможно применение Penguin для очистки отпарсенного контента от дублей и любого мусора, что бывает необходимо при подготовке текстов под доргены.
    Какие задачи может решать Penguin:
    • Открывать и просматривать контент больших текстовых файлов (1-2000Gb).
    • Производить выборки по ряду условий из текстовых файлов любых размеров со скоростью порядка 1 гигабайта в минуту.
    • Производить фильтрацию строк или кейвордов по включениям. Т.е. задав в качестве включения слово "Скачать" Вы получите все строки, которые содержат данное слово. Возможно задавать несколько включений одновременно, можно использовать регулярные выражения.
    • Производить фильтрацию строк или кейвордов по исключениям. Т.е. задав в качестве включения слово "Бесплатно" Вы получите все строки, которые не содержат данное слово. Возможно задавать несколько включений одновременно, можно использовать регулярные выражения.
    • Производить фильтрацию фильтрации строк или кейвордов по дублям слов (в расширенной версии).
    • Фильтровать строки по длине.
    • Фильтровать строки по количество слов.
    • Удалять явные дубли.
    • Удалять неявные дубли (в расширенной версии).
    • Находить дубли. Актуально, если нужно найти пересечения в нескольких списках любых строк или кейвордов (в расширенной версии).
    • Производить поиск нужных элементов каждой строки с помощью регулярных выражений. Например можно с легкостью из списка с данными клиентов извлечь список телефонов, задав 1 условие.
    • Производить поиск-замену, как с регулярными выражениями, так и без, в текстовых файлах неограниченных размеров.
    • Производить обработку одновременно нескольких файлов.
    • Производить выборку по разным включениям, сохраняя результаты в разные файлы, получая отдельные выборки по каждому условию за 1 проход (в расширенной версии).
    • Сохранять все настройки для повторного выполнения однотипных обработок.


     
    Последнее редактирование: 9 окт 2014
    1 человеку нравится это.
  2. Последние события

    1. skladchik.com

      Складчина закрыта.

      18 окт 2014
    2. skladchik.com

      Осталось 5 дней до завершения складчины.

      12 окт 2014
    3. Alseo

      Alseo участвует в складчине.

      9 окт 2014
    4. skladchik.com

      Складчина активна.

      9 окт 2014

    Последние важные события

    1. skladchik.com

      Складчина закрыта.

      18 окт 2014
    2. skladchik.com

      Осталось 5 дней до завершения складчины.

      12 окт 2014
    3. skladchik.com

      Складчина активна.

      9 окт 2014
    4. skladchik.com

      Сбор взносов начинается 08.10.2014.

      6 окт 2014
  3. renessans

    renessans ЧКЧлен клуба

    ещё 3 человека )
     
  4. renessans

    renessans ЧКЧлен клуба

    при 10 вступивших есть возможность начать выкупать лицензии?
     
  5. quaesitor

    quaesitor РезервистРезервист

    На какие реквизиты оплату вносить ?
     
  6. X-Software

    X-Software СкладчикСкладчик

    Вышли новые обновления. Актуальная версия - 1.5.1. Внесены следующие изменения:
    • Обновлена система авторизации, исключена прямая зависимость от сервера авторизации. Теперь, если сервер недоступен приложение свободно запускается, не обращая на это внимания.
    • В связи обновлением системы авторизации имейте в виду, что при установке данных обновлений, Вам будет нужно переактивировать приложение. Для этого нужно как обычно указать свой код активации и ответить на секретный вопрос, который Вы указывали при предыдущей активации.
    • Добавлена поисковая система Webcrawler.com (EN), для сбора контента на английском языке
    • Добавлена поисковая система Hotbot.com (EN), для сбора контента на английском языке
    • Обновлена система автоматических обновлений
    • Обновлена форма "О программе"
     
  7. X-Software

    X-Software СкладчикСкладчик

    X-Parsr Light обновлен до версии 1.5.2.
    1. Добавлена возможность сохранения контента в файлах с различными расширениями, что позволяет настроить формат вывода абсолютно под любые нужды.
    2. Добавлен формат вывода полностью совместимый с TextKit
    3. Добавлен формат вывода в виде RSS-фида, что позволяет импортировать контент в любые движки, которые поддерживают импорт контента из RSS, например в такие, как DLE.
     
  8. Basill

    Basill ОргОрганизатор (А)

    X-Software Если есть Content Downloader X1 то данный парсер уже не нужен?
     
  9. X-Software

    X-Software СкладчикСкладчик

    Ну я не знаю там за X1, но CD и X-Parser выполняют совершенно разные задачи: CD - ручная настройка под каждый источник (универсально, но нужно настраивать и парсить можно только заданый источник), X-Parser - автомат, ничего не нужно настраивать - ввел ключи, получил контент со всех возможных источников без всяких настроек привязки к шаблону. Т.е. X-Parser сециализировано под это настроен. Что такое X1, я не в курсе, CD есть но я им не пользуюсь почти и давно не обновлялся. По отзывам покупателей лучше X-Parser для автоматического сбора статей по ключевым словам нет, так как такой автомат имеет достаточно сложный алгоритм (который трудно сделать), который выделяет тело статьи самостоятельно на любой странице любого сайта. В CD же все просто, вы указываете границы в теле документа и получаете содержимое внутри этих границ.
     
  10. Брат

    Брат МодерМодератор Команда форума

    Участникам складчины - добавлен приятный бонус !!!
    Подробнее в шапке ....
     
    Последнее редактирование: 9 окт 2014
  11. AmegA

    AmegA ЧКЧлен клуба

    Подскажите, пожалуйста...возможно ли записаться ? у меня при попытке записаться вылетает окно "Складчина остановлена." :(
     
Статус темы:
Закрыта.

Поделиться этой страницей