Content on this page requires a newer version of Adobe Flash Player.

Get Adobe Flash player

WEB STUDIO DESIGN & DEVELOPMENT
Создание сайтов | Графический дизайн | Программирование | Фото -видеоуслуги
Прага, Чехия

Pause/play background slideshow  

Разработка парсеров

Парсер – программа, помогающая извлечь и структурировать необходимые данные из какого-либо, бо́льшего по размеру, объёма информации.

В сфере веб строительства, парсеры в основном используются для получения информации с различных ресурсов, с целью дальнейшего использования её на своём сайте.

Традиционно парсер является составной частью сайта. Однако здесь есть одна сложность: парсеры сайтов работают долго. Это определяется тем, что каждую страницу, перед тем как пропарсить, надо загрузить, и не со всех ресурсов загрузка будет быстрой.

Таким образом время работы парсера, а так же ресурсы, потребляемые им во время работы, могут быть весьма значительными и сильно превышать установленные хостингом лимиты. В то же время арендовать выделенный сервер только ради работы парсера очень накладно.

Что же делать?

Наша фирма, кроме традиционных парсеров, предлагает написание так же десктопных версий под Windows. Такой парсер может обладать привлекательным пользовательским интерфейсом и возможностью снабдить его требуемыми настройками. Вы можете запустить парсер на любом Вашем домашнем компьютере, вручную или по расписанию и пусть он работает хоть сутки, обрабатывая сотни и тысячи страниц. Далее вам останется только вручную или автоматически перебросить данные на хостинг, например в базу данных.

Отдельную сложность представляет написание парсеров для сайтов, содержание которых генерируется с помощью Javascript уже после загрузки страницы. Наши парсеры решают и эти проблемы.

В целом, исходя из поставленных задач, парсеры можно классифицировать следующим образом:

  1. Поддержка актуальной информации, которую можно взять из регулярно обновляемого источника. Например, цены на товары у партнёров.
  2. Автоматическое добавление информации на сайт, генерация контента с помощью данных, полученных с сайтов смежной тематики.
  3. Первоначальное наполнение нового сайта большим объёмом данных, которые можно получить из различных источников.
  4. Объединение информации из различных источников в единую структуру или каталог с целю обеспечить удобство и единообразие поиска и сортировки в данной предметной области.
  5. Перенос содержания устаревших крупных сайтов, хранящих все данные внутри HTML кода, на современные платформы.

Цены на парсеры очень индивидуальны и определяются в процессе постановки задачи.

Если у вас возникли вопросы, пишите, мы с удовольствием на них ответим.