Новости сайта
Главная страница » 2006 » Июль » 4 » Как создавать RSS-потоки для любой веб-страницы

Как создавать RSS-потоки для любой веб-страницы
Рано или поздно вам захочется постоянно отслеживать обновления определенных вебсайтов, информационных страниц или рубрик интернет-директорий - причем, наверное, даже не зная необходимых технических терминов.

Вы слышали об форматах RSS и Atom, веб-лентах (потоках, фидах) и других на первый взгляд не очень ясных технических понятиях, описывающих нечто, очень похожее на то, в чем вы нуждаетесь в настоящий момент - но даже при всем вашем желании вы не знаете, как начать отслеживать страницы, на которых не указана ни одна из вариаций "оранжевой кнопки", указывающей на присутствие соответствующего RSS-потока.

Можете ли вы создать RSS-поток для веб-страницы, у которой его нет?

Может ли рядовой пользователь делать это самостоятельно?

Ответ на оба эти вопроса - твердое ДА!

Сегодня, благодаря новым, доступным для всех сервисам "соскребывания HTML" (HTML scraping), можно создавать автоматически сгенерированные RSS-потоки практически для любого вебсайта, вне зависимости от типа его расклада, кодировки или языка, на котором он написан. В некоторых ситуациях создание стандартного RSS-потока из не имеющей его веб-страницы может занять меньше минуты. В других случаях (когда степень требуемой частной настройки выше), этот процесс может длиться дольше.

Мораль сей басни такова: сегодня можно сделать так, чтобы любая веб-страница автоматически генерировала собственный RSS-поток. Сделать это может ее обладатель или (как все чаще происходит), кто-либо другой, кто нуждается в постоянном мониторинге обновлений контента этой страницы

Вот подробности:

Соскребывание HTML (HTML scraping) или способность автоматически генерировать стандартный RSS-поток из документа HTML (т. е. веб-страницы), не имеющего такого потока, становится все более востребуемой услугой в течение последних двух лет.

Раниие сервисы, предлагавшие ее (вроде MyRSS), позднее исчезли или были заменены другими, более доходными. Создание автоматического RSS-потока из не имеющей RSS-поддержки страницы дает несколько по-настоящему полезных возможностей для ее потенциального применения, и я уверен, что такие сервисы скоро выйдут на более высокий уровень доходов на рынке.

FeedYes

FeedYes - это самый последний игрок, вошедший в эту небольшую группу интернет-сервисов. Его разработчики нашли простой и по-настоящему эффективный способ для выполнения стоящей перед ним задачи. Результаты его работы достаточно хороши, чтобы удовлетворить большинство потребностей пользователей.

Хотя он и не совершенен, он очень хороший и быстрый. FeedYes также довольно прост в использовании. После того, как вы проходите через процесс создания потока в первый раз, его повтор займет у вас, скорее всего, только несколько секунд.

FeedYes предоставляет трехшаговый процесс, включающий в себя:
определение URL страницы, для которой будет создаваться автоматический RSS-поток,
указание на первый динамический линк (среди найденных FeedYes на странице), который относится к той рубрике контента, в какой вы заинтересованы (у всех веб-страниц есть разные рубрики контента, и вы, скорее всего, не захотите создавать поток, включающие лишние секции вроде комментариев или списка последних статей),
указание на последний динамический линк, относящийся к желаемому контенту

Таким образом FeedYes изолирует с довольно хорошей точностью именно тот контент, который вам нужен (причем вы "наводите" механизм в процессе создания "ручного" потока), и создает из него RSS-поток.

Feed43

Feed43 - это интернет-сервис, конвертирующий обыкновенные веб-страницы или документы XML в RSS-потоки. Он извлекает отрывки текста или кода HTML, применяя к странице определенные шаблоны поиска, которые должен ввести пользователь. Эти шаблоны помогают Feed43 точно определелить, какой контент снимать со страницы и включать в поток, а какой - нет.

Это дает гораздо большую степень точности в контроле над тем, что будет содержать поток, - правда, в убыток общей простоте использования и доступности продукта. Для технически сведущих пользователей это отличный и очень надежный способ генерации RSS-потоков, но он может "отпугнуть" от себя менее опытных клиентов.

В Feed43 последовательность шагов для создания RSS-потока следующая:
Идентификация страницы, из которой следует сгенерировать поток
Создание записи для RSS-потока на Feed43, указывающего на эту страницу
Определение требуемых поисковых паттернов
Определение требуемых шаблонов вывода
Генерация нового RSS-потока

Все потоки, создаваемые на Feed43, являются "публичными", но Feed43 также позволяет вам защищать любой созданный на нем поток паролем. Этот также бесплатен, как и FeedYes.

FeedFire

FeedFire - это самый старый из этих сервисов пробразования HTML в RSS.

Вы просто регистрируетесь на FeedFire, вводите URL требуемой страницы, и FeedFire сделает все остальное за вас в течение секунд. Все, что требуется - это полный URL к веб-странице, для которой вы хотите создать RSS-представление. Все расходы по пропускной способности и хранению новых RSS-потоков FeedFire берет на себя.

FeedFire также позволяет спонсировать созданные RSS-потоки. Это может делать любой человек вроде меня или вас, не представляющий какую-либо крупную компанию, а просто разыскивающий умный, обладающий широким набором свойств сервис, который может позволить ему увеличить достижимость и видимость своего или чужого вебсайта.

RSS-потоки, созданные и спонсируемые с помощью FeedFire, можно также делать частными и использовать их для создания разведывательных отчетов, объектов обучения RSS или каналов RSS-ньюсмастеринга, содержащих не доступную другим информацию.

Спонсируемые потоки можно фильтровать и далее, позволяя спонсору отбирать только те новостные элементы, которые включают или не включают в себя определенные ключевые слова. Также можно настраивать количество этих элементов, отображаемое в спонсируемом потоке, количество слов на каждый элемент и даже заглавие и описание вновь созданного RSS-потока. Чем выше уровень спонсорства, тем выше уровень свойств и настраиваемости потока.

Категория: WebZ | Просмотров: 678 | Добавил: huligun | Дата:
Комментарии
Всего комментариев: 0
Имя *:
Email *:
Код *:
Используются технологии uCoz