Создание RSS-агрегатора для сплогов с помощью Yahoo Pipes

Опубликовано в (Yahoo Pipes) | автор splogmaster | 02-11-2008

Тэги: , , , , , , ,

Допустим, есть у нас пару десятков или сотен сплогов, у каждого сплога соответственно есть своя RSS-лента. Конечно же, проспамить каждую RSS-ленту каждого сплога по RSS-каталогам это наиболее полезный вариант в плане ускорения индексации новых постов и получения трафика, но, как в случае со сплогами на blogger.com - геморрой не стоит свеч. Поэтому, с помощью Yahoo Pipes мы сделаем RSS-агрегатор, который будет собирать/агрегировать RSS-ленты всех наших сплогов, с каждой ленты мы будем брать только последний пост, ну и в конце мы отсортируем последние посты со всех сплогов по дате создания. Полученную с помощью RSS-агрегатора rss-ленту можно будет как минимум добавить в feedburner.com и в гугловский Reader, ну а как максимум - прогнать по RSS-каталогам.

И так, переходим к трубам, т.е. к Yahoo Pipes. Для реализации задуманного нам понадобится сотворить 2 трубы:

  1. Труба 1postRSS - вспомогательная параметрическая труба. На входе задаем адрес RSS-ленты сплога - на выходе получаем только самый последний пост. 1postRSS
  2. Труба RSSagregator - основная труба, наш RSS-агрегатор. Работает она/он следующим образом: в созданном нами .CSV файле находится список со всеми RSS-лентами наших сплогов (в примере я просто повторил 10 раз rss-ленту своего блога), труба подсасывает этот файл, берет из него все адреса RSS-лент, в цикле вызывает вспомогательную трубу 1postRSS для каждой RSS-ленты, и, наконец, сортирует результат по дате создания поста.  RSSagregator

Если сплогов очень много, то можно еще поставить обрезку результирующего потока до 500, иначе могут возникнуть проблемы при добавлении выходной RSS-ленты в feedburner.com (ограничение в 512кб на размер ленты). В случае со сплогами на blogger.com можно сделать очистку параметра description, поскольку rss-лента с блоггера выдает полные тексты постов.

Результатом работы нашего RSS-агрегатора будет вот эта RSS-лента, которую можно спамить, можно засовывать в ридеры, можно использовать другой трубой для перелинковки сплогов и т.д.

Мой блог находят по следующим фразам





Оставить комментарий