Опубликовано в (Yahoo Pipes, Контент, Сплоги) | автор splogmaster | 17-02-2009
Выкладываю свою рабочую трубу для парсинга результатов поиска Яндекса по нужному ключевому запросу. Yahoo Pipes не дружит с URL-ми, где в значении передаваемых параметров присутствуют русские буквы - это скорее глюк, чем особенность. Пэтому делать сложные трубы для генерации русскоязычного контента практически невозможно. Максимум, что можно сделать, это простую трубу, которая по нужному запросу тянет контент с нужного сайта: это может быть выдача любого поисковика, поиск картинок и т.д.
Собственно, вот сама труба, генерирующая с результатов поисковой выдачи Яндекса 1 пост для сплога:

На входе 2 параметра: key - ключевой запрогс и page - номер страницы выдачи.
Затем с помощью URL Builder “строим” URL, по которому открывается нужная нам страница результатов поисковой выдачи по …
Опубликовано в (Yahoo Pipes, Контент) | автор splogmaster | 12-12-2008
Как известно, большинство RSS-лент содержат лишь анонсы новостей длиной в пару строчек - делать сплог на базе анонсов невыгодно, контента мало, к тому же эта RSS-лента скорей всего транслируется в куче RSS-каталогов, т.е. контент на таком сплоге будет очень неуникальным. Куда лучше делать сплог с полными текстами новостей - конечно же, это будет чистое заимствование контента с сайта-донора, но, поскольку брать контент с авторских сайтов и блогов в большинстве случаев мы не собираемся, то сайтами-донорами будут выступать сайты, которые в свою очередь сами заимствуют контент - поэтому без всяких зазрений совести можно педелывать RSS-ленты с анонсами новостей в RSS-ленты с полным текстом новостей.
Информацию об используемых модулях Yahoo Pipes можете получить в Описание модулей Yahoo Pipes
Для решения данной …
Опубликовано в (Yahoo Pipes, Контент) | автор splogmaster | 10-11-2008
Мысли у меня есть. Есть и частичные реализации. Пока что поделюсь только мыслями, попозже будут и реализации.
Под контентом я понимаю некое целое, составными частями которого являются текст, картинки и видео, - для буржуев возможно еще и подкасты, - вот таким я вижу контент для сплогов. Под генерацией контента я понимаю "найти все составные части и собрать их в единое целое".
И так, нам нужно сделать 3 вспомогательных параметрических трубы, каждая из которых будет выполнять свою определенную часть работы: первая труба будет на выходе выдавать нам картинку, вторая - видео, и третья - текст. В качестве входного параметра будет использоваться ключевой запрос, по которому нам нужен контент. Результирующая главная труба будет объединять результаты работы 3-х вспомогательных труб и на выходе выдавать RSS-фид со сгенерированным по нужному …