Мысли о генераторе контента на основе Yahoo Pipes

Опубликовано в (Yahoo Pipes, Контент) | автор splogmaster | 10-11-2008

Тэги: , , , , ,

Мысли у меня есть. Есть и частичные реализации. Пока что поделюсь только мыслями, попозже будут и реализации.

Под контентом я понимаю некое целое, составными частями которого являются текст, картинки и видео, - для буржуев возможно еще и подкасты, - вот таким я вижу контент для сплогов. Под генерацией контента я понимаю "найти все составные части и собрать их в единое целое".
И так, нам нужно сделать 3 вспомогательных параметрических трубы, каждая из которых будет выполнять свою определенную часть работы: первая труба будет на выходе выдавать нам картинку, вторая - видео, и третья - текст. В качестве входного параметра будет использоваться ключевой запрос, по которому нам нужен контент. Результирующая главная труба будет объединять результаты работы 3-х вспомогательных труб и на выходе выдавать RSS-фид со сгенерированным по нужному ключевику контентом.
Вот такой простой алгоритм:

generator-kontenta

Теперь мысли о реализации генератора контента на Yahoo Pipes:

  1. Картинки - в Yahoo Pipes есть готовый модуль для поиска картинок на Flickr.com. Нам остается только создать html-шаблон для этого куска контента c с помощью модуля Regex;
  2. Видео - как простейший вариант возьмем youtube и поиск видео от гугла. И снова создать html-шаблон;
  3. Текст - самый важный кусок контента и самый обширный по количеству источников. Если подойдет простой голый текст, то нам даже не потребуется ничего парсить - выдача результатов поиска по ключевому запросу в виде RSS-фида есть во многих местах, нам останется только скомбинировать RSS-потоки из разных источников;
  4. Объединений кусков контента в один фид - обращаемся к главной трубе, передаем ей наш кейворд - внутри трубы происходит обращение ко всем вспомогательным трубам, тянутся куски контента по нужному кейворду, все это комбинируется/мэшапится, выдавая в итоге RSS-фид для наполнения сплогов. Так же в главной трубе можно подключить какие-нибудь полезные дополнительные возможности, например, перелинковку постов на сплогах.

Заметьте, я говорю о генерации контента, а не о генерации текста, поэтому никаких цепей Маркова, никаких заумных алгоритмов по синонимизации и уникализации текста я не затрагиваю.

Так же я не рассматривал один важный вопрос: сплог это не сателит, вся сила сплога в том, что он наполняется с течением времени, нам нужно создать иллюзию живого блога, на котором регулярно появляются новые посты, поэтому нам не подойдет вариант генератора контента, когда мы по нужному кейворду сразу получим контента на 100 постов. Нам нужно создавать на сплоге по 2-5 постов каждый день, и вовсе не обязательно привязывать один сплог к одному единственному кейворду.

Последняя мысль: Yahoo Pipes это конструктор, и по мере накопления опыта ваши конструкции будут становится все более масштабными и универсальными.





Комментарии:

Оставить комментарий