Раздел Новости!
Идея не нова. Был изготовлен RSS аггрегатор, который собирает новости с новостных лент, предлагаемых самими пользователями IRC.LV. Вроде бы все просто, ан нет!
После того, как новость приходят к нам - она проходит морфологический анализ по словам, создается база ключевых слов новости, по которым находятся "похожие".
Чем больше похожих новостей в определенный промежуток времени - тем больше вес принимает новость. Считается, что если "одинаковая" новость пришла с разных лент - то, скорее всего - она заслуживает внимания. Это первый вариант "сортировки" новостей, который на данный момент используется для формирования главной страницы и "похожести" новостей.
Но это только пол дела.
Любой пользователь может составить "свою подборку новостей". Что это такое? Это список новостных лент и их категорий. Многие новостные ленты создают категории (например Спорт, Политика), добавляя их в свою подборку - каждый участник создает свой уникальный набор "новостей". А дальше включается колаборативный фильтеринг. Какая новость чаще всего встречается в фильтрах? Какая категория? Этим самым можно показывать как и "новости на эту тему", так и "похожие ленты", подборки и тд.
Все это создает массу информации, которую мы сейчас пытаемся переварить и обработать.
продолжение следует...
Комментарии (17)
погоду хотим (я точно хочу) в новости пихнуть или рядом где-нибудь
апдейт нормуль, мне нравится
Кроме общего списка лент на странице http://irc.lv/news/rss их можно видеть в нижней части левой колонки. Там они показываются по принципу "похожести" с читаемой новостью.
Например: Читаем новость http://irc.lv/news?i=141843 - она о спорте. И тут же видим, что есть еще ленты о спорте:
Спорт в мире rus.DELFI.lv
Спорт в Латвии rus.DELFI.lv
VES.LV: Спорт
Спорт Lenta.ru
Как только кто-либо составит подборку о спорте и/или включит туда ещё одну спортивную ленту, этот список спортивных лент пополнится (это и есть коллаборативная фильтрация)
Мало того, в правой колонке будут появляться все "спортивные" Подборки.
В ближайшее время будет появляться разъясняющий FAQ и подсказки-тултипы.
листать то его можно, но нужную ленту найти нереально.
Доступен через "Показать все". Его можно листать. И там явно больше 20 лент.
Нажимаю "показать все" и показывает меньше 20-ти.
Подборку не из чего сделать.
;/
Кстати, может кто знает где можно раздобыть морфологический словарь латышсткого языка?
Просто описание морфологии не подойдёт.
Или, может кто-то знает как можно сгенерировать этот самый морфологический словарь из словаря http://ftp://ftp.stardiv.de/pub/OpenOffice.org/contrib/dictionaries/lv_LV.zip ?