Офигенно нужен синонимайзер, знаю, что у одного из моих френдов он есть=) Но покупать не хочется, лучше влезть поглубже в тему, особенно в падежи и склонения, а может в вычленение корня слова скорее, интересно поможет ли мне в этом ispell или aspell, пока не знаю (Возможно из Word проде выцепить). Попарсил, всё, что можно, но ещё пахать не перепахать. Идеал - реальные корни+окончания разделять хотя бы с вероятностью определённой.
Сейчас тоже интересна выборка имён из контекста, как в яндекс новостях. Там разрабатывалось это немало времени, купленная технология, очень интересное направление…
Очень интересно было посмотреть ролики с , (ещё не всех посмотрел, только знакомые имена) спасибо зелёным квадратам, и всем всем всем.
Впервые увидел димульку9, оказывается он такой=) Из остальных был очень интересен Азанов из Яндекс Маркета, очень много в этом направлении перепахано было, и до сих пор многие находки актуальны, но против монополии не попрёшь и у меня многого не хватило, хотя бы и трафика халявного, прикольно, что оно на двух серверах всего. Я бы ему задал вопрос как сохраняется преемственность разработчиков с самого начала и много ли пришлось переписывать c dz времён? Впервые увидел Горного, вообще не ожидал увидеть такой персонаж, но он круто держался=) Классные были ребята-психи из adriver (психи - это не психованные, а это вроде нердов по русски).
Сысоева и Зайцева видел давно, поэтому воспринял уже как знакомых, смотрю дальше. Вообще, из темы юмора, формат одежды для ITшников вообще побоку, но иногда просто хоть стой, хоть падай. Между костюмами и свитерами - только джинсы, скажем так.
Смотрю дальше…
возможно будет полезно ))
Спасибо, это я знаю, ветка mnogosearch, но там алгоритм другой, падежи никто не учитывает.
Сейчас проблема в другом - слово - “Грозный” получится заменить на “Страшный”, но был Страшным, будет Страшным, а корень “Страх”, хз никак не выходит. Пока все движухи идут к вордовому словарю.
Проверил с утра со здорового мозга - и точно умеет склонять=) А дальше то уж дело техники, спасибо!
ИМХО синонимы нужны искуственному интеллекту, но не поиску, это во-первых. Во-вторых, это очень не тривиальная задача, так как синонимы не всегда эквиваленты. К примеру, пони-конь-лошадь - одно животное и с этой стороны синонимы, но на самом деле различны.
Посмотрел список на сайте. Полный бред!
ЛУНА МЕСЯЦ
ЛЮБИТЕЛЬ ОХОТНИК
ЛЮБИТЕЛЬ ДИЛЕТАНТ
ЗАБОТА ПЕЧАЛЬ
ЖЕНЩИНА ДАМА ДАМОЧКА БАБА ЖЕНА ТЕТКА ТЕТЕНЬКА ТЕТЯ - вообще ЛОЛ!
Гы. Представил запрос “Куплю автомат”, а мне в ответ миллион записей “Куплю машину”
Не, Я ушёл в другую тему вообще, нашёл новую игрушку,http://forum.searchengines.ru/= ) Это нужно для унификации контента, если прямо сказать если, что если тыришь контент, то лучше, чтобы он был уникальным, иначе поисковики не полюбят, а мне очень хочется быть “завидным женихом”. Идея просто супер! Юзать datapark как способ получить словоформы=) Главное mnogosearch стоял на sravnim, но в голову так и не пришло унифицировать контент. Велосипед изобретать не буду, сделаю выпадающие списки в тексте, по нескольку, и подтверждать ручками. Вообще, тема ещё та… Словарей ещё нужно больше…
да, примерно общий уровень вот таков=) Проблема в словарях… Есть Абрамова известный словарь, есть ещё у меня на данный момент одна mdb и одна dic база. ХЗ как их распарсить, mdb - это под виндой можно, пока не читал, как подключится. А вот dic…