LINUX.ORG.RU

Какой поисковый движок посоветуете?

 , ,


0

1

Делаю что-то на микросервисах.
На чём порекомендуете поднять поиск?

Стало интересно, чем пользуются люди?
Покупают Elasticsearch, сидят на Solr или используют что-то другое? Самописый набор костылей?

С чем столкнулись во время эксплуатации? Как по требованиям?

Solr – это отличный инструмент, основанный на Lucene. Я использую Solr для конвейера анализа и предварительной обработки данных перед индексацией.

Мои данные в основном структурированы, поэтому лексический поиск с фильтрами и логическими запросами идеально подходит для большинства моих сценариев использования. Они добавляют больше семантического поиска.

Qdrant – моя основная векторная база данных. Milvus использует tf/idf с семантикой, но для меня это немного затратно.

sanyodesu
()
Последнее исправление: sanyodesu (всего исправлений: 1)

Elastic Search это же Open Source проект. Зачем его покупать? Просто скачай и установи. По-моему это стандарт де-факто для поиска сегодня. Вряд ли есть смысл смотреть ещё куда-то.

vbr ★★★
()
Последнее исправление: vbr (всего исправлений: 2)

Естественно, бесподобный Hyper Estraier. Сразу замены микросервисов (= набор костылей) на стройный монолит, естественно.

anonymous
()
Ответ на: комментарий от maxcom

OpenSearch

Спасибо.
Как он, если сравнить с Solr?
Если я правильно понял:

«OpenSearch is a distributed search and analytics engine based on Apache Lucene.»

masterOf
() автор топика
Последнее исправление: masterOf (всего исправлений: 1)

Всем спасибо за рекомендации. Opensearch как форк Elastic прям в тему. Если упорюсь глубоко, то и в сторону Solr смело можно будет потратить время.

masterOf
() автор топика
Ответ на: комментарий от troizet

Всё классно, но мой ЯП в этом списке пока отсутствует:

With clients available in PHP, Python, JavaScript, Typescript, Java, Elixir, and Go, integration with Manticore Search becomes easy.

masterOf
() автор топика
Последнее исправление: masterOf (всего исправлений: 1)
Ответ на: комментарий от masterOf

Ну. Тебе виднее. Ластик используют как основную базу. И она уж очень сильно переоценена и распиярена хомячками

Написана на Java

Даже не смущает, что используется тормозной интерпретатор, а значит и память выжрет и тормозить будет. Если уж хочется прикрутить специальный поисковой движок вместо встроенного, то лучше бы альтернативу искал, написанную на C++

rtxtxtrx
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)

Как альтернатива «попроще», есть pgvector (ещё и шустрая) и его производные/схожие. Есть standalone решения, например, Qdrant. Solr и Opensearch уже назвали.

ac130kz ★★
()
Последнее исправление: ac130kz (всего исправлений: 2)