Orama : un moteur de recherche performant pour les livres en texte intégral et les vecteurs

Introduction générale

Orama est un moteur de recherche open source de haute performance écrit entièrement en TypeScript avec un support pour la recherche plein texte, la recherche vectorielle, et la recherche hybride.Orama est conçu pour fonctionner dans n'importe quel environnement d'exécution JavaScript pour fournir une fonctionnalité de recherche rapide et fiable. Il est conçu pour être léger (moins de 2Ko), mais puissant, adapté à une variété de scénarios d'application, y compris les navigateurs, les serveurs et les réseaux périphériques.Orama fournit un riche ensemble de fonctionnalités, telles que la recherche plein texte, la recherche vectorielle, la recherche hybride, la recherche géographique, la tolérance orthographique et le support multilingue, etc. pour répondre aux besoins d'une variété de besoins de recherche, des petits projets aux grandes applications d'entreprise .

Orama:高性能全文本和向量搜索引擎

 

Liste des fonctions

  • Recherche en texte intégralRecherche en texte intégral : permet d'effectuer des recherches en texte intégral rapides et précises dans le contenu des textes.
  • recherche vectorielleRecherche vectorielle : prend en charge la recherche vectorielle pour les données non textuelles telles que les images et les fichiers audio.
  • Recherche hybrideRecherche en ligne : Combinaison de recherches en texte intégral et de recherches vectorielles pour fournir des résultats de recherche plus complets.
  • haute performanceLes algorithmes de recherche optimisés garantissent une réponse rapide en dépit de volumes de données importants.
  • accroître ses ressources financièresLe logiciel est entièrement libre, ce qui permet aux utilisateurs de le personnaliser et de l'étendre à leur guise.
  • non-dépendantLe système de gestion de l'information de la Commission européenne (CEI) : Aucune dépendance externe n'est requise, ce qui simplifie l'installation et l'utilisation du système.
  • Support multiplateformeCompatible avec divers environnements d'exécution JavaScript, y compris Node.js et les navigateurs.
  • Recherche géographiqueLa fonction de recherche géodépendante est prise en charge.
  • tolérance orthographiqueLes erreurs d'orthographe sont tolérées afin d'améliorer l'expérience de recherche.
  • Prise en charge multilingueLe logiciel de gestion de l'information est un outil de gestion de l'information qui prend en charge la segmentation et la tokenisation dans 30 langues.

 

Utiliser l'aide

montage

Orama peut être installé en utilisant npm, yarn ou pnpm. Voici les étapes de l'installation avec npm :

  1. Ouvrez un terminal ou un outil de ligne de commande.
  2. Exécutez la commande suivante pour installer Orama :
   npm install @orama/orama
  1. Une fois l'installation terminée, vous pouvez introduire Orama dans votre projet :
   import { create, insert, search } from '@orama/orama';

utiliser

Création d'index

  1. Créer un nouvel index :
   const db = create({
schema: {
name: 'string',
description: 'string',
price: 'number',
embedding: 'vector[1536]',
meta: {
rating: 'number',
},
},
});
  1. Ajouter des documents à l'index :
   insert(db, {
name: 'Noise cancelling headphones',
description: 'Best noise cancelling headphones on the market',
price: 99.99,
embedding: [0.2432, 0.9431, 0.5322, 0.4234, ...],
meta: { rating: 4.5 },
});
  1. Effectuer une recherche :
   const results = search(db, { term: 'Best headphones' });
console.log(results);

recherche vectorielle

  1. Crée un index vectoriel :
   const vectorIndex = create({
schema: {
name: 'string',
embedding: 'vector[1536]',
},
});
  1. Ajoute le vecteur à l'index :
   insert(vectorIndex, {
name: 'Sample vector',
embedding: [0.1, 0.2, 0.3, ...],
});
  1. Effectue une recherche vectorielle :
   const vectorResults = search(vectorIndex, {
term: 'Sample vector',
mode: 'vector',
});
console.log(vectorResults);

Fonctionnalités avancées

Orama offre également un certain nombre de fonctionnalités avancées telles que l'importation de données personnalisées, les contrôles de qualité, les outils d'analyse et les configurations de sécurité. Les utilisateurs peuvent les configurer selon leurs besoins afin d'optimiser l'expérience de recherche.

Exemples de projets

Orama a été utilisé par plusieurs sites web bien connus tels que nodejs.org, jsr.io et tanstack.com, qui traitent des millions de requêtes par jour, démontrant ainsi la puissance et la fiabilité d'Orama.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...