ZeroSearch - Ali Tongyi a lancé le moteur de recherche open source pour les grands modèles.
Qu'est-ce que ZeroSearch ?
ZeroSearch est un moteur de recherche à grand modèle innovant et open source d'Alibaba Tongyi Labs. Le cadre n'a pas besoin d'interagir avec le moteur de recherche réel, basé sur la simulation du moteur de recherche, avec un grand modèle de ses propres connaissances de pré-entraînement pour générer des documents pertinents ou bruyants, réduisant considérablement le coût de formation (réduire 80% ou plus).ZeroSearch basé sur le réglage fin supervisé léger et les mécanismes d'apprentissage de cours pour améliorer progressivement la capacité de raisonnement du modèle pour soutenir une variété d'algorithmes d'apprentissage par renforcement (tels que PPO, GRPO). ZeroSearch est applicable à une variété de scénarios tels que les questions-réponses intelligentes, la création de contenu, la recherche et le développement, et est hautement évolutif et polyvalent.

Principales caractéristiques de ZeroSearch
- Capacité de recherche analogiqueZeroSearch peut simuler la fonction de recherche d'un moteur de recherche et générer des documents avec la réserve de connaissances du grand modèle lui-même, sans dépendre de véritables moteurs de recherche externes, réduisant ainsi le coût d'utilisation et la dépendance vis-à-vis de l'extérieur.
- Génération flexible de documentsIl permet de générer des documents de haute qualité en rapport avec la requête, ou de générer des documents bruyants, et de contrôler de manière flexible la qualité des documents sur la base de l'ajustement des mots repères, afin de fournir des scénarios de recherche diversifiés pour l'apprentissage du modèle.
- Réduction efficace des coûtsZeroSearch : ZeroSearch réduit considérablement les coûts de formation par rapport à la formation avec de vrais moteurs de recherche pour l'apprentissage par renforcement, ce qui rend la formation à grande échelle plus économiquement viable.
- haute compatibilitéIl est compatible avec de nombreux modèles de grande taille avec différentes échelles de paramètres (par exemple, 3B, 7B, 14B), prend en charge de nombreux algorithmes d'apprentissage par renforcement (par exemple, PPO, GRPO) et est très évolutif et polyvalent.
Adresse du site officiel de ZeroSearch
- Site web du projet: :https://alibaba-nlp.github.io/ZeroSearch/
- Dépôt GitHub: :https://github.com/Alibaba-nlp/ZeroSearch
- Bibliothèque de modèles HuggingFace: :https://huggingface.co/collections/sunhaonlp/zerosearch
- Document technique arXiv: :https://arxiv.org/pdf/2505.04588
Comment utiliser ZeroSearch
- Préparation de l'environnement: :
- Installation de PythonPour ce faire, vous devez vous assurer que Python est installé sur votre système (Python 3.8 et plus est recommandé).
- Installation des bibliothèques dépendantesInstaller les bibliothèques Python nécessaires à ZeroSearch. Ceci peut généralement être fait avec la commande suivante :
pip install -r requirements.txt
- Les fichiers de dépendance spécifiques peuvent être trouvés dans le dépôt GitHub.
- Obtenir le code et le modèle: :
- Cloner un dépôt GitHubCloner le code à partir du dépôt officiel GitHub de ZeroSearch :
git clone https://github.com/Alibaba-nlp/ZeroSearch.git
cd ZeroSearch
- Télécharger le modèle pré-entraînéTélécharger les fichiers de modèles pré-entraînés nécessaires en suivant les instructions de ZeroSearch.
- Environnement de configuration: :
- Configuration des chemins d'accès au modèleSpécifiez le chemin d'accès au modèle pré-entraîné dans le code afin de vous assurer que ZeroSearch charge le modèle correctement.
- Paramètres de réglageAjustez les paramètres dans le fichier de configuration ou le code de ZeroSearch selon vos besoins, tels que la taille du modèle, les algorithmes d'apprentissage par renforcement, les chemins d'accès aux données d'apprentissage, etc.
- Lancer ZeroSearch: :
- formation d'amorçageLancement du script de formation ZeroSearch : Lancez le script de formation ZeroSearch. Lancez-le à l'aide de la commande suivante :
python train.py
- Les noms et paramètres spécifiques des scripts peuvent varier d'une version à l'autre, veuillez vous référer à la documentation officielle.
- Essais et validationLa formation terminée, les performances de ZeroSearch sont vérifiées à l'aide d'un ensemble de données de test afin de s'assurer que les documents pertinents sont correctement générés et que les réponses aux questions sont correctes.
Les points forts de ZeroSearch
- Aucune interaction réelle avec les moteurs de recherche n'est nécessaireZeroSearch : ZeroSearch est basé sur la fonctionnalité d'un moteur de recherche simulé et est complètement indépendant des moteurs de recherche externes, ce qui réduit les coûts et les dépendances.
- Réductions significatives des coûtsLes coûts de formation de ZeroSearch sont nettement inférieurs à ceux des méthodes traditionnelles, ce qui rend la formation à grande échelle plus rentable.
- Capacités de génération de documents flexiblesLe système permet de générer des documents de haute qualité ou bruyants, qui peuvent être ajustés de manière flexible en fonction des besoins de l'utilisateur afin de répondre à divers scénarios de formation.
- Une réalisation technique puissanteAmélioration de la performance des modèles et de l'inférence basée sur un réglage fin supervisé léger, des mécanismes d'apprentissage et des mécanismes de récompense basés sur les scores F1.
- Large éventail d'applicationsIl est compatible avec une variété de grands modèles et d'algorithmes d'apprentissage par renforcement, et convient à de nombreux scénarios tels que les questions-réponses intelligentes, la création de contenu, l'éducation et la gestion des connaissances de l'entreprise.
- Source ouverte et soutien de la communautéZeroSearch : En tant que framework open source, ZeroSearch offre un accès libre au code et au support de la communauté pour une personnalisation et une optimisation aisées.
Scénarios d'application de ZeroSearch
- Chercheurs en intelligence artificielleLe projet a pour but d'améliorer l'efficacité de la formation des modèles et de l'optimisation des algorithmes grâce à un cadre de recherche efficace et peu coûteux.
- développeur en traitement du langage naturelLes applications : créer rapidement des applications dans des domaines tels que les questions-réponses intelligentes et la création de contenu.
- Équipe technique de l'entrepriseLes techniciens optimisent la gestion des connaissances de l'entreprise et améliorent l'efficacité de la recherche interne.
- Éducateurs et étudiantsLes services d'éducation en ligne et de tutorat intelligent sont utilisés pour fournir des réponses instantanées et une aide à l'apprentissage.
- créateur de contenuCréation de contenu pour accéder à l'information, générer des premières ébauches ou de l'inspiration, et améliorer l'efficacité créative.
- Les passionnés de la communauté Open SourceVous êtes intéressé par les projets open source et vous souhaitez y contribuer ou faire du développement secondaire.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...