Un examen côte à côte des principaux outils de recherche approfondie en IA du marché : DeepSeek R1 surpasse les autres

Nouvelles de l'IAPosté il y a 6 mois Cercle de partage de l'IA

9.2K 00

Déclaration : Cet examen est non officiel, subjectif et les résultats ne sont donnés qu'à titre de référence.

Résumé du contenu

Résumé : DeepSeek L'outil officiel de recherche en réseau DeepSeek R1+ se distingue par sa simplicité et sa facilité d'utilisation parmi les nombreux outils de recherche approfondie par IA.

Si les utilisateurs attendent des réponses détaillées, les moteurs de recherche traditionnels tels que Google restent un choix solide, éprouvé par le marché et offrant une expérience de recherche supérieure.
Flowith Le schéma Oracle fonctionne étonnamment bien, de la même manière que le schéma ChatGPT O1 présente des similitudes. Cependant, grâce à l'optimisation du moteur de recherche, Flowith est en mesure de prendre en compte les sources d'information nationales et étrangères.
Les performances de ChatGPT's Deep Search dans cette évaluation sont médiocres, ce qui ne correspond pas aux éloges de nombreuses célébrités étrangères. Cela peut être dû au fait que sa capacité à traiter le contenu chinois a encore besoin d'être améliorée. Compte tenu du coût élevé de la recherche, cette évaluation n'est qu'une tentative ponctuelle.

Résultats subjectifs de la notation

numéro de série	Nom de l'outil	précision	profondeur	(d'un discours, etc.) profondeur	longueurs	interactome	les produits dérivés	Score total (sur 60)
1	Gémeaux 2.0 Flash Thinking	8	8	9	13	8	8	54
2	sac à dos	8	7	6	10	9	10	50
3	Flowith Oracle Mode	8	9	8	12	7	6	50
4	ChatGPT 01 Recherche approfondie	8	8	9	9	8	7	49
5	Version officielle de DeepSeek	9	8	9	7	8	7	48
6	Genspark	6	7	6	11	7	8	45
7	perplexité	7	6	6	8	7	9	43
8	Nano Recherche	7	7	7	6	6	6	39
9	Assistant AI HeartStream	7	8	6	3	7	7	38
10	Kimi 1.5 Long	7	6	7	4	7	6	37
11	Recherche de la tour secrète	6	7	5	2	7	8	35
12	Tencent Yuanbao (développeurs de la plateforme de messagerie instantanée QQ)ima.copolit	4	6	3	5	5	8	33
13	Tempête	2	3	2	1	2	2	12

Cet examen est quelque peu subjectif. Néanmoins, les évaluateurs ont établi les critères de jugement suivants afin d'évaluer les performances de chaque outil de recherche approfondie par IA sous plusieurs angles.

Critères d'évaluation

[Précision]L'évaluation a été menée par une équipe de 12 outils (10 au début de l'évaluation) afin de déterminer si les outils pouvaient identifier et répertorier avec précision 10 outils d'IA. Si l'outil ne parvient pas à reconnaître le mot-clé "AI Deep Search", il se verra attribuer la note la plus basse. Si la source d'information n'est pas fournie, 5 points seront déduits par défaut.
[Largeur]L'évaluation de la capacité de l'outil à couvrir entièrement le contenu demandé par l'évaluateur, y compris les informations clés telles que les descriptions de produits, les trajectoires technologiques, etc.
[Profondeur]Les évaluations approfondies sont quelque peu subjectives et seront notées par l'évaluateur sur la base de sa compréhension personnelle ; il peut y avoir un certain degré de biais de perception personnelle dans cette notation.
[Longueur]La mesure principale est le nombre de mots dans le texte généré par l'outil.
[Interaction]Les outils interactifs : évaluer l'expérience interactive de l'outil, par exemple s'il permet des questions de suivi, des informations sur les prix, des seuils d'utilisation, etc.
[Exporter]Évaluer les capacités d'exportation de données de l'outil. Les outils qui ne permettent d'exporter que des liens ou des images seront considérés comme ayant des capacités d'exportation insuffisantes. Idéalement, l'outil devrait au moins permettre la copie en texte intégral et l'exportation de documents PDF.

L'évolution des mots clés

Repères initiaux

最近 AI 搜索很火，我想你围绕 Deep Search
以及他的开源版本还有各种 AI 搜索，整理出一篇详尽的报告，
至少包括产品名称、原理、技术路径

Mots clés optimisés

Afin d'obtenir un rapport plus structuré et plus complet, le réviseur s'est appuyé sur les documents suivants fournis par Flowith Claude La fonction d'optimisation du mot-clé optimise le mot-clé initial de la manière suivante :

<研究主题>
AI搜索技术（重点分析Deep Search及其开源版本）
</研究主题>
<报告结构说明>
你将创建一份关于特定AI技术主题的深度分析报告。请按以下结构组织内容：
概述（2-3段）
技术/主题的整体介绍
核心发现与重要性
现状与未来影响
背景分析
技术发展背景与行业现状
该技术的战略价值
本报告的覆盖范围
技术解析
核心技术原理
关键技术组件
实现路径与方法论
架构细节（如可获得）
市场分析
主要产品与实现方案
核心厂商技术路线
解决方案对比
开源替代方案
未来展望
潜在发展方向
现存挑战与限制
未来研究重点
<格式要求>
使用Markdown标题（# 主标题，## 子标题）
保持专业书面语气
技术主张需附具体解释
不同方案需对比分析
公开信息缺失处需注明
不确定的技术细节需明确标注
聚焦事实性信息，避免推测
使用规范技术术语但保持可读性
<注意事项>
确保分析深度与完整性
保持客观中立立场
提供可验证的技术细节
明确区分事实与推测
包含实际案例与产品
注明当前认知局限
请将完整报告置于<report>标签内，特别注意：
对Deep Search技术架构进行重点剖析
列举不少于5个同类AI搜索产品
开源项目需标注许可证类型
技术路径需包含检索增强生成(RAG)等关键技术
需包含向量数据库等基础设施支持分析

Lors de l'utilisation de la recherche approfondie de ChatGPT, l'outil a demandé à l'évaluateur de répondre à quelques questions pour clarifier l'orientation de la recherche, et l'évaluateur a ajouté des précisions aux messages-guides. Cependant, comme les questions supplémentaires étaient longues et contenaient des liens, elles ne sont pas répétées ici.

Résultats de l'évaluation par plate-forme

1. petits pains aux haricots

Nombre total de mots : 2918 mots

Beanbag excelle dans l'ingénierie et la performance globale est presque parfaite, à l'exception du contenu lié à la recherche nano.

Le document exporté est accompagné d'un catalogue, et l'expérience globale est fluide et confortable, avec un degré élevé d'achèvement du produit, en accord avec la richesse de sa gamme de produits d'application.

Le défaut de Beanbag est qu'il ne possède pas encore ses propres modèles à grande échelle qui présentent des avantages significatifs au niveau de l'intelligence. Par conséquent, son contenu présente un problème de manque de profondeur, avec une forme originale de présentation du contenu, mais la profondeur du contenu doit être améliorée.

2. la nanoscience

Nombre total de mots : 1606 mots

Nano Search de 360 est un produit à fonctionnalités intégrées. À première vue, les modules fonctionnels sont plus complets et s'accompagnent d'un système de gestion de l'information. DeepSeek R1 Technologie. L'article donne un bon aperçu de l'OpenAI au début de l'article, mais en ce qui concerne la présentation des produits de recherche approfondie par IA, le contenu n'est pas assez complet et la durée est courte. En revanche, NanoSearch présente les caractéristiques de chaque produit de manière plus détaillée et les résume de manière satisfaisante. En outre, NanoSearch propose certains produits de recherche qui ne font pas partie du champ de connaissances de l'évaluateur, ce qui peut être instructif, même s'il ne s'agit pas de produits d'IA à proprement parler.

Cependant, la recherche nano ne prend pas en charge la fonction de suivi, la fonction de partage ne prend en charge que les liens et les images (sans texte intégral), et la tendance à la commercialisation est évidente.

3. ima.copliot (Tencent Yuanbao)

Nombre total de mots : 1417 mots

Tencent avait déjà lancé un outil combinant des fonctions de recherche et de base de connaissances. À l'époque, l'outil était équipé d'un modèle hybride à l'intelligence moyenne, mais ses sources d'information étaient de grande qualité et provenaient principalement de la plateforme publique. Aujourd'hui, avec l'ajout de la fonction de recherche approfondie DeepSeek R1, la qualité de son contenu a été considérablement améliorée.

Le principal avantage d'ima.copliot est que les utilisateurs peuvent facilement ajouter le contenu des numéros publics recherchés à leur base de connaissances personnelle et mener des questions-réponses à partir de la base de connaissances, ce qui est une fonction très pratique. La plateforme de numéros publics constitue l'avantage unique d'ima.copliot en termes de ressources. Lorsque les utilisateurs utilisent d'autres produits similaires, ils doivent souvent cliquer manuellement sur le lien du numéro public pour sauter et enregistrer le contenu.

Cependant, par rapport aux informations des réseaux ouverts, il y a un certain décalage dans l'actualité des informations sur les numéros publics. En même temps, en raison du mécanisme d'audit strict de la plate-forme de numéros publics, la circulation de certains éléments émergents, en particulier les liens externes, est restreinte, ce qui entraîne parfois des résultats de recherche biaisés. Lors de la recherche d'informations en dehors de la plate-forme de numéros publics, les performances d'ima.copliot sont relativement médiocres.

Par conséquent, les performances d'ima.copliot ont été légèrement inférieures aux attentes dans le cadre de cet examen, et ses résultats de recherche étaient mal corrélés avec le thème de l'examen. En particulier, sous le thème "AI Deep Search", la plupart des informations fournies par ima.copliot sont encore au niveau de l'architecture de recherche traditionnelle.

ima.copliot reste un outil précieux pour des domaines spécifiques. Toutefois, il pourrait être nécessaire d'adopter une stratégie de développement plus agressive et plus différenciée lorsqu'il s'agit de cibler le domaine public au sens large.

En outre, ima.copliot ne supporte que l'exportation par copier-coller.

4. l'assistant AI de Heartstream

Nombre total de mots : 1399 mots

il est dit Assistant AI Heartstream Originaire d'Alibaba. Le produit est plus riche en fonctionnalités.

Par exemple, l'assistant Mindstream AI fournit des cartes heuristiques au début des rapports et peut générer des podcasts de type NotebookLLM de conversations entre hommes et femmes, ce qui est idéal pour produire du contenu de podcast AI.

Le nombre de produits d'IA répertoriés dans les résultats de la recherche est faible, mais la précision des noms de produits est élevée. Les comparaisons figurant dans le tableau ne sont pas tout à fait exactes, mais elles se comparent favorablement à d'autres outils d'évaluation.

Bien que le nombre de mots dans le texte soit faible, le contenu généré par l'assistant AI de HeartStream est plus varié, incluant des tableaux, des images et d'autres éléments, ce qui rend le contenu plus riche. Toutefois, certaines images n'ont qu'un faible rapport avec le thème, et ce dernier n'est pas suffisamment clair.

Le processus de réflexion de l'assistant AI HeartStream est bien présenté et les sources d'information sont bien identifiées.

Son principal problème est que la fonction de partage et d'exportation n'est pas assez pratique et que le contenu graphique est mal formaté après la copie.

5. ChatGPT Recherche approfondie

Nombre total de mots : 2865 mots

En tant que moteur de recherche officiel d'OpenAI, ChatGPT Deep Search a des performances légèrement inférieures aux attentes dans cette étude, avec un rendement relativement faible, ce qui n'est pas conforme à son abonnement mensuel de 200 $.

Après avoir parlé avec un ami qui a participé à l'examen, l'analyse suggère qu'il pourrait y avoir deux raisons à cela :

Le fait d'imposer trop de restrictions conditionnelles au macromodèle d'inférence peut au contraire limiter ses performances, et les mots repères peuvent être sous-optimisés.
Le modèle GPT ne dispose pas d'un avantage initial dans le traitement des informations en chinois, de sorte qu'il faudrait peut-être essayer de faire une recherche en anglais et de répondre en chinois.

Néanmoins, ChatGPT Deep Search a ses mérites :

Pendant la session de questions, ChatGPT Deep Search posera d'abord à l'utilisateur un certain nombre de questions en retour pour guider l'utilisateur уточнить dans la direction de la recherche. Cela permet d'éviter le gaspillage de ressources ou les erreurs d'orientation. Par exemple, les invites initiales de l'évaluateur étaient plus succinctes, et après les conseils rhétoriques de ChatGPT Deep Search, l'évaluateur a affiné les invites. Ces deux parties des invites ont été combinées et fournies en tant que nouvelles invites standard pour tous les outils de recherche approfondie en IA participants. Parmi eux, les évaluateurs ont été impressionnés par les questions rhétoriques de ChatGPT Deep Search, qui sont de haute qualité et peuvent être utilisées comme référence de processus standard pour les futurs projets de recherche d'IA.

Le résultat de ChatGPT Deep Search ressemble davantage à un article complet avec une logique plus cohérente. La capacité à générer des textes longs et une forte capacité de raisonnement constituent des obstacles techniques importants. À l'heure actuelle, de nombreux outils de recherche ont accédé à DeepSeek R1 pour améliorer la capacité de réflexion approfondie, mais en raison de la fenêtre contextuelle limitée de DeepSeek R1 (32K), ces outils en termes de génération de contenu, en fait, c'est plus comme remplir le contenu sur la base de l'aperçu. Bien qu'il n'y ait rien de mal à cette approche, l'expérience de l'utilisateur serait certainement meilleure s'il pouvait générer des articles longs et cohérents comme ChatGPT Deep Search.

6. version officielle de DeepSeek

Nombre total de mots : 1625 mots

La combinaison de DeepSeek, pensée profonde + recherche sur Internet, a donné de bons résultats, notamment en termes de correspondance des ressources, et a permis de rechercher des logiciels plus spécialisés et émergents. Cependant, en raison de la longueur du contexte, la version officielle de DeepSeek n'a pas pu présenter tous les produits dans l'étude, bien que sa présentation des caractéristiques des produits ait été pertinente et ait essentiellement répondu aux attentes de l'auteur de l'étude.

Compte tenu de la stabilité croissante du service officiel DeepSeek, l'auteur de l'article estime que DeepSeek-R1 + la recherche en réseau est désormais idéale pour l'utilisateur moyen qui souhaite obtenir des réponses de qualité relativement élevée à un prix modique.

Toutefois, le problème de l'"illusion" subsiste dans la version officielle de DeepSeek. Si la version officielle peut renforcer l'annotation de la source d'information et élargir la fenêtre contextuelle, l'expérience de l'utilisateur devrait être encore améliorée. Bien entendu, la vitesse de réponse doit également être continuellement optimisée.

7. Le modèle Oracle de Flowith.ai

Nombre total de mots : 5369 mots

Flowith.ai est un service de base de connaissances de type tableau blanc. Sa première publicité se concentre sur le modèle Oracle, où le problème de l'utilisateur est décomposé en sous-problèmes et en étapes par l'intelligence de l'agent, et l'utilisateur peut modifier et confirmer les résultats, après quoi l'agent les recherche et les organise.

Les résultats de l'étude montrent que Flowith effectue une recherche plus approfondie lors de la deuxième étape. Le modèle utilisé par Flowith lors de cette étape n'est pas clair, mais on suppose qu'il s'agit probablement du modèle Gemini, qui est plus apte à la contextualisation, et Flowith est le seul outil de la revue capable de fournir une liste complète des 10 outils d'IA demandés par l'auteur de la revue, ce qui mérite d'être souligné. En outre, le mécanisme de questionnement rhétorique de Flowith dans la phase initiale est similaire à la façon dont OpenAI Deep Search interagit.

Cependant, Flowith ne permet pas beaucoup d'ajustements et de contrôles manuels au cours du processus de recherche. En fait, aucun des outils participants n'avait beaucoup de contrôle sur le processus de recherche, mais la visualisation du processus de recherche par Flowith crée l'"illusion" d'une implication profonde.

En outre, les performances de Flowith dans OpenAI Deep Search ne sont pas suffisamment précises, car les résultats sont plus susceptibles d'être basés sur un seul mot-clé que sur la pertinence d'OpenAI. Cela est regrettable et reflète l'importance du modèle d'inférence O3 de l'OpenAI pour les textes longs.

Nous espérons que Flowith aura accès aux API de Claude 4.0, O3, ou de DeepSeek R2 à l'avenir, afin d'optimiser continuellement les capacités d'ingénierie et d'apporter plus d'imagination aux utilisateurs.

8) Genspark

Nombre total de mots : 3406 mots

Genspark avait été remarqué pour son modèle de recherche AI Agent + et pour la présentation des résultats de recherche sous forme de notes illustrées similaires au Petit Livre Rouge. Toutefois, à l'époque, en raison du manque de capacité du modèle, la qualité du contenu des résultats était médiocre, de même que la rapidité d'exécution. Près d'un an plus tard, Genspark a récemment lancé sa propre fonction de recherche approfondie.

Les produits de Genspark ont toujours été caractérisés par leur sophistication et leur facilité d'utilisation. Les produits de Genspark ont toujours été caractérisés par leur maturité et leur facilité d'utilisation. Par exemple, ils prennent plus de temps à réfléchir, récupèrent une plus grande quantité d'informations, et supportent la notification par e-mail de l'achèvement du rapport, tandis que l'introduction par Genspark de la version O3 de Deep Search est plus pointue. Toutefois, dans l'ensemble, Genspark en est encore au stade exploratoire, le contenu qu'il présente comporte davantage d'informations redondantes et les informations nécessaires à la présentation du produit sont absentes, ce qui peut être lié au manque de ressources d'information en Chine.

Il est intéressant de noter que Genspark est le seul outil de cette revue à fournir des liens vidéo et des aperçus de couvertures. Bien que ses liens vidéo YouTube ne prennent pas en charge le clic direct pour la lecture, les utilisateurs doivent toujours les ouvrir via un lien externe.

Genspark ne permet pas d'exporter ou de copier directement des fichiers, mais seulement de partager des résultats sous forme de liens vers les pages du site Web de Genspark.

9) Kimi

Nombre total de mots : 1400 mots

Il existe un phénomène intéressant avec Kimi. Lorsque l'examinateur a choisi une autre voie, Kimi a continué à afficher les résultats en anglais, et l'examinateur a dû souligner l'utilisation du chinois dans ses réponses par la suite.

La qualité du rapport de Kimi était moyenne, Kimi ayant identifié avec précision 5 des 10 outils d'IA, et les produits étaient soigneusement répertoriés. L'introduction à la recherche en profondeur était également bien présentée. Toutefois, Kimi a omis un grand nombre des produits mentionnés par l'évaluateur (même si ce dernier a fourni des liens vers ces produits).

En outre, Kimi ne permet pas l'exportation directe vers des documents.

Dès le début, les évaluateurs ont été impressionnés par les capacités de Kimi à générer des textes longs. Bien que le niveau d'intelligence de Kimi ait été faible à l'époque, sa capacité à générer de très longs textes était toujours attrayante. Aujourd'hui, l'intelligence de Kimi a été considérablement améliorée et élargie pour inclure des fonctionnalités multimodales. Nous attendons avec impatience de nouvelles percées dans l'intelligence de Kimi.

10. tempête

Nombre total de mots : 733 mots

L'architecture Storm est née à l'université de Stanford et est disponible depuis un certain temps. Récemment, Storm semble avoir fait l'objet de quelques optimisations, mais ses capacités sont nettement en retard. Premièrement, le nombre de mots des résultats de Storm est trop faible et deuxièmement, les descriptions des composants sont plutôt générales et manquent de détails.

Peut-être en raison de son interface publique gratuite et de ses limites d'utilisation, la stratégie de développement de Storm n'est pas aussi agressive que celle des autres outils participants.

Dans l'ensemble, la performance de Storm a été décevante.

Il convient de noter que l'utilisateur doit d'abord saisir un sujet de 20 mots maximum, puis décrire l'objectif.

11. recherche de tours secrètes

Nombre total de mots : 1259 mots

Si l'on inclut les liens, le nombre de mots du rapport de recherche sur les tours secrètes avoisine les 10 000 mots, mais ce n'est pas juste.

Secreta Search a obtenu d'assez bons résultats, notamment en termes de nombre de pages vues. Secret Tower AI Search Premier à prendre en charge la navigation sur un grand nombre de pages web, Secreta Search a parcouru 374 pages web dans le cadre de cet examen.

Secret Tower Search identifie quelques produits de niche, mais le nombre de produits est encore faible.

Il est amusant de constater qu'un code QR pour un groupe WeChat apparaît au début de l'article.

Cependant, en général, la profondeur des articles dans Secreta Search est encore insuffisante, et un grand nombre de pages web ne sont pas lues pour obtenir les résultats escomptés, ce qui est un peu gênant.

12. les Gémeaux

Nombre total de mots : 8690 mots

Google est un acteur majeur de la recherche (sans parler de Baidu, bien sûr).

Dans l'ensemble, les réponses de Google Gemini étaient de grande qualité, mais en ce qui concerne l'identification de 10 outils d'IA, Gemini n'en a trouvé que 6. Bien que supérieur à la moyenne, Gemini aurait pu faire mieux.

Les nouveaux modèles de Google sont puissants, par exemple :

Modèle multimodal prenant en charge des millions de contextes et produisant bien plus de contenu que tout autre modèle (à l'exception de ChatGPT O1, O3).
Prise en charge de YouTube et d'autres recherches liées à l'écosystème Google.
Temps de réponse rapide.

Mais Gemini commet également deux erreurs flagrantes dans cet examen :

Parfois insuffisant L'édition d'un contenu formaté, par exemple l'édition d'un texte en code comme le montre la capture d'écran, entraîne une confusion dans le formatage.
Les liens externes et les liens de référence YouTube ne sont pas affichés.

Un détail intéressant est que l'utilisateur peut cliquer sur le bouton "trois points" pour que l'IA revérifie la réponse. Dans la pratique, toutefois, cette fonction n'est pas très efficace.

13. perplexité

Nombre total de mots : 1931 mots

Le contenu exporté par Perplexity est formaté de la manière la plus confortable, en intégrant les liens dans le texte et en ne les affichant pas à l'extérieur. Ceci est probablement dû à l'excellente optimisation Markdown de Perplexity.

Perplexity obtient des résultats raisonnables pour les produits largement connus, mais pour les produits de niche, Perplexity a une faible couverture et ignore largement les sources nationales.

résumés

L'avènement de DeepSeek R1 a permis aux fournisseurs de créer rapidement des services de recherche approfondie en IA qui fonctionnent bien en surface. Les plateformes fournissent la fonction de recherche et DeepSeek la capacité de réflexion approfondie. Cependant, un travail d'ingénierie important est encore nécessaire pour combiner efficacement les deux. Si vous ne voulez pas consacrer trop d'efforts au développement, vous devez vous appuyer sur de solides capacités de modélisation pour piloter le service de recherche.

DeepSeek ne garantit pas l'exactitude absolue du contenu, mais peut le faire paraître plus crédible.

À partir du 16 février 2024, et même dans les mois à venir, il ne sera toujours pas facile d'accéder rapidement à l'information et de l'organiser sur le web, et cela nécessitera un investissement important et soutenu en termes de ressources et de savoir-faire technique.

À l'avenir, si DeepSeek R2 peut créer des millions de fenêtres contextuelles, prendre en charge les entrées multimodales et améliorer encore la réactivité, sa compétitivité sur le marché sera incommensurable.