はじめに
DevDocsは、CyberAGIチームによって開発され、GitHubでホストされている完全に無料のオープンソースツールです。プログラマーやソフトウェア開発者向けに設計されており、技術文書のURLから始まり、関連するページを自動的にクロールし、簡潔なMarkdownまたはJSONファイルに整理します。組み込みの エムシーピー サーバーの使用をサポートしている。 クロード DevDocsの目標は、ドキュメントの調査にかかる数週間を数時間に短縮し、開発者が新しいテクノロジーに素早く対応できるようにすることだ。個人開発者、チーム、企業ユーザーに適しており、現在のところ利用料は無料なので、誰でもダウンロードして使うことができる。
機能一覧
- インテリジェント・ドキュメント・クローリングURLを入力すると、関連するページを自動的にクロール。
- 複数のフォーマットに整理するキャプチャしたコンテンツをMarkdownまたはJSONファイルに変換し、読みやすく、さらに処理しやすくします。
- MCPサーバーの統合クロードのような大きなモデルと連携し、ドキュメントをインテリジェントにクエリするMCPサーバーを内蔵。
- 自動リンク発見コンテンツの整合性を確保するために、ページ内のサブリンクを特定し、分類する。
- 並列処理アクセラレーション複数のページを複数のスレッドでクロールし、効率を上げる。
- 選択的クローリングユーザーは、無関係な情報を避けるために、何を抽出するかを指定することができます。
- エラー回復メカニズムクロール失敗時に自動的に再試行し、安定性を確保します。
- 完全なロギングトラブルシューティングを容易にするため、操作の全ステップを記録します。
ヘルプの使用
設置プロセス
DevDocsはDockerで動作し、インストールも簡単だ。詳しい手順は以下の通り:
- 環境を整える
- GitとDockerをインストールする必要がある:
- Git: git-scm.comからダウンロードしてインストールする。
- Docker: docker.comからDocker Desktopをダウンロードしてインストールする。
- Dockerが正しく起動しているか確認するには、ターミナルで次のように入力する。
docker --version
バージョン番号が表示されれば成功です。
- GitとDockerをインストールする必要がある:
- クローンコード
- ターミナル(Windowsの場合はCMDまたはPowerShell、Mac/Linuxの場合はターミナル)を開く。
- DevDocsをダウンロードするコマンドを入力してください:
git clone https://github.com/cyberagiinc/DevDocs.git
- プロジェクト・カタログにアクセスする:
cd DevDocs
- サービス開始
- オペレーティング・システムに従ってスタートアップ・スクリプトを実行する:
- Mac/Linux:
./docker-start.sh
- ウィンドウズ
docker-start.bat
- Mac/Linux:
- Windowsユーザーは、パーミッションに問題がある場合、フォルダーのパーミッションを手動で設定することができる:
icacls logs /grant Everyone:F /T icacls storage /grant Everyone:F /T icacls crawl_results /grant Everyone:F /T
- 開始後、数秒待つと、ターミナルにサービスが正常に実行されていることが表示される。
- オペレーティング・システムに従ってスタートアップ・スクリプトを実行する:
- アクセスツール
- ブラウザを開き、次のように入力する。
http://localhost:3001
をクリックして、DevDocsフロントエンド・インターフェースにアクセスしてください。 - その他のサービス住所
- バックエンドAPI:
http://localhost:24125
- クロール4AI 服务:
http://localhost:11235
- バックエンドAPI:
- ブラウザを開き、次のように入力する。
主な機能
1.技術文書をクロールする
- 動く::
- インターフェイスの入力ボックスにターゲットURLを貼り付ける。
https://docs.example.com
. - クロールの深さを選択する(1~5層、デフォルトは5)。
- クロール開始」をクリックする。
- 完了を待つと、インターフェイスにクロールされたページのリストが表示されます。
- インターフェイスの入力ボックスにターゲットURLを貼り付ける。
- 銘記する::
- クロールは高速で、毎分最大1000ページを処理する。
- 結果は
<项目目录>/crawl_results
フォルダー
- 高度なオプション::
- オプションでクロールが可能で、必要なものを刻んでいく。
2.文書の内容を整理する
- リグ::
- クロール後、コンテンツは自動的にMarkdownまたはJSONファイルに整理される。
- ある
<项目目录>/crawl_results
ビューのデフォルトはMarkdown形式です。
- トグル形式::
- 大規模なモデルの微調整のために、インターフェースの設定で「JSONにエクスポート」を選択します。
3.MCPサーバーと大型モデルの使用
- 意図する::
- クロードデスクトップアプリ(anthropic.com)をダウンロードしてインストールする。
- DevDocsのMCPサーバーはデフォルトでローカルに実行され、追加の設定は必要ない。
- 動く::
- クロードアプリを開く。
- この文書には何が書かれているか」などの質問を入力する。
- クロードはMCPサーバーからデータを読み込んで答える。
- 延長使用::
- ローカルドキュメントを
<项目目录>/storage
クロードは直接アクセスできる。 - この技術はどのように導入されているのか」といった複雑な質問をサポートする。
- ローカルドキュメントを
4.ロギングとモニタリング
- ログを見る::
- ログファイルは
<项目目录>/logs
含まれている:frontend.log
フロントエンドのログ。backend.log
バックエンドのログ。mcp.log
MCPサーバーのログ。
- Dockerでライブログを見る:
docker logs -f devdocs-backend
- ログファイルは
- サービスの中止::
- 端末で
Ctrl+C
すべてのサービスを停止する。
- 端末で
5.実践スクリプト
- このプロジェクトでは、以下のような様々なスクリプトを提供している。
<项目目录>/scripts
::check_mcp_health.sh
MCPサーバーの状態を確認する。debug_crawl4ai.sh
クローリングサービスのデバッグview_result.sh
クロール結果を見る
- 走行モード::
- ターミナルでスクリプト・ディレクトリに移動し、次のようにタイプする。
./脚本名
実施する。
- ターミナルでスクリプト・ディレクトリに移動し、次のようにタイプする。
運営プロセスの概要
- DockerとGitをインストールし、コードをダウンロードする。
- スタートアップスクリプトを実行し、インターフェイスにアクセスする。
- URLを入力し、文書をクロールして整理する。
- クロードでコンテンツを照会し、効率化を図る。
アプリケーションシナリオ
- 新技術の迅速な習得
技術文書のURLを入力すると、DevDocsがすべてのページをクロールして整理します。直接読むこともできますし、Claude を使って特定の用途について質問することもできます。 - チームワーク
社内文書をクロールし、Markdownファイルを生成。チームメンバーがMCPサーバーを介してクエリを実行し、ナレッジを迅速に共有。 - 大規模モデル・アプリケーションの開発
DevDocsで技術データを収集し、JSONファイルを出力。MCPサーバーとビッグモデルの組み合わせでAIアプリケーション開発を加速。 - 個別プロジェクト開発
インディーズ開発者は、DevDocsでドキュメントをクロールし、VSCodeとClaudeで作業し、数日で製品をプロトタイプ化する。
品質保証
- DevDocsは有料ですか?
無料。オープンソースのツールで、無料で使用でき、将来のAPI機能も計画されている。 - プログラミングの経験が必要ですか?
必要ない。インストールは数行のコマンドと、それに続くインターフェイスで行われる。 - クロールに失敗したら?
ネットワークを確認するか<项目目录>/logs
ログ一般的な問題はパーミッションが不十分なことで、インストール手順に従ってパーミッションを調整してください。 - プライベート・サイトのサポート?
ウェブサイトがアクセス可能である限り、サポートする。内部ウェブサイトはネットワーク接続性を確保する必要がある。 - FireCrawlとの違いは?
DevDocsは無料で、クロール速度が速く(1000ページ/分)、5段階の深さとMCPサーバーをサポートしている。