AIパーソナル・ラーニング
と実践的なガイダンス

Scraperr: セルフホスティングのウェブデータスクレイピングツール

はじめに

Scraperrは、XPath要素を指定してウェブデータをスクレイピングできる、セルフホスティングのウェブデータスクレイピングツールです。Scraperrは、クロールタスクを管理するためのユーザーログインをサポートし、ログ表示と統計情報を提供します。

Scraperr: セルフホスティング・ウェブデータ・スクレイピング・ツール-1


 

機能一覧

  • ウェブクローリングのためにURLを送信し、キューに入れる。
  • XPathによるクロール要素の追加と管理
  • 同じドメイン名のすべてのページをクロールする
  • カスタムJSONヘッダーを追加してリクエストを送信する
  • 取り込んだデータの結果を表示する
  • 結果を含むCSVファイルをダウンロードする
  • キャプチャタスクを再実行する
  • キューに入れられたタスクのステータスの表示
  • ブックマークとブックマークしたタスクの表示
  • タスクを整理するためのユーザーログイン/登録
  • アプリケーションログの表示
  • タスク統計の表示
  • クロール結果を対話の文脈に含めることをサポートするAI統合

 

ヘルプの使用

設置プロセス

  1. クローン倉庫
    git clone https://github.com/jaypyles/scraperr.git
    
  2. 環境変数とタグの設定 docker-compose.yml ファイルで環境変数やラベルを設定することができる:
    スクレーパー
    ラベルに
    - "traefik.enable=true"
    - "traefik.http.routers.scraperr.rule=Host(`localhost`)"
    - "traefik.http.routers.scraperr.entrypoints=web"
    scraperr_api.
    環境
    - log_level=info
    - MONGODB_URI=mongodb://root:example@webscrape-mongo:27017
    - SECRET_KEY=your_secret_key
    - アルゴリズム=hs256
    - access_token_expire_minutes=600
    
  3. サービスを開始する:
    docker-compose up -d
    

使用プロセス

  1. クロール用URLの送信::
    • Scraperrにログイン後、スクレイピングタスクページに移動します。
    • クロールするURLと対応するXPath要素を入力します。
    • タスクを送信すると、システムは自動的にキューに入れ、キャプチャを開始する。
  2. クロール要素の管理::
    • クロールタスクのページでは、XPath要素を追加、編集、削除することができます。
    • 同一ドメイン内の全ページのクロールをサポート。
  3. クロール結果を見る::
    • キャプチャが完了すると、結果が表に表示される。
    • ユーザーは、結果を含むCSVファイルをダウンロードするか、タスクを再実行することを選択できる。
  4. タスク管理::
    • ユーザーは、キューに入れられたタスクのステータスをチェックしたり、ブックマークしたり、ブックマークされたタスクを表示したりすることができます。
    • 実行タスクの統計情報を表示する Task Statistics ビューを提供します。
  5. ログビュー::
    • アプリケーションログ]ページでは、キャプチャタスクに関する詳細情報のシステムログを表示することができます。
  6. AIインテグレーション::
    • クロールの結果を対話の文脈に組み込むためのサポートは、現在以下の通りである。 オーラマ とOpenAI。
AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " Scraperr: セルフホスティングのウェブデータスクレイピングツール

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語