はじめに
Free-Searchは、Hanzla Javaidによって開発され、GitHubでホストされているオープンソースのAPIツールである。主な機能は、カスタム検索エンジンを通してリアルタイムのGoogle検索結果を提供し、ウェブコンテンツをクロールして構造化データを返すことである。このツールは、AIエージェントや大規模言語モデリング(LLM)アプリケーション向けに設計されており、インターネットデータのアクセシビリティを向上させるのに役立つ。ユーザーはコードをダウンロードしてローカルに配置するだけで、無料で使用することができる。このプロジェクトはPythonで開発されており、カスタム検索パラメータをサポートしているため、開発者や技術チームに適している。現在、簡単に体験できるデモ例を公開している。
機能一覧
- Googleのリアルタイム検索に対応し、キーワードを入力すると最新の検索結果が表示されます。
- 検索結果ページを自動的にクロールし、各ページのコアコンテンツを抽出します。
- ソース、リンク、コンテンツスニペットを含む構造化データを返す。
- 表示件数(1~5件)と各コンテンツの長さ(100~5000文字)を調整できます。
- オープンソースのコードで、ユーザーが自由に変更、最適化できる。
- 公開デモ例が提供されており、インストールせずに試すことができる。
ヘルプの使用
Free-Searchは開発者向けのAPIツールであり、インストールと使用には一定の技術的基礎が必要です。ここでは、あなたが始めるための詳細なガイドを提供します。
インストール方法
Free-Searchでは、GitHubからソースコードをダウンロードし、実行環境を設定する必要がある。以下はその手順である:
- クローン倉庫
ブラウザを開き、次のサイトにアクセスする。https://github.com/HanzlaJavaid/Free-Search
緑色のCode
を選択します。Download ZIP
zipアーカイブをダウンロードしてください。または、コマンドラインで入力してください:
git clone https://github.com/HanzlaJavaid/Free-Search.git
ダウンロードが完了したら、プロジェクトフォルダーに移動する。
- 依存関係のインストール
このプロジェクトにはPython 3.7以降といくつかの主要なライブラリーが必要です。コマンドラインから実行してください:
pip install fastapi uvicorn pydantic playwright beautifulsoup4
これにより、FastAPI(APIの構築)、Uvicorn(サーバーの実行)、Pydantic(データの検証)、Playwright(ウェブのクロール)、BeautifulSoup4(HTMLの解析)がインストールされる。
- Playwrightブラウザのインストール
このプロジェクトはPlaywrightのChromiumブラウザに依存しており、以下のコマンドを実行することでインストールされる:
playwright install chromium
インストール後、ツールはウェブページを適切にクロールできるようになる。
- サービス開始
プロジェクトフォルダで実行する:
xvfb-run python main.py
Linuxシステムにグラフィカル・インターフェースがない場合はxvfb-run
が必要である。 python main.py
APIサービスは起動後、ローカルで実行される。起動後、APIサービスはデフォルトのポート11235でローカルに実行される。
主な機能の使い方
Free-Searchの核となるのは検索APIで、HTTPリクエストで検索結果を取得します。その仕組みはこうだ:
- APIエンドポイントへのアクセス
サービスが開始したら、ブラウザかコマンドラインツールを開いてhttp://localhost:11235/search
.キーワードなどの検索パラメータを指定する必要があります。 - 検索リクエストを送信
利用するcurl
またはその他のツールでリクエストを送信します。例
curl "http://localhost:11235/search?query=fastapi+tutorial&max_results=2&max_content=1000"
query
例:"fastapi tutorial"。max_results
デフォルトは3、範囲は1-5。max_content
デフォルトは2000文字、範囲は100-5000。- リターン結果を見る
APIは、例えばJSON形式の構造化データを返す:
[
{
"source": "fastapi官方文档",
"link": "https://fastapi.tiangolo.com/tutorial/",
"context": "FastAPI 是一个现代、快速的 Web 框架..."
},
{
"source": "教程博客",
"link": "https://example.com/fastapi-guide",
"context": "本教程介绍如何使用 FastAPI 构建 API..."
}
]
各結果には、ソース名、リンク、抽出されたコンテンツが含まれます。
注目の機能操作
- リアルタイムGoogle検索
Free-Searchはカスタム検索エンジンを通じてGoogleに接続し、最新の検索結果を取得します。独自のクローラーを開発する必要がなく、キーワードを入力するだけで利用できます。 - コンテンツのクローリングと構造化出力
このツールは自動的に各検索結果ページを訪問し、主要なコンテンツを抽出し、読みやすいフォーマットに整理する。これは特にAIアプリケーションに有用で、処理のためにモデルに直接供給することができる。 - カスタムパラメータ
を調整することができます。max_results
歌で応えるmax_content
これは、返されるデータの量と詳細度を制御します。例えば、より多くの結果を得るには、次のようにします:
curl "http://localhost:11235/search?query=python+学习&max_results=5"
- パブリック・インスタンスの使用
ローカルにインストールしたくない場合は、提供されている公式デモ例を直接見ることができる:https://freesearch.replit.app/
.ブラウザに次のように入力するだけです。https://freesearch.replit.app/search?query=测试
住所、試してみてください。
ほら
- ローカルで実行する場合、ツールがGoogleやその他のウェブページへのアクセスを必要とするため、インターネットが開いていることを確認する。
- Playwrightのエラーが発生した場合は、Chromiumが正しくインストールされているか確認してください。
- このプロジェクトはオープンソースであり、以下のような変更が可能である。
main.py
他の検索エンジンのサポートなどの新機能を追加します。
以上の手順で、Free-Searchを簡単に導入し、リアルタイムの検索データを取得することができます。
アプリケーションシナリオ
- AIエージェント開発
開発者はFree-Searchを使ってリアルタイムのウェブデータを取得し、AIエージェントの知識ベースを訓練したり強化したりすることができます。
シーンの説明例えば、最新の技術ニュースに関する質問に答える必要があるチャットボットを開発している場合、Free-Searchは、ボットが正確な回答をするために関連するウェブコンテンツを提供することができます。
- LLMデータ入力
大規模な言語モデルは多くの外部データのサポートを必要としますが、Free-Searchはデータソースとして使用できます。
シーンの説明機械学習」というキーワードを入力すると、Free-Searchはモデルが処理するための最新論文のリンクと抄録を返す。
- 個別の調査ツール
学生や研究者は、ウェブから素早く情報を収集するために使うことができる。
シーンの説明論文執筆の際には、「気候変動の影響」と入力すれば、複数の情報源からリアルタイムのデータを入手でき、検索時間を短縮できる。
品質保証
- フリーサーチとグーグル検索の違いは?
フリーサーチは、グーグルの検索結果を自動的にクロールし、構造化データを返すAPIツールである。 - パブリック・インスタンスとローカル・デプロイの違いは何ですか?
パブリック・インスタンスはインストールなしで利用できるが、アクセス制限がある場合がある。ローカル・インスタンスは完全に制御可能で、機能をカスタマイズすることもできる。 - 中国語の検索に対応していますか?
はい、中国語のキーワードを入力するだけで、APIが関連する結果を返します。