はじめに
openai-captcha-detectionはOpenAIを利用したCAPTCHA認識ツールです。OpenAIのAPIを呼び出すことで、複雑なCAPTCHA画像のテキスト認識を可能にし、開発者のCAPTCHA処理シナリオにおける操作の自動化を支援します。このツールはOCR(光学式文字認識)にGPT-4モデルを使用しており、認識精度は最大100%です。
機能一覧
- OpenAIのGPT-4モデルを使用したOCR(光学文字認識
- 他のプロジェクトに統合するための使いやすいAPIインターフェースを提供する。
- 複数のタイプのCAPTCHA認識をサポートする
- 詳細な使用例とコードの提供
- 環境の準備と依存関係のインストールをサポート
ヘルプの使用
インストールと使用
- プロジェクトをクローンし、検証を実行する
- リポジトリをクローンし、プロジェクト・ディレクトリに移動する:
git clone --depth 1 https://github.com/XiaomingX/openai-captcha-detection cd openai-captcha-detection
- OpenAI API キーを設定します:
export OPENAI_API_KEY=[あなたのAPI_KEY]。
- 必要な依存パッケージをインストールする:
pip install -r requirements.txt
- CAPTCHA認識スクリプトを実行する:
python3 src/gpt4_ocr_demo.py
- リポジトリをクローンし、プロジェクト・ディレクトリに移動する:
- 他のプロジェクトとの統合
- openai-captcha-detectionを自分のプロジェクトに組み込んでCAPTCHAを認識させることができます。使い方の例を示します:
from gpt4_ocr_demo import OCRClient def recognise_captcha(image_path):: # OCRClient インスタンスを作成します。 # OCRClientインスタンスを作成します。 ocr_client = OCRClient() #画像をbase64形式にエンコードする encoded_image = ocr_client.encode_image_to_base64(image_path) # 認識のためにGPT-4 OCR関数を呼び出す captcha_text = ocr_client.invoke_gpt4_ocr(encoded_image) return captcha_text if __name__ == "__main__". image_path = "226md.png" recognized_text = recognise_captcha(image_path) print("認識されたキャプチャは:", recognised_text)
- openai-captcha-detectionを自分のプロジェクトに組み込んでCAPTCHAを認識させることができます。使い方の例を示します:
ほら
- OpenAI APIを使用する際は、有効なAPIキーを持っていることを確認し、制限を超えないように使用頻度に注意してください。
- 認識効果は CAPTCHA の複雑さと GPT-4 モデルの能力に依存し、複雑な CAPTCHA の中には正しく認識されないものもある。
将来計画
- 複雑なCAPTCHAタイプの認識精度を向上。
- 多様なCAPTCHAタイプに対応するため、APIサポートを追加しました。
- ユーザーが直接使用できる、より便利なコマンドラインインターフェイスを提供する。