일반 소개
openai-captcha-detection은 OpenAI를 이용한 캡차 인식 도구입니다. 이 프로젝트는 OpenAI의 API를 호출하여 복잡한 캡차 이미지의 텍스트 인식을 가능하게 함으로써 개발자가 캡차 처리 시나리오에서 작업을 자동화할 수 있도록 지원합니다. 이 도구는 OCR(광학 문자 인식)을 위해 GPT-4 모델을 사용하며, 인식 정확도는 최대 100%입니다.
기능 목록
- OpenAI의 GPT-4 모델을 사용한 OCR(광학 문자 인식)
- 다른 프로젝트에 통합할 수 있도록 사용하기 쉬운 API 인터페이스를 제공합니다.
- 여러 유형의 캡차 인식 지원
- 자세한 사용 예제 및 코드 제공
- 환경 준비 및 종속성 설치 지원
도움말 사용
설치 및 사용
- 프로젝트를 복제하고 유효성 검사를 실행합니다.
- 리포지토리를 복제하고 프로젝트 디렉토리로 이동합니다:
git clone --depth 1 https://github.com/XiaomingX/openai-captcha-detection cd openai-captcha-detection
- OpenAI API 키를 설정합니다:
export OPENAI_API_KEY=[你的API_KEY]
- 필요한 종속성 패키지를 설치합니다:
pip install -r requirements.txt
- 캡차 인식 스크립트를 실행합니다:
python3 src/gpt4_ocr_demo.py
- 리포지토리를 복제하고 프로젝트 디렉토리로 이동합니다:
- 다른 프로젝트와 통합
- 자체 프로젝트에 openai-captcha-detection을 통합하여 캡차 인식을 수행할 수 있습니다. 다음은 사용 방법의 예시입니다:
from gpt4_ocr_demo import OCRClient def recognize_captcha(image_path): # 创建 OCRClient 实例 ocr_client = OCRClient() # 将图片编码为 base64 格式 encoded_image = ocr_client.encode_image_to_base64(image_path) # 调用 GPT-4 OCR 函数进行识别 captcha_text = ocr_client.invoke_gpt4_ocr(encoded_image) return captcha_text if __name__ == "__main__": image_path = "226md.png" recognized_text = recognize_captcha(image_path) print("识别出的验证码是:", recognized_text)
- 자체 프로젝트에 openai-captcha-detection을 통합하여 캡차 인식을 수행할 수 있습니다. 다음은 사용 방법의 예시입니다:
주의
- OpenAI API를 사용할 때 유효한 API 키가 있는지 확인하고 할당량을 초과하지 않도록 사용 빈도에 주의하세요.
- 인식 효과는 캡차 복잡도와 GPT-4 모델의 기능에 따라 달라지며, 일부 복잡한 캡차는 잘못 인식될 수 있습니다.
향후 계획
- 복잡한 캡차 유형에 대한 인식 정확도를 개선하세요.
- 다양한 캡차 유형을 더 잘 수용하기 위해 더 많은 API 지원을 추가합니다.
- 사용자가 직접 사용할 수 있는 보다 편리한 명령줄 인터페이스를 제공합니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...