일반 소개
PandasAI는 자연어 처리 기술을 통해 데이터 분석 프로세스를 간소화하도록 설계된 Python 기반 오픈 소스 플랫폼입니다. 이를 통해 사용자는 대화형 방식으로 데이터베이스(예: SQL, CSV, 판다, 폴라, mongodb, noSQL 등)와 상호 작용할 수 있습니다. 이 플랫폼은 대규모 언어 모델(예: GPT-3.5/4, Anthropic, VertexAI) 및 검색 증강 생성(RAG) 기술을 활용하여 기술 및 비기술 사용자 모두가 보다 직관적이고 효율적으로 데이터를 분석할 수 있도록 합니다.


기능 목록
- 자연어 쿼리자연어 질문을 통해 데이터 분석 결과에 쉽게 액세스할 수 있습니다.
- 데이터 시각화차트와 그래프를 생성하여 데이터를 시각화합니다.
- 데이터 정리누락된 값 처리 및 데이터 품질 개선.
- 기능 생성새로운 기능을 생성하여 데이터 집합을 개선합니다.
- 여러 데이터 소스 지원CSV, XLSX, PostgreSQL, MySQL, BigQuery 및 기타 여러 데이터 소스에 연결합니다.
- 다중 모델 지원GPT 3.5/4, Anthropic, VertexAI 및 기타 다국어 모델 통합.
도움말 사용
설치 프로세스
- Docker 설치 컴퓨터에 Docker가 설치되어 있는지 확인합니다.
- 클론 창고 : 실행
git clone https://github.com/Sinaptik-AI/pandas-ai
. - 플랫폼 구축 프로젝트 디렉토리로 이동하여
docker-compose build
. - 출시 플랫폼 : 실행
docker-compose up
를 클릭한 다음http://localhost:3000
.
판다AI 라이브러리 사용
- 설치 관리자 ::
- 핍을 사용합니다:
pip install pandasai
- 시를 사용하세요:
poetry add pandasai
- 핍을 사용합니다:
- 라이브러리 가져오기 ::
import os
import pandas as pd
from pandasai import Agent
- 데이터 프레임 만들기 ::
sales_by_country = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
- API 키 구성 ::
os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"
- 상담원 및 쿼리 만들기 ::
agent = Agent(sales_by_country)
response = agent.chat('Which are the top 5 countries by sales?')
print(response)
- 차트 생성 ::
agent.chat("Plot the histogram of countries showing for each one the gd. Use different colors for each bar")
판다AI 플랫폼 사용
- 플랫폼 액세스 시작 후 액세스
http://localhost:3000
. - 데이터 업로드 인터페이스를 통해 CSV 또는 Excel 파일을 업로드합니다.
- 자연어 쿼리 쿼리 상자에 질문(예: "매출 기준 상위 5개 국가는 어디인가요?")을 입력합니다.
- 결과 보기 플랫폼은 적절한 차트를 생성할 수 있는 옵션과 함께 문의 결과를 반환합니다.
PandasAI는 비즈니스 분석, 학술 연구, 개인 프로젝트 등 다양한 데이터 분석 시나리오에 적합합니다. 자연어 처리 기술을 통해 사용자는 복잡한 코드를 작성하지 않고도 데이터에서 가치 있는 정보를 쉽게 얻을 수 있습니다.
© 저작권 정책
文章版权归 AI 공유 서클 所有,未经允许请勿转载。
관련 문서
댓글 없음...