AI个人学习
和实操指南
讯飞绘镜

AiPy:自动化运行Python代码完成数据分析任务

综合介绍

AiPy 是一个开源的 Python 命令行工具,由 Knownsec 团队开发。它结合大语言模型(LLM)和 Python 运行环境,让用户通过自然语言描述任务,自动生成并运行 Python 代码。AiPy 适合数据工程师、程序员和需要快速处理数据的用户。它支持 CSV、Excel、JSON 等多种格式,覆盖数据清洗、分析、可视化等功能。用户既可以用自然语言输入需求,也能直接运行 Python 代码,两种模式数据共享,操作简单。AiPy 的核心是降低编程门槛,让用户专注任务本身。

AiPy:自动化运行Python代码完成目标任务-1


 

功能列表

  • 自然语言生成代码:用户描述任务,AiPy 自动生成并运行 Python 代码。
  • 数据格式支持:处理 CSV、Excel、JSON、SQLite、Parquet 等格式。
  • 数据处理:支持清洗、转换、计算、聚合、排序、分组和过滤。
  • 数据可视化:生成柱状图、饼图等图表。
  • Python 命令行模式:直接输入并运行 Python 代码。
  • 第三方库管理:自动提示安装所需库,如 pandas 或 psutil
  • 代码纠错:通过抽象语法树(AST)检测并修复代码错误。
  • API 调用:支持互联网 API(如天气、地图)和本地私有 API。
  • 模式切换:任务模式(自然语言)和 Python 模式(代码输入)自由切换。
  • 本地部署:支持本地数据处理,保护隐私安全。

 

使用帮助

安装流程

AiPy 支持 Windows、macOS 和 Linux,推荐使用 Python 3.9 或以上版本。以下是安装步骤:

  1. 检查 Python 版本
    确保安装了 Python 3.9+。运行以下命令确认:

    python3 --version
    

    如果版本不足,可从 Python 官网 下载安装。

  2. 通过 pip 安装
    使用 pip 安装 AiPy:

    pip install aipyapp
    

    这会自动安装依赖库。如遇问题,可升级 pip:

    pip install --upgrade pip
    
  3. 克隆源码(可选)
    想体验最新功能,可克隆 GitHub 仓库:

    git clone https://github.com/knownsec/aipyapp.git
    cd aipyapp
    

    创建虚拟环境并安装依赖:

    python3 -m venv venv
    source venv/bin/activate  # Linux/macOS
    venv\Scripts\activate     # Windows
    pip install -r requirements.txt
    
  4. Windows 免安装版
    Windows 用户可下载一键运行包,解压后运行 update.bat 启动 AiPy,无需配置环境。下载链接:AiPy 免安装包
  5. 配置大模型
    AiPy 需要大模型支持,推荐 DeepSeek API(性价比高)。在安装目录或用户目录创建配置文件(如 .aipyconfig),填入 API 信息:

    [llm]
    api_key = your_deepseek_api_key
    model = deepseek
    

    支持本地模型(如 Ollama、LMStudio),需配置 API 地址。

  6. 启动 AiPy
    运行以下命令:

    aipython
    

    默认进入任务模式,提示符为 AiPy (Quit with 'exit()') >>>

基本使用

AiPy 提供任务模式和 Python 模式,两种模式数据互通。

  • 任务模式
    适合快速任务处理。用户输入自然语言,AiPy 生成并运行代码。例如:

    ai("读取 orders.csv,计算每种产品的总收入")
    

    AiPy 生成代码:

    import pandas as pd
    df = pd.read_csv('orders.csv')
    df['收入'] = df['价格'] * df['数量']
    result = df.groupby('产品')['收入'].sum()
    print(result)
    

    若需第三方库,会提示:

    📦 LLM requests to install third-party packages: ['pandas']
    If you agree, enter 'y [y/n] (n):
    

    输入 y 确认。

  • Python 模式
    适合熟悉 Python 的用户,启动命令:

    aipython --python
    

    直接输入代码,例如:

    import pandas as pd
    df = pd.read_csv('orders.csv')
    print(df.head())
    

    任务模式生成的数据可在 Python 模式继续使用。

特色功能操作

  1. 自然语言编程
    用户描述需求,AiPy 自动生成代码。例如:

    ai("从 data.csv 筛选薪资高于 5000 的记录,按年龄排序")
    

    生成代码:

    import pandas as pd
    df = pd.read_csv('data.csv')
    result = df[df['薪资'] > 5000][['姓名', '年龄', '薪资']].sort_values(by='年龄')
    print(result)
    
  2. 数据可视化
    支持生成图表。例如:

    ai("绘制 orders.csv 中产品收入的饼图")
    

    生成代码:

    import pandas as pd
    import matplotlib.pyplot as plt
    df = pd.read_csv('orders.csv')
    df['收入'] = df['价格'] * df['数量']
    result = df.groupby('产品')['收入'].sum()
    plt.pie(result, labels=result.index, autopct='%1.1f%%')
    plt.show()
    
  3. API 调用
    支持互联网和本地 API。例如:

    ai("查询上海明天天气")
    

    AiPy 调用天气 API,返回结果。需配置 API Key。

  4. 代码纠错
    AiPy 使用 AST 检测并修复代码错误,如缩进或语法问题,确保运行顺利。
  5. 本地部署
    支持本地运行,数据处理在用户设备完成,适合敏感数据场景。配置本地模型后无需联网。

操作流程示例

以处理 sales.csv(列:产品、价格、销量)为例:

  1. 启动 AiPy:
    aipython
    
  2. 输入任务:
    ai("读取 sales.csv,计算每种产品总销量")
    

    输出:

    产品    总销量
    手机    100
    电脑     50
    
  3. 生成图表:
    ai("绘制总销量的柱状图")
    

    显示柱状图。

  4. 切换 Python 模式:
    aipython --python
    

    输入:

    plt.title('产品销量')
    plt.show()
    

注意事项

  • 确保文件路径正确,否则提示错误。
  • 配置 API 时检查网络或本地模型状态。
  • 本地模型需硬件支持(如 GPU)。
  • 退出 AiPy 输入 exit()

应用场景

  1. 数据分析
    数据工程师快速处理 Excel 或 CSV,完成清洗、统计和可视化,省去手动编码。
  2. 编程学习
    初学者用自然语言尝试任务,查看生成代码,学习 Python 库用法。
  3. 自动化脚本
    开发者生成脚本处理文件、监控资源或调用 API。
  4. 生活助手
    查询天气、规划行程或筛选美食,AiPy 自动整理结果。

 

QA

  1. AiPy 支持哪些模型?
    支持 DeepSeek、Ollama、LMStudio 等,配置文件中设置 API 即可。推荐 DeepSeek。
  2. 如何调用本地 API?
    在配置文件中添加 API 地址和说明,AiPy 自动生成调用代码。
  3. 代码出错怎么办?
    AiPy 通过 AST 修复常见错误。若失败,可用 Python 模式手动调整。
  4. 需要联网吗?
    本地部署无需联网,适合隐私场景。调用互联网 API 需网络。
未经允许不得转载:首席AI分享圈 » AiPy:自动化运行Python代码完成数据分析任务
zh_CN简体中文