综合介绍
Probly 是一个由 PragmaticMachineLearning 团队开发并在 GitHub 上开源的电子表格工具,结合了传统电子表格的功能与强大的 AI 数据分析能力。它不仅支持用户像使用 Excel 一样管理数据,还能通过内置的 Python 运行环境和 AI 聊天功能,直接对数据进行深入分析和可视化呈现。无论是数据整理、公式计算,还是生成图表、利用 AI 获取洞察,Probly 都能一站式完成。项目采用现代前端技术(如 Next.js 和 React)和 Pyodide(基于 WebAssembly 的 Python 运行时),适合数据爱好者、开发者和需要快速分析数据的小型团队使用。作为开源项目,用户可以自由下载、修改并贡献代码,兼具实用性和扩展性。
功能列表
- 交互式电子表格:提供类似 Excel 的表格界面,支持公式计算和数据编辑。
- Python 数据分析:通过内置 Python 环境,直接运行代码处理表格数据。
- 数据可视化:基于 ECharts 生成柱状图、折线图等多种动态图表。
- AI 聊天分析:通过 OpenAI API,提供智能建议和自动化数据解读。
- 数据导入与管理:支持外部数据导入,轻松管理多源数据集。
- 开源与自定义:用户可以修改源码,定制符合需求的专属功能。
使用帮助
安装流程
Probly 是一个基于 Web 的工具,但需要本地部署才能完整使用其功能。以下是详细的安装步骤,帮助你快速上手:
- 克隆项目到本地
- 打开终端(如 Windows 的 CMD 或 macOS 的 Terminal)。
- 输入命令:
git clone https://github.com/PragmaticMachineLearning/probly.git
,回车后项目将下载到本地。 - 进入项目目录:
cd probly
。
- 安装依赖
- 确保你的电脑已安装 Node.js(推荐版本 18 或以上,可在官网下载)。
- 在终端输入:
npm install
,等待依赖包安装完成。这一步会下载 Next.js、React 等前端框架和相关库。
- 配置 OpenAI API 密钥
- 在项目根目录下创建
.env
文件(可以用文本编辑器如 VS Code 创建)。 - 在文件中输入:
OPENAI_API_KEY=你的API密钥
,保存文件。 - 如何获取密钥?登录 OpenAI 官网,注册账号后在 API 管理页面生成密钥,复制粘贴到
.env
文件中。
- 在项目根目录下创建
- 启动开发模式
- 在终端输入:
npm run dev
,回车后系统会启动本地服务器。 - 打开浏览器,访问
http://localhost:3000
,即可看到 Probly 的界面。
- 在终端输入:
- 生产环境部署(可选)
- 如果需要正式使用,输入
npm run build
构建项目,再输入npm run start
启动。 - 完成后,Probly 将运行在生产环境,开箱即用。
- 如果需要正式使用,输入
如何使用主要功能
1. 数据输入与编辑
- 启动表格:进入 Probly 主页后,你会看到一个空白的电子表格界面,基于 Handsontable 开发,操作类似 Excel。
- 手动输入:直接在单元格中输入数据,例如在 A1 输入“销售额”,A2 输入“1000”。
- 导入数据:点击界面上方的“导入”按钮,选择本地的
.csv
或.xlsx
文件,数据会自动填充到表格中。 - 公式计算:支持 HyperFormula 公式,例如在 B1 输入
=SUM(A1:A10)
,即可计算 A 列总和。
2. Python 数据分析
- 打开 Python 环境:在界面右侧找到代码编辑器,点击“Python”标签。
- 编写代码:假设表格中有销售额数据,你可以输入以下代码:
import pandas as pd data = probly.get_data() # 获取表格数据 average = data['销售额'].mean() # 计算平均值 print(f"平均销售额: {average}")
- 运行代码:点击“运行”按钮,结果会显示在下方输出区域。
- 保存结果:分析结果可以直接写回表格,例如
probly.set_data('B1', average)
。
3. 数据可视化
- 生成图表:选中需要可视化的数据区域(例如 A1:B10),点击顶部“可视化”按钮。
- 选择类型:在弹窗中选择图表类型(如柱状图、折线图),点击“生成”。
- 调整样式:支持调整颜色、标签等,完成后点击“保存”将图表嵌入页面。
- 示例:假设 A 列是日期,B 列是销售额,生成折线图后可清晰看到趋势。
4. AI 聊天分析
- 打开 AI 聊天:按快捷键
Ctrl+Shift+/
,右侧会弹出聊天窗口。 - 提问数据问题:输入“销售额的趋势如何?”或“哪些数据点异常?”。
- 获取建议:AI 会基于表格数据分析并给出回答,例如“销售额在 3 月增长 20%,建议关注此区间”。
- 操作建议:AI 还可能推荐可视化方式或 Python 代码,直接点击即可执行。
5. 数据管理与导出
- 多表管理:支持创建多个工作表,点击底部“+”号添加新表。
- 导出数据:点击“导出”按钮,选择
.csv
或.json
格式保存到本地。
操作流程示例
假设你要分析一份销售数据:
- 导入
sales.csv
文件,包含日期和销售额两列。 - 在表格中检查数据,确保无误。
- 用 Python 代码计算平均值并写入 C1 单元格。
- 选中 A1:B10,生成折线图查看趋势。
- 打开 AI 聊天,询问“哪些月份表现最佳?”,根据建议调整策略。
- 导出分析后的表格和图表,分享给团队。
注意事项
- 网络要求:AI 功能需联网并确保 OpenAI API 密钥有效。
- 浏览器兼容性:推荐使用 Chrome 或 Firefox,确保 WebAssembly 支持。
- 代码调试:Python 运行出错时,检查语法或数据格式是否正确。
通过以上步骤,你可以轻松利用 Probly 完成数据整理、分析和可视化,极大提升工作效率。