综合介绍
Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面(GUI)和自然语言输入(NL),使用户能够通过简单的交互和指令,快速创建和迭代复杂的数据可视化作品。Data Formulator旨在帮助数据分析师和研究人员更高效地处理和展示数据,提升数据分析的效率和效果。用户可以通过Python包安装和GitHub Codespaces等多种方式使用该工具。
功能列表
- 数据可视化创建:通过AI自动生成丰富的数据可视化图表。
- 自然语言输入:支持用户通过自然语言描述数据可视化需求。
- 图形化用户界面:提供直观的图形化界面,简化操作流程。
- 数据清洗:支持加载图片或杂乱文本,并通过AI进行解析和清洗。
- Python包支持:可以通过Python包安装和运行,方便本地使用。
- GitHub Codespaces集成:支持在GitHub Codespaces中快速启动和使用。
- 数据可视化挑战:提供数据可视化挑战,帮助用户提升技能。
使用帮助
安装流程
- 通过Python PIP安装:
- 在终端中运行以下命令安装Data Formulator:
pip install data_formulator
- 安装完成后,运行以下命令启动Data Formulator:
data_formulator
- Data Formulator将自动在浏览器中打开,默认端口为5000。如果端口被占用,可以指定其他端口:
python -m data_formulator --port 8080
- 在GitHub Codespaces中使用:
- Data Formulator已在GitHub Codespaces中预配置好,用户可以快速启动
功能操作流程
- 创建数据可视化:
- 打开Data Formulator后,选择“新建项目”。
- 通过图形化界面或自然语言输入描述数据可视化需求,例如“创建一个展示销售数据的柱状图”。
- Data Formulator将根据输入自动生成相应的图表,并展示在界面中。
- 数据清洗:
- 在主界面中选择“数据清洗”功能。
- 上传需要清洗的图片或文本文件。
- Data Formulator将自动解析并清洗数据,生成结构化数据供后续使用。
- 参与数据可视化挑战:
- 在主界面中选择“数据可视化挑战”。
- 按照提示选择一个挑战项目,使用提供的数据集完成可视化任务。
- 完成后,可以将结果分享至社区,与其他用户交流和讨论。