GPT-4能否取代数据分析师？达摩院的初步实验为你解答~

ChatGPT人工智能2024-01-16 02:47:181504

先做个广告：如需代注册ChatGPT或充值 GPT5会员（plus），请添加站长微信：gptchongzhi

推荐使用GPT中文版,国内可直接访问：https://ai.gpt86.top

深度学习自然语言处理原创
作者 | 刘嘉玲

最近，数据分析师圈子大家在讨论GPT-4对他们的工作有什么影响：是替代还是辅助？个人认为GPT-4可以帮助我提高工作效率和质量。

要成为一名高级的数据分析师，需要经过长期的学习和实践，掌握数据分析的理论、技术和方法。这样的人才对雇主来说，也需要付出较高的合作成本。

达摩院的初步实验表明GPT-4的成本远低于雇用数据分析师的成本。假设每月工作21天，每天工作8小时，按照市场上的工资水平来算，GPT-4的使用成本只有初级数据分析师的0.71%和高级数据分析师的0.45%。这个结果是从三位达摩院的研究者们设计的一个让GPT-4从数据获取、清洗、分析、可视化到报告的整个过程都自动完成的框架下得出的。

接下来，我们一起来看看他们的论文中，GPT-4是如何做到的吧！

论文：Is GPT-4 a Good Data Analyst?
地址：https://arxiv.org/abs/2305.15038
代码：https://github.com/DAMO-NLP-SG/GPT4-as-DataAnalyst

研究方法

为了使用GPT-4自动化整个数据分析过程，研究者们将端到端的框架分成了代码生成、代码执行和分析生成三个步骤，通过这个框架，可以对比GPT-4和人类分析师的表现。

此图中业务问题和数据库的必填信息如右上蓝色框所示。参考外部知识源的可选输入在左上角的红色虚线框中圈出。包括提取数据、数据可视化和分析在内的输出在底部的绿色框中圈出。

为了实现作业任务，我们需要进行以下步骤：

输入问题，并将其转换为数据库可以识别的格式；
调用GPT-4，根据问题生成相应的数据库查询代码；
运行查询代码，从数据库中获取相关数据；
对获取的数据进行处理和分析，生成能够反映问题答案的图表或图像。

实验设计

任务目标：需要回答一个与业务相关的问题，并从一个或多个相关的数据库表中提取所需数据。然后，需要生成可视化图形以便更好地理解数据，并提供一些分析和见解，以帮助人们更好地理解数据。

具体来说就是：给定一个与业务相关的问题(q)和一个或多个相关的数据库表(d)及其模式(s)，提取所需的数据(D)，生成一个图(G)可视化并提供一些分析结果(A)。

数据来源：研究者们选择了NvBench数据集从不同领域随机选择100个6种不同图表类型和4种不同难度级别的问题进行实验。再分别让GPT-4和2位高级分析师和1位初级分析师去做这个任务，以得到任务结果数据。

评估指标：针对俩种输出内容，设置了七种不同的维度进行效果评价。可视化图是根据信息正确性，图表类型正确性和美观这三个维度评价。分析文本则是根据数据正确性，与问题相关性，分析复杂度和表达流畅度四个维度评价。

在这些维度上同时聘请了6名专业数据注释者对任务的输出进行人工评估打分。

实现结果

令人惊讶的是，实验结果显示，GPT-4可以达到与人类相当的表现。这意味着，GPT-4不仅能理解和生成语言，还能进行复杂的数据分析任务。

根据上表，GPT-4生成的图表在信息准确度方面表现不佳，平均得分只有0.78；但在图表类型选择方面表现优异，正确率达到99%；图表的美观程度一般。GPT-4的分析结果在正确性方面较高，平均有94%的内容是正确的，而且与问题相关性较好；但分析的复杂度和流畅度都不高。

上表中，根据3位分析师的分析结果的各指标得分来看，我们可以对GPT-4的数据可视化和分析能力进行如下总结：

在数据可视化方面，GPT-4的准确率比初级分析师高6%，与高级分析师相当，但在图表类型的选择上有一次失误，而且图表的美观度还有待提高。
在数据分析方面，GPT-4的数据正确性处于初级和资深高级分析师之间，但在分析的复杂度和问题相关性上与高级分析师持平，甚至在文本的表达流畅度上超过了人类分析师，展现了大语言模型的优势。

个案研究

GPT-4的案例研究1

GPT-4能够根据问题生成相应的代码，从数据源中查询数据，并用饼图可视化不同飞机的胜率。
GPT-4能够从饼图中读取数据，比较不同飞机的胜率，并计算它们赢得的比赛数量。
GPT-4在分析数据时，不仅考虑比率，也考虑绝对数值，这是符合数据分析原则的。
GPT-4还具有提出问题的能力，能够根据分析结果，提出一些可能影响飞机胜率的因素，并探索它们之间的关系。这些问题反映了GPT-4的思维深度和广度，超过了我的期待。