数据分析Data Analysis
1、什么是数据分析?
数据分析涉及到一系列的动作。首先要通过一定的方法采集数据(Data Collection)并且记录下来。然后对采集的数据进行过滤整理,找到其背后的整体趋势,从而可以辨别数据的真伪好坏,也能对事物的未来趋势做出预测。为了总结和预测,我们采用了数据分析(Data Analysis)。
2、数据分析中经常用到的图表有哪些?
以下列出统计和数据分析中经常用到的图表。记住:具体的某个个体数字并不是非常重要,重要的是整体的趋势。对于这些图表的解释如果让学生觉得陌生,那么建议该学生跟着统计老师好好补习一下。
(1)表格Table:对于数据的详细记录。这种类型的图标比较常见,大家也比较熟悉。它要求学生可以从众多的数据信息中提取自己所需要的信息,加以整理和利用。
(2)柱状图Bar Graph/Histogram:柱状图主要看整体的趋势。柱状图往往一目了然,适合总结整体的趋势。
(3)线形图LineGraph:线形图表明了事物发展的总体趋势,通常而言,如果线的形状可以用某种方程来模拟,我们的数学分析就具有了预测的特征。
(4)饼状图piechart:主要体现的是比重proportion或者百分比percentage。大多数时候,饼状图并不体现绝对数值,只是对于不同事物的比重进行一个比较。
(5)Boxplot:展现数据的极值和quartiles(25 percentile,median,75 percentile),从而让人可以比较不同组数据的实质是否相同。见下图:
(6)Confidence Interval Graph:展现数据的平均值mean和95% confidence interval,可以让人认出实质不同的数据组。
如下图中:
第一组数据实质上低于第八组数据(因为第一组数据的高95% confidence interval还低于第八组数据的低95% confidence interval)。
在数据解释上,我们可以说:低收入家庭第一种族的学生明显比中等收入家庭第三种族的学生在数学表现要差。同理,我们还可以看出:对于社会中高收入的家庭而言,不同种族并不会实质性影响学生的数学表现。
点击参与>>SAT