excel怎么统计一列数据(excel统计一列有内容的个数)
原标题:excel怎么统计一列数据(excel统计一列有内容的个数)
导读:
对于数据分析师来说,数据处理的重要性不言而喻。今天小易就重点讲解一下如何使用Excel进行数据处理。众所周知,获得的数据通常并不完美,而是常常含有缺失值、错误值等,此时摆在数据分析师面前的两座大山就是“数据清洗”和“数据处理”。只有过了这两座大山,后续的具体数据分析、数据可视化等操作才能顺利进行。导
对于数据分析师来说,数据处理的重要性不言而喻。今天小易就重点讲解一下如何使用Excel进行数据处理。
众所周知,获得的数据通常并不完美,而是常常含有缺失值、错误值等,此时摆在数据分析师面前的两座大山就是“数据清洗”和“数据处理”。只有过了这两座大山,后续的具体数据分析、数据可视化等操作才能顺利进行。
导入数据是数据处理的第一步,Excel支持的数据类型可以分为三类:
文本数据、网站数据、数据库数据。
让我们简单地看一下。小艺这里就不详细介绍了。这次的重点是数据处理~
数据处理方法通常包括数据清洗、数据处理等,本文将为您介绍Excel中的数据处理技巧。
数据清洗通常包括:过滤、去除冗余重复值;填写缺失值;更正或删除错误值。
数据处理通常包括:对清洗后的数据进行合并、提取、拆分、转换等。
01
数据清洗
数据清洗处理的数据包括:重复值、缺失值、错误值。
处理重复值
1函数方法
函数:COUNTIF(range,criteria),对某个范围内满足单个指定条件的单元格进行计数。
range:计数范围;
criteria:计数条件,可以指定为数字、文本或表达式。
计数1:在D2单元格中输入=COUNTIF(C:C,C2),统计每个订单号出现的总次数。
计数2:在E2单元格中输入=COUNTIF(C$2:C2,C2),计算当前单元格对应的订单号出现了多少次。
对于“计数2”列,以单元格C6中与单元格E6对应的订单号为例。3表示该订单号在C2~C8中第三次出现。
这时,通过D列和E列就可以清楚地看到重复值的具体情况:重复值总共出现了多少次以及对应的重复值出现了多少次。
通过函数方法完成重复值的计数后,下一步就是执行删除步骤。
(1)排序删除
对于通过函数方法过滤掉的重复数据,可以对E列数据进行升序排序,选择并删除大于1的数据。
(2)过滤和删除
对于通过函数方法过滤的数据,过滤E列的数据,取消值为1的数据的显示,然后删除剩余的数据。
您还可以使用“数字过滤”功能过滤掉“大于1”或“不等于1”的数据,然后将其删除。
点击“大于”或“不等于”后,在弹出的窗口中输入相应的值进行过滤和删除。
2先进的筛选方法
选择要过滤的数据,使用高级过滤功能并选择“选择唯一记录”。
点击确定后,会显示没有重复值的数据。
高级过滤方法的优点是操作简单,可以快速得到去除重复值后的显示效果。
3条件格式化方法
选择要过滤的数据,点击“开始-条件格式-突出显示单元格规则-重复值”,标记重复值。
您还可以在此处选择标记重复值的颜色。
条件格式化方法不如其他方法方便。它的缺点是只能标记重复数据,当数据量很大时,无法清楚地看到重复数据和重复次数。
4数据工具法
使用“数据工具”中的“删除重复值”功能可以直接从数据中删除重复值。
值得注意的是,在点击“删除重复项”后弹出的窗口中,需要先“取消全选”,然后选择要删除重复项的列,然后点击“确定”。
因为弹窗有时会默认选择全部,所以此时不能直接点击确定,否则需要保留的数据也会被删除。
这种方法的优点是操作简单,非常方便。
接下来,我们将向您展示如何处理数据中的缺失值。
处理缺失值
处理缺失值通常有两种方法:定位条件和查找替换。
1定位标准
定位标准函数入口:
1)快捷键“CTRL+G”。
2)“开始”-“查找并选择”-“定位标准”。
选择需要处理的数据后,点击“定位条件”。
此时,选择“Null”并确认标记缺失值。
图中缺失值对应的是“ExpressAir”。正常输入需要填写的内容后,使用快捷键“CTRL+Enter”填写剩余的缺失值。
2查找并替换
找到替换函数的入口:
1)快捷键:“CTRL+H”。
2)“开始”-“查找并选择”-“替换”。
单击“替换”后,输入要查找和替换的内容,然后单击“全部替换”。由于此搜索是针对缺失值,因此搜索内容可以保留为空。
小毅想补充一些通常用于处理缺失值的想法:
用样本统计量的值替换缺失值,例如样本均值;
用统计模型计算的值替换缺失值。例如回归模型、判别模型等;
删除含有缺失值的数据记录;
保留包含缺失值的数据记录,并在分析过程中根据需要排除它们。
以上就是Excel数据分析中缺失值的处理。接下来介绍一下常用的错误值处理方法。
处理错误值
Excel中常见的错误值有8种,分别是:#DIV/0!#REF!#VALUE!#NULL!#NAME?####、#NUM!#N/A。每个误差值都有自己的特点,因此对应不同的处理方法。接下来我们就来介绍一下上面8个错误值是如何解决的~
错误类型1#DIV/0!
#DIV/0的原因!出现的情况是数据除法运算时,除数中含有0、空格或缺失值。因为除数不能为0,所以当公式运算不满足要求时,错误值形成#DIV/0!会出现。
如图所示,您可以通过“公式-错误检查”功能查看错误原因和计算步骤。该图显示了“除以零”错误。此时只需修改除数内容即可。
错误类型2#REF!
#REF的原因!出现的情况是,当通过公式引用某个单元格或单元格区域时,当引用的区域被删除而公式找不到引用的区域时,会出现#REF!将出现错误值。
如图,删除“3月销售额列”后,“3月总销售额”数据显示#REF!错误值,错误检查功能显示原因是由于移动或删除单元格而导致无效的单元格引用。针对此类问题,我们需要重新整理公式计算逻辑,更新公式的计算区域。
错误类型3#VALUE!
#VALUE的原因!出现的情况是,输入公式时,计算的是不同数据类型的值。例如,添加“Group1”和“15”时,会出现#VALUE!出现错误值。
图中显示了文本类型和数字类型的相加,结果是#VALUE!误差值。这时我们需要检查公式中计算区域的值是否是同一类型。
错误类型4#NULL!
#NULL!出现错误值的原因是公式中使用了不正确的范围运算符,或者在范围引用之间使用了交集运算符来指定两个不相交范围的交集。
如图所示,由于区间运算符使用错误,将“,”替换为“空格”,出现了#NULL!出现错误值。这时候就需要重新检查一下公式以及公式引用的区间。
错误类型5#NAME?
姓名?出现此问题的原因可能是公式中的名称拼写不正确、公式的语法不正确或公式引用了未定义的名称之一。
如图所示,当函数“SUMPRODUCT”输入为“SUNPRODUCT”时,#NAME?出现错误值。这时,你需要重新检查不正确的值单元格中公式的拼写。
错误类型6####
出现####错误值是因为列的宽度不足以显示单元格的所有内容。
如图所示,当列宽不足以显示完整日期时,会出现####错误值。在这种情况下,只需调整列宽即可。
错误类型7#NUM!
#NUM!由于公式包含无效值,因此出现错误值。
如图所示,由于公式中“3的6785次方”的计算值超出了Excel限制的数值计算范围,因此#NUM!出现错误值。这时只能将数据进行拆分或者重新排列来进行计算。
错误类型8#N/A
出现#N/A错误值是因为公式找不到它要查找的内容。
如图所示,由于公式中F7-“组5”的内容在表格中不存在,因此显示#N/A错误值。这时需要重新检查搜索范围以及搜索内容是否有误。
错误值处理补充:
小易在这里添加了一个常用的处理错误值的函数:
IFERROR(值,value_if_error)
value:检查参数是否有错误;
value_if_error:公式计算结果错误时返回的值。
以错误值#N/A为例。当因公式查询的数据不存在而出现#N/A错误值时,可以使用该函数返回设置的备注。
以上是处理误差值的内容。接下来小毅就带大家进入数据处理部分。
02
数据处理
数据处理通常包括数据合并、数据拆分和数据变换。让我们从数据合并开始。
数据合并
数据合并通常包括字段合并和字段匹配。
1字段合并
字段合并常用的函数有:CONCAT(text1,[text2],)和u0026连接器。
text1:要连接的文本项。字符串或字符串数组,例如单元格区域。
text2:要连接的其他文本项。文本项最多可以有253个文本参数,每个文本参数可以是字符串或字符串数组,例如单元格区域。
u0026:适合需要拼接的字段较少的情况。
下图是两种方法的使用示例。
2字段匹配
跨表的字段匹配往往需要使用函数:
VLOOKUP
lookup_value:要查找的值。要查找的值必须列在参数参数指定的单元格table_array列中;
table_array:VLOOKUP搜索lookup_value并返回值的单元格范围。单元格区域的第一列必须包含lookup_value。单元格区域还需要包含要查找的返回值;
col_index_num:包含的列的列号table_array从1开始;
[range_lookup]:一个逻辑值,指定是否希望VLOOKUP查找近似匹配或精确匹配。
表格1
表2
如上图所示,如果您想根据“订单号”将表2中的“发货日期”数据匹配到表1中,可以按照下图的公式进行字段匹配。
以上两种方法均用于数据合并。接下来我们将介绍数据拆分的方法。
数据分割
数据拆分通常指的是字段分离。小毅总结了两种实现场分离的方法。
1菜单法
功能入口:“数据-数据工具-栏目”
确认下一步后,还需要在弹出的窗口中确认分隔符。本例中使用的分隔符是“/”。
这里点击下一步后,可以在弹出的窗口中选择分割数据对应的格式。您可以直接为案例中的值选择默认值,然后单击“完成”。
本例中,由于分割数据相邻的列已经有内容,所以最终显示的就是替换C列和D列数据的效果。
2函数方法
函数方法对应的函数有两个:
左;右
text:包含要提取的字符的文本字符串;
num_chars:指定LEFT/RIGHT要提取的字符数。
下图以LEFT函数为例,对C列的数据进行分割。
以上就是数据拆分的内容。接下来就轮到数据转换了~
数据转换
数据转换通常包括行列转换和数据类型转换。
1行列转换
行列转换比较简单。您可以直接选择需要转换的数据范围并“复制”和“粘贴”。唯一需要注意的是粘贴时使用“粘贴选项-转置”。
2数据类型转换
数据类型转换包括将文本转换为数值、数值转换为文本、数值日期转换为日期等。这可以通过函数VALUE()和TEXT()来实现。
VALUE(text):将表示数字的文本数据转换为数字。
文本:用引号括起来的文本或对包含要转换的文本的单元格的引用。
TEXT(value,format_text):将数值数据转换为文本数据。
value:要转换为文本的值;
format_text:定义要应用于所提供值的格式的文本字符串。
下面以TEXT()函数为例,转换F列数据。将F列数字转换为文本类型数据。
在下面的示例中,我们还可以使用VALUE()函数将H列中的文本数据转换为数字。
以上就是本次分享的全部内容啦~
这些内容只是数据分析知识的冰山一角。如果想了解更多数据分析相关技能,可以关注融易大数据~
后续我们将继续分享更多与数据分析相关的内容。
组织起来并不容易。请点赞并转发以提供帮助。