excel操作数据实用技能

写代码写习惯了,在做数据预处理时也总是习惯性地用python、pandas来做处理,但其实有时候根本不需要写代码,用excel也能达到目的,甚至比写代码快很多,写代码要半天,excel只要几秒钟。下面是几个最近发现的实用技能和场景:

1.去掉某一个列的重复项:
例如,删除address列中的重复项。

操作方法:点击address列的列头(表第一行上方的A,B,C等),选中该列的所有行,复制粘贴到一个新的sheet页,在新的sheet页中选中address列的列名,点击excel上方的"数据"选项卡,选中"删除重复项",在弹出框中选中address列的列名,确定即可去掉重复项,再把该sheet保存到一个新的文件中。
注意:之所以要把该列复制粘贴到新的sheet页,是因为如果直接在原表操作,如果该表还有其他的列,则删除address列的重复项时,会提示无法删除。

2.去掉所有列的值均重复的行:

 

====》

例如,上表中第2,3行的所有列的数据完全一样,删除重复项,只保留其中一行。

具体操作:选中所有列的列头,点击excel上方的"数据"选项卡,选中"删除重复项",在弹出框中选中所有列的列名,点确定即可。

3.去掉某一列包含特定值的行:
例如,删除colB列为27的那些行。
实现思路:使用"数据"的"筛选"功能找出某列为特定值的行,删除之后用"数据"的"排序"功能去掉被删除导致的空行。

具体操作:

点击colB的列头,点击"数据"选项卡,点击"筛选"按钮,这时colB列的列头右侧会出现一个漏斗或者下三角的小图标,点击该图标,会弹出一个对话框,
在对话框中选中值为27的复选框,别的复选框都去掉,点确定,会只列出colB值为27的行,选中这些行,用delete键删除,所有colB列的值为27的行就都删除了,被删除的地方会出现变为空行。这时,直接用"排序"按钮左侧的A-Z升序按钮,或者降序按钮,在弹出框中选中"扩展选定区域",再点确定即可删除空白行。

 

4.只需要其中一列或几列时,可以点击这一列或者配合Ctrl键同时选中几列,复制粘贴到新的excel文件或者一个新的sheet,再另存为xlsx、csv都可以。

posted @ 2018-07-12 10:28  morein2008  阅读(159)  评论(0编辑  收藏  举报