设为首页收藏本站language→→ 语言切换

鸿鹄论坛

 找回密码
 论坛注册

QQ登录

先注册再绑定QQ

查看: 721|回复: 1
收起左侧

Power Query 数据处理躲坑之合并数据前去重

[复制链接]
发表于 2017-5-22 09:45:43 | 显示全部楼层 |阅读模式
通过合并查询,我们可以快速把两张表格中的数据合并到一起,但是很多人可能会忽略掉,如果在匹配的时候如果匹配表的匹配列包含重复值,会导致原表的数据重复。

看一下我们准备的例子, “销售记录表” 和 “区域匹配表” 。
1.jpg
销售记录表的销售额总和为100 。在区域匹配表里“广东”出现了重复值。我们通过省份列,对两张表进行合并查询。
2.jpg

扩展出我们需要的“区域” 字段
3.jpg

在下面最终得到的结果中,广东的数据出现了重复,导致全部销售额变成了140。
4.jpg

为了方便大家理解,我们的示例数据非常简单。但在实际工作中,当数据量多的时候,我们可能感觉不到重复的存在。这就很容易导致最终的数据出现重复,统计数字也翻倍了。
为了避免这样的错误发生,大家在做合并查询前首先要确保匹配表的匹配列没有重复。其次,要养成在合并查询前,对匹配表的匹配列进行去重。
5.jpg
这样就能确保原始表的数据不会出现重复。尤其当数据量大的时候,一定记得先检查和去重,否则很难发现数据的变化。

本文出自东方瑞通,转载请注明!
更多行业干货、技术文章,请关注公众号:东方瑞通终身学习~
gong.jpg

2.jpg
发表于 2017-5-22 10:55:54 | 显示全部楼层
感谢楼主分享!
沙发 2017-5-22 10:55:54 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2024-4-26 13:05 , Processed in 0.065502 second(s), 10 queries , Redis On.  

  Powered by Discuz!

  © 2001-2024 HH010.COM

快速回复 返回顶部 返回列表