随笔 - 435  文章 - 0  评论 - 111  阅读 - 62万 

Contact表, 是定期从其他系统导出的Excel,再导入的数据. 有几十万条数据,存在以下几个问题: 联系人重复,省市地址空缺

解决方法:

第1步: 采用  group by mobilePhone having count(*)>1 过滤出重复数据,放在一个临时表a

第2步: 对每组重复记录,根据各个字段的权重,判断出以哪行数据为准,

把选择出的那行数据,如果有字段空白,而重复记录的该字段不为空白,则选取不空白的字段的内容,更新选择行的字段数据.

放在一个临时表b

第3步: 把contact表不重复的那部分记录和临时表b的记录,合并成临时表c

 

posted on   Gu  阅读(575)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏
· Manus爆火,是硬核还是营销?
点击右上角即可分享
微信分享提示