业务需求
最近做一个把源数据库的数据批次导出到目标数据库。源数据库是采集程序采集而来的原始数据库,所以需要对其进行一些处理(过滤一些为空,长度太短或太长,非法字符,重复数据)然后在进行入库。
其中要避免目标库插入重复数据。这重复数据可能是源数据库本身就有重复数据,还有就是已经插入避免重复插入。
过滤自身重复数据解决方案
第一种:采用DataView.ToTable()方法
DataView.ToTable 方法
重载列表
名称 | 说明 |
---|---|
DataView.ToTable () | 根据现有 DataView 中的行,创建并返回一个新的 DataTable。
由 .NET Compact Framework 支持。 |
DataView.ToTable (String) | 根据现有 DataView 中的行,创建并返回一个新的 DataTable。
由 .NET Compact Framework 支持。 |
DataView.ToTable (Boolean, String[]) | 根据现有 DataView 中的行,创建并返回一个新的 DataTable。
由 .NET Compact Framework 支持。 |
DataView.ToTable (String, Boolean, String[]) | 根据现有 DataView 中的行,创建并返回一个新的 DataTable。
由 .NET Compact Framework 支持。 |
实例代码
public static DataTable Distinct(DataTable dt, string[] filedNames) { DataView dv = dt.DefaultView; DataTable DistTable = dv.ToTable("Dist", true, filedNames); return DistTable; }
第二种方法:循环遍历+DataTable.Select()
利用for循环遍历DataTable的数据行,利用DataTable.Select 方法判断是否重复,如果重复,则利用DataTable.Rows.RemoveAt(Index)删除重复的那一行。
具体看代码。
代码示例
public DataTable GetDistinctSelf(DataTable SourceDt, string filedName) { for (int i = SourceDt.Rows.Count - 2; i > 0; i--) { DataRow[] rows = SourceDt.Select(string.Format("{0}='{1}'", filedName, SourceDt.Rows[i][filedName])); if (rows.Length > 1) { SourceDt.Rows.RemoveAt(i); } } return SourceDt; }
第三种方法
利用双循环遍历(不推荐)
public DataTable GetDistinctSelf(DataTable SourceDt, string filedName) { for (int i = SourceDt.Rows.Count - 2; i > 0; i--) { string title = SourceDt.Rows[0][filedName].ToString(); for (int j = i + 1; j > 0; i--) { if (SourceDt.Rows[j][filedName].ToString() == title) { SourceDt.Rows.RemoveAt(i); } } } return SourceDt; }
如果本文引用了你的文章而未注明,请及时联系我。
分类:
【语言】C#语言
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~