关于数据库长度限制和.NET中处理正确长度等问题
2004-06-29 16:28 灵感之源 阅读(1870) 评论(11) 编辑 收藏 举报
最近在做Office同步器,要把Office中的数据跟.NET做的B/S系统进行交互,碰到一个平时也会遇到的问题:数据库长度限制。
譬如数据库某表某字段为varchar(20),假如我们插入纯20个ASCII字符是没有问题的,但如果我们插入超过10个纯中文就会出错,因为中文为Double-Byte双字节。简单地,我们可以直接截取前10个字符就了事了,但是,我们得兼容各种Charset。
刚开始的做法是用strText.ToCharArrary()-》System.Array.Copy()的方法截取前20个字符,但后来发现返回的长度让我惊讶:Char本身就能保存一个中文。
后来重现写了这个函数:
Private Shared Function GetFixedLengthString(ByVal strText As String, _
ByVal intLength As Integer) As String
Dim o_bytItems() As Byte = Encoding.Default.GetBytes(strText)
Dim o_intLength As Integer = IIf(o_bytItems.Length > intLength, intLength, o_bytItems.Length)
Dim o_bytNewItems(o_intLength - 1) As Byte

'为了防止字符串含非ASCII字符
Array.Copy(o_bytItems, o_bytNewItems, o_intLength)

Return Encoding.Default.GetString(o_bytNewItems)
End Function
效果还不错,唯一缺点是可能会截取到半个非ASCII字符。
其实有完全的解决方案:扫描每个字符,计算ASCII的字符个数,如果为偶数,则能取20,否则,取19。
不知道大家有什么更好的方法?
譬如数据库某表某字段为varchar(20),假如我们插入纯20个ASCII字符是没有问题的,但如果我们插入超过10个纯中文就会出错,因为中文为Double-Byte双字节。简单地,我们可以直接截取前10个字符就了事了,但是,我们得兼容各种Charset。
刚开始的做法是用strText.ToCharArrary()-》System.Array.Copy()的方法截取前20个字符,但后来发现返回的长度让我惊讶:Char本身就能保存一个中文。
后来重现写了这个函数:












效果还不错,唯一缺点是可能会截取到半个非ASCII字符。
其实有完全的解决方案:扫描每个字符,计算ASCII的字符个数,如果为偶数,则能取20,否则,取19。
不知道大家有什么更好的方法?
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架