dicom 字符集的选择

查看字符集

  • 读取标签 特定字符集(0008,0005)

字符集

  • unicode是字符集,ASCII、GB2312、GBK、GB18030既是字符集也是编码方式,UTF-8只是编码方式
  • 通过字符集
  • 中文字符集

字符集的选择 不同厂商实现不同 修改导致不可读

  • [ISO / IEC 10646]现在禁止使用除UTF-8的最小长度编码以外的任何内容。 UTF-8允许多种不同的编码,但是当用于按照ISO 10646-1和10646-2(带有扩展名)编码Unicode字符时,只有最小限度的编码才是合法的。
  • DICOM默认字符库中字符的表示形式与默认字符库,UTF-8中的[ISO / IEC 10646],[GB 18030]和[GBK]的单字节值相同。它也是7位US-ASCII编码。
  • [GBK]字符集是[GB 18030]字符集的子集,该字符集受其一字节和两字节代码点的限制。在此子集中,[GBK]字符集遵循与[GB 18030]完全相同的编码规则。

常用的编码

  • unicode =》 ISO IR 192 (ISO 8859-15) 、ISO IR 100 (ISO 8859-1)
  • ISO IR 192 是 ISO/IEC 2022 标准中的一个字符集,它定义了字符集“ISO 8859-1”(也称为 Latin-1)。
  • ISO 8859-15 在 ISO 8859-1 的基础上添加了一些额外的字符,特别是欧元符号,并且对某些字符进行了替换
  • 很多java 和 mysql 数据默认为 Latin-1
  • GB18030 =》GB18030

直接输出编码

dcmdump  +P   "InstitutionAddress"   +U8 .\ade05f15-deed-4ff4-bddb-cca5cc56b5e6.dcm
posted @ 2024-08-13 14:03  vx_guanchaoguo0  阅读(66)  评论(0编辑  收藏  举报