名称 字节 说明
Tag 3 ID3V1标识符“TAG”的Ascii码
Title 30 歌曲名
Artist 30 歌手名
Album 30 专辑名
Year 4 日期信息
Comment 28 注释信息,有时为30字节
Reserved 1 =0说明有音轨,下一字节就是音轨;≠0表示注释是30个字节
Track 1 音轨(字节型数值),歌曲在专辑里的序号
Genre 1 歌曲风格(字节型数值)
1 public static void StorageMusicFileWithID3V1Tag(File sourceFile, String musicFilePath, 2 String songName, String artistName, 3 String albumName) { 4 try { 5 sourceFile.renameTo(new File(musicFilePath)); 6 7 RandomAccessFile musicRandomAccessFile = new RandomAccessFile(musicFilePath, "rw"); 8 musicRandomAccessFile.seek(musicRandomAccessFile.length() - 128); // 跳到ID3V1开始的位置 9 10 byte[] tag = new byte[3]; 11 musicRandomAccessFile.read(tag); 12 13 if (new String(tag).equals("TAG")) { 14 return; 15 } 16 17 byte[] tagByteArray = new byte[128]; 18 19 musicRandomAccessFile.seek(musicRandomAccessFile.length()); 20 21 byte[] songNameByteArray = songName.getBytes("GBK"); 22 byte[] artistNameByteArray = artistName.getBytes("GBK"); 23 byte[] albumNameByteArray = albumName.getBytes("GBK"); 24 25 int songNameByteArrayLength = songNameByteArray.length; 26 int artistNameByteArrayLength = artistNameByteArray.length; 27 int albumNameByteArrayLength = albumNameByteArray.length; 28 29 songNameByteArrayLength = songNameByteArrayLength > 30 ? 30 : songNameByteArrayLength; 30 artistNameByteArrayLength = 31 artistNameByteArrayLength > 30 ? 30 : artistNameByteArrayLength; 32 albumNameByteArrayLength = 33 albumNameByteArrayLength > 30 ? 30 : albumNameByteArrayLength; 34 35 System.arraycopy("TAG".getBytes(), 0, tagByteArray, 0, 3); 36 System.arraycopy(songNameByteArray, 0, tagByteArray, 3, songNameByteArrayLength); 37 System.arraycopy(artistNameByteArray, 0, tagByteArray, 33, artistNameByteArrayLength); 38 System.arraycopy(albumNameByteArray, 0, tagByteArray, 63, albumNameByteArrayLength); 39 40 tagByteArray[127] = (byte) 0xFF; // 将流派显示为指定音乐的流派 41 42 musicRandomAccessFile.write(tagByteArray); 43 } catch (Exception e) { 44 LogFunction.error("写入音乐标签异常", e); 45 } 46 }
ID3V2 与 ID3V1 的作用差不多,也是记录 MP3 的有关信息,但 ID3V2 的结构比 ID3V1 要复杂得多,而且可以伸缩和扩展。ID3V2 到现在一共有 4 个版本,但流行的播放软件一般只支持第 3 版,既ID3V2.3。由于ID3V1记录在 MP3 文件的末尾,ID3V2 就只好记录在 MP3 文件的首部了。
每个 ID3V2.3 的标签都一个标签头和若干个标签帧或一个扩展标签头组成。歌曲的信息如标题、作者等都存放在不同的标签帧中,扩展标签头和标签帧并不是必要的,但每个标签至少要有一个标签帧。对于 VB 爱好者来说,你可以把 ID3V2 看作是一个对象,而把标签帧看作是 ID3V2 的一个属性,那么,标签帧的标识符就可以看作是属性名了。
名称 字节 说明
Header 3 ID3V2.3标识符"ID3"的Ascii码,否则认为没有ID3V2.3
Ver 1 版本号,=03
Revision 1 副版本号,=00
flag 1 标志字节,一般没意义,=00
Size 4 标签内容长度,高位在前,不包括标签头的10个字节
标签内容由若干个标签帧组成。每个标签帧都由一个10个字节的帧头和至少 1个字节的不固定长度的帧内容组成,它们顺序存放在文件中。
名称 字节 说明
FrameID 4 帧标识符的Ascii码
Size 4 帧内容及编码方式的合计长度,高位在前
Flags 2 标志,只使用了6位,详见表6,一般均=0
encode 4 帧内容所用的编码方式。许多帧没有此项(注意,这一部分作者写错了,文档上事实并没有此属性,因为其他的文章关于标签帧的描述都没有提及此属性,故而我专门去了http://id3.org/id3v2.3.0进行考证,最后在文章3.3.ID3v2 frame overview中可以看到ID3V2标签帧并没有此内容)
帧内容 至少 1 个字节
1 public static void StorageMusicFileWithID3V2Tag(File sourceFile, String musicFilePath, 2 String songName, String artistName, 3 String albumName) { 4 try { 5 RandomAccessFile musicRandomAccessFile = 6 new RandomAccessFile(sourceFile.getAbsolutePath(), "rw"); 7 musicRandomAccessFile.seek(0); 8 9 byte[] tag = new byte[3]; 10 musicRandomAccessFile.read(tag); 11 12 if (new String(tag).equals("ID3")) { 13 sourceFile.renameTo(new File(musicFilePath)); 14 return; 15 } 16 } catch (Exception e) { 17 LogFunction.error("存储音乐文件异常", e); 18 } 19 20 try { 21 byte[] encodeByte = {3}; // 03 表示的UTF8编码 22 byte[] tagByteArray; 23 byte[] tagHeadByteArray; 24 byte[] tagFrameHeadByteArray; 25 26 byte[] songNameByteArray = songName.getBytes("UTF-8"); 27 byte[] artistNameByteArray = artistName.getBytes("UTF-8"); 28 byte[] albumNameByteArray = albumName.getBytes("UTF-8"); 29 30 final int tagHeadLength = 10; 31 final int tagFrameHeadLength = 10; 32 final int tagFrameEncodeLength = 1; 33 final int tagFillByteLength = 20; // 这个填充字节是我看到其他MP3文件ID3标签都会在尾端添加的数据,为了保险起见我也加上了 34 35 int byteArrayOffset = 0; 36 int songNameByteArrayLength = songNameByteArray.length; 37 int artistNameByteArrayLength = artistNameByteArray.length; 38 int albumNameByteArrayLength = albumNameByteArray.length; 39 int songNameFrameTotalLength = songNameByteArrayLength + tagFrameEncodeLength; 40 int artistNameFrameTotalLength = artistNameByteArrayLength + tagFrameEncodeLength; 41 int albumNameFrameTotalLength = albumNameByteArrayLength + tagFrameEncodeLength; 42 43 int totalTagLength = tagHeadLength + tagFrameHeadLength + songNameByteArrayLength + 44 tagFrameHeadLength + artistNameByteArrayLength + 45 tagFrameHeadLength + albumNameByteArrayLength + 46 tagFillByteLength; 47 int tagContentLength = totalTagLength - tagHeadLength; 48 49 tagByteArray = new byte[totalTagLength]; 50 51 tagHeadByteArray = new byte[tagHeadLength]; 52 System.arraycopy("ID3".getBytes(), 0, tagHeadByteArray, 0, 3); 53 tagHeadByteArray[3] = 3; 54 tagHeadByteArray[4] = 0; 55 tagHeadByteArray[5] = 0; 56 tagHeadByteArray[6] = (byte) ((tagContentLength >> 7 >> 7 >> 7) % 128); 57 tagHeadByteArray[7] = (byte) ((tagContentLength >> 7 >> 7) % 128); 58 tagHeadByteArray[8] = (byte) ((tagContentLength >> 7) % 128); 59 tagHeadByteArray[9] = (byte) (tagContentLength % 128); 60 System.arraycopy(tagHeadByteArray, 0, tagByteArray, byteArrayOffset, 61 tagHeadLength); 62 byteArrayOffset += tagHeadLength; 63 64 tagFrameHeadByteArray = new byte[tagFrameHeadLength]; 65 System.arraycopy("TIT2".getBytes(), 0, tagFrameHeadByteArray, 0, 4); 66 tagFrameHeadByteArray[4] = (byte) ((songNameFrameTotalLength >> 8 >> 8 >> 8) % 256); 67 tagFrameHeadByteArray[5] = (byte) ((songNameFrameTotalLength >> 8 >> 8) % 256); 68 tagFrameHeadByteArray[6] = (byte) ((songNameFrameTotalLength >> 8) % 256); 69 tagFrameHeadByteArray[7] = (byte) (songNameFrameTotalLength % 256); 70 tagFrameHeadByteArray[8] = 0; 71 tagFrameHeadByteArray[9] = 0; 72 System.arraycopy(tagFrameHeadByteArray, 0, tagByteArray, byteArrayOffset, tagFrameHeadLength); 73 byteArrayOffset += tagFrameHeadLength; 74 System.arraycopy(encodeByte, 0, tagByteArray, byteArrayOffset, tagFrameEncodeLength); 75 byteArrayOffset += tagFrameEncodeLength; 76 System.arraycopy(songNameByteArray, 0, tagByteArray, byteArrayOffset, 77 songNameByteArrayLength); 78 byteArrayOffset += songNameByteArrayLength; 79 80 tagFrameHeadByteArray = new byte[tagFrameHeadLength]; 81 System.arraycopy("TPE1".getBytes(), 0, tagFrameHeadByteArray, 0, 4); 82 tagFrameHeadByteArray[4] = (byte) ((artistNameFrameTotalLength >> 8 >> 8 >> 8) % 256); 83 tagFrameHeadByteArray[5] = (byte) ((artistNameFrameTotalLength >> 8 >> 8) % 256); 84 tagFrameHeadByteArray[6] = (byte) ((artistNameFrameTotalLength >> 8) % 256); 85 tagFrameHeadByteArray[7] = (byte) (artistNameFrameTotalLength % 256); 86 tagFrameHeadByteArray[8] = 0; 87 tagFrameHeadByteArray[9] = 0; 88 System.arraycopy(tagFrameHeadByteArray, 0, tagByteArray, byteArrayOffset, tagFrameHeadLength); 89 byteArrayOffset += tagFrameHeadLength; 90 System.arraycopy(encodeByte, 0, tagByteArray, byteArrayOffset, tagFrameEncodeLength); 91 byteArrayOffset += tagFrameEncodeLength; 92 System.arraycopy(artistNameByteArray, 0, tagByteArray, byteArrayOffset, 93 artistNameByteArrayLength); 94 byteArrayOffset += artistNameByteArrayLength; 95 96 tagFrameHeadByteArray = new byte[tagFrameHeadLength]; 97 System.arraycopy("TALB".getBytes(), 0, tagFrameHeadByteArray, 0, 4); 98 tagFrameHeadByteArray[4] = (byte) ((albumNameFrameTotalLength >> 8 >> 8 >> 8) % 256); 99 tagFrameHeadByteArray[5] = (byte) ((albumNameFrameTotalLength >> 8 >> 8) % 256); 100 tagFrameHeadByteArray[6] = (byte) ((albumNameFrameTotalLength >> 8) % 256); 101 tagFrameHeadByteArray[7] = (byte) (albumNameFrameTotalLength % 256); 102 tagFrameHeadByteArray[8] = 0; 103 tagFrameHeadByteArray[9] = 0; 104 System.arraycopy(tagFrameHeadByteArray, 0, tagByteArray, byteArrayOffset, tagFrameHeadLength); 105 byteArrayOffset += tagFrameHeadLength; 106 System.arraycopy(encodeByte, 0, tagByteArray, byteArrayOffset, tagFrameEncodeLength); 107 byteArrayOffset += tagFrameEncodeLength; 108 System.arraycopy(albumNameByteArray, 0, tagByteArray, byteArrayOffset, 109 albumNameByteArrayLength); 110 111 byte[] dataByteBuffer = new byte[1024]; 112 113 FileInputStream fileInputStream = new FileInputStream(sourceFile); 114 FileOutputStream fileOutputStream = 115 FileFunction.GetFileOutputStreamFromFile(musicFilePath); 116 117 fileOutputStream.write(tagByteArray); 118 119 while (fileInputStream.read(dataByteBuffer) > 0) { 120 fileOutputStream.write(dataByteBuffer); 121 } 122 123 fileOutputStream.close(); 124 fileInputStream.close(); 125 126 FileFunction.DeleteFile(sourceFile.getAbsolutePath()); 127 } catch (Exception e) { 128 LogFunction.error("写入音乐标签异常", e); 129 } 130 }
然而有一个地方需要注意,同时这也是我认为的ID3v2标签中的一个大坑,可以跳到代码的74行看到这么一段代码: System.arraycopy(encodeByte, 0, tagByteArray, byteArrayOffset, tagEncodeLength);,同时这段代码也在代码的90行和106行出现,这段代码十分重要,原因可以参考http://blog.csdn.net/chenmeimei_8899/article/details/3901948。核心内容如下:
"关于MP3 tag的资料很多,大家可以自己去找,大概讲的都是大同小异,但是我觉得他们忘了很重要的一点,也是我忽略的,后来解析文件出错了,才恍然大悟。那就是tag信息的编码。
大家都知道每个frame的头是由10个字节组成的,具体内容我就不仔细写了,在着10个字节后有一个字节,大家可以仔细观察一下,只有四种情况 00 ,01,02,03,这个代表什么呢?这个就是表示tag的编码方式的。00代表的就是ISO-8859-1,01代表的就是UTF-16编码,02代表 UTF16BE,03表示的UTF8编码,在tag信息是不采用这种表明,但是这种编码在tag里不是错的。"
事实是http://id3.org/id3v2.3.0的3.3.ID3v2 frame overview中有这么一段:
"A tag must contain at least one frame. A frame must be at least 1 byte big, excluding the header.
If nothing else is said a string is represented as ISO-8859-1 characters in the range $20 - $FF. Such strings are represented as <text string>, or <full text string> if newlines are allowed, in the frame descriptions. All Unicode strings use 16-bit unicode 2.0 (ISO/IEC 10646-1:1993, UCS-2). Unicode strings must begin with the Unicode BOM ($FF FE or $FE FF) to identify the byte order.
All numeric strings and URLs are always encoded as ISO-8859-1. Terminated strings are terminated with $00 if encoded with ISO-8859-1 and $00 00 if encoded as unicode. If nothing else is said newline character is forbidden. In ISO-8859-1 a new line is represented, when allowed, with $0A only. Frames that allow different types of text encoding have a text encoding description byte directly after the frame size. If ISO-8859-1 is used this byte should be $00, if Unicode is used it should be $01. Strings dependent on encoding is represented as <text string according to encoding>, or <full text string according to encoding> if newlines are allowed. Any empty Unicode strings which are NULL-terminated may have the Unicode BOM followed by a Unicode NULL ($FF FE 00 00 or $FE FF 00 00).“
我的理解是这样的,一个标签至少有一帧,一帧在除去帧头后至少有一字节,就是前面描述的数据帧中的帧内容,而这个帧内容就实现了encode的功能,不过我翻了数次3.3.ID3v2 frame overview我依旧没找到"01代表的就是UTF-16编码,02代表 UTF16BE,03表示的UTF8编码"这样的细分,不知道是不是后面默认的规则,还是别的原因,如果有朋友知道请务必告诉我。另外还有个很奇怪的地方,我用HexEditor2读取的网上下载的MP3文件中,它们的ID3v2头中除了标签头和标签帧以外后面都是会有很长一段空白数据,我没有输出这段空白数据也没什么影响,不会影响标签解析,但为什么会有这么一段数据,我是没有找到原因,如果有知道的朋友请务必告诉我。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步