mol 文件格式简单解析(v2000)
前言
.mol
文件是常见的化学文件格式,主要包含分子的坐标、分子间的键等数据。
示例文件
下面是一个水分子的 .mol
文件
H2O
APtclcactv05052315543D 0 0.00000 0.00000
3 2 0 0 0 0 0 0 0 0999 V2000
-0.0000 -0.0589 -0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
-0.8110 0.4677 0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
0.8110 0.4677 0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
1 2 1 0 0 0 0
1 3 1 0 0 0 0
M END
文件组成
文件头部
共有3行组成,第一行是文件名或者化学式,第二行是创建的程序名和相关的信息,第三行是注释行,默认为空。
计数行
计数行代表下面的原子数等,格式如下,如数字不够三位则前一位以空格填充
aaabbblllfffcccsssxxxrrrpppiiimmmvvvvvv
占位符 | 解释 |
---|---|
aaa |
原子个数,最大 255 个 |
bbb |
化学键个数,最大 255 个 |
lll |
原子列表个数,最大 30 个 |
fff |
弃用 |
ccc |
手性,0 代表无手性,1 代表有有手性 |
sss - iii |
弃用 |
mmm |
弃用,代表分子其他属性值行数,现在新文件默认为 999 |
aaa |
原子个数,最大 255 个 |
vvvvvv |
一般为 v2000,也有 v3000 |
原子块
下面数行(数量与 aaa
一致)为原子的位置信息,格式如下
xxxxx.xxxxyyyyy.yyyyzzzzz.zzzz aaaddcccssshhhbbbvvvHHHrrriiimmmnnneee
占位符 | 解释 | 备注 |
---|---|---|
x 、y 、z |
原子的位置信息,单位为埃,为5位整数(包含负号)和4位小数 | |
aaa |
元素类型 | |
dd |
原子质量差异(同位素),取值范围为[-3, 4] | |
ccc |
电荷数,0 = 无电荷, 1 = +3, 2 = +2, 3 = +1, 4 = 双自由基, 5 = -1, 6 = -2, 7 = -3 |
|
sss - eee |
其他参数,基本不用 |
化学键块
之后数行是化学键的信息,格式如下
111222tttsssxxxrrrccc
占位符 | 解释 | 备注 |
---|---|---|
111 |
自 1 开始的原子序号 | |
222 |
自 1 开始的原子序号 | |
ttt |
类型,1 = 单键, 2 = 双键, 3 = 三键, 4 = 芳香环 |
|
sss |
手性,1 = 左手,2 = 右手 |
|
xxx - ccc |
其他参数,基本不用 |
属性块
M
开头来表示一个属性,一行为一个属性,属性块最后一行用 M END
结尾,常用属性如 M CHG 8 aaa vvv
代表分子中某原子的带电属性,其中 8
该行可以写 1~8 个 aaa vvv
,aaa
代表原子序号,vvv
代表电荷值