yaml文件读取load()、写入dump()

yaml简介

1、yaml [ˈjæməl]: Yet Another Markup Language :另一种标记语言。yaml 是专门用来写配置文件的语言,非常简洁和强大。它实质上是一种通用的数据串行化格式。YAML 是一种非常灵活的格式,几乎是 JSON 的超集。除了支持注释、换行符分隔、多行字符串、裸字符串和更灵活的类型系统之外,YAML 也支持引用文件,以避免重复代码。

2、在自动化测试中,通常使用yaml文件来编写自动化测试用例。例如:

 

3、yaml基本语法规则:

  • 大小写敏感
  • 使用缩进表示层级关系
  • 缩进时不允许使用Tab键,只允许使用空格。
  • 缩进的空格数目不重要,只要相同层级的元素左侧对齐即可
  • #表示注释,从这个字符一直到行尾,都会被解析器忽略,这个和python的注释一样

4、yaml支持的数据结构有三种:

  • 对象:键值对的集合,又称为映射(mapping)/ 哈希(hashes) / 字典(dictionary)
  • 数组:一组按次序排列的值,又称为序列(sequence) / 列表(list)
  • 纯量(scalars):单个的、不可再分的值。字符串、布尔值、整数、浮点数、Null、时间、日期

5、python中,文件后缀名为.yml与.yaml的文件表示作用相同,即yaml文件;一般来说,最常用的使用.yml作为yaml文件后缀名。例如:

6、一个在线网站,用于校验yaml文件格式是否正确: http://www.bejson.com/validators/yaml/ 

安装yaml

使用pip安装pyyaml模块:

pip install pyyaml

yaml文件支持的数据结构举例

1、yaml里面的键值对,也就是python里面的字典(dict)数据类型;比如python字典:

# python3.6
{
"user": "admin",
"psw": "123456,
}

在yaml文件里可以这样写:

# yaml
user: admin
psw: 123456

2、字典嵌套字典:

# python3.6
"nb1": {
        "user": "admin",
        "psw": "123456,
        }

yaml文件里可以这样写:

# yaml
nb1:
    user: admin
    psw: 123456

yaml文件中的序列(list)

yaml文件里面写一个数组,需要在前面加一个‘-’符号。如下:

- admin1: 123456
- admin2: 111111
- admin3: 222222

对应python里面的list数据类型:

[{'admin1': 123456}],
[{'admin2': 111111}], 
[{'admin3': 222222}]

注意:数字读出来的是int或float类型

yaml文件中的纯量(str)

1、int和float类型的数字

n1: 12.30 

对应python中的

{'n1': 12.3}

2、布尔值用true和false表示

n2: true 
n3: false 

对应python中的

{'n2': True, 'n3': False}

注意:与从文本中读出来的json格式的字符串通过反序列化转为python数据类型相同。

3、None用~表示。

n4: ~

对应python中的

{'n4': None}

注意:从文本中读取出来的json格式的字符串是null的时候转换成python数据类型是None。

4、时间采用 ISO8601 格式

time1: 2001-12-14t21:59:43.10-05:00

对应python中的

{'time1': datetime.datetime(2001, 12, 15, 2, 59, 43, 100000)}

5、日期采用复合 iso8601 格式的年、月、日表示。

date1: 2017-07-31

对应python中的

{'date1': datetime.date(2017, 7, 31)}

6、使用两个感叹号,强制转换数据类型。

# int转str
n6: !!str 123  

对应python中的

{'n6': '123'}
# bool值转str
n7: !!str true

对应python中的

{'n7': 'true'}

举例:在yaml文件写入以下内容:

n1: 12.30
n2: true
n3: false
n4: ~
time1: 2018-04-18t21:59:43.10+08:00
date1: 2018-04-18
n6: !!str 123
n7: !!str true

python读取结果:

{'n1': 12.3, 
'n2': True, 
'n3': False, 
'n4': None, 
'time1': datetime.datetime(2018, 4, 18, 13, 59, 43, 100000), 
'date1': datetime.date(2018, 4, 18), 
'n6': '123', 
'n7': 'true'}

混合使用

1、list嵌套dict,在yaml里面写入如下内容:

- user: admin1
  psw: '123456'

- user: admin2
  psw: '111111'

- user: admin3
  psw: '222222'

用python读取出来的结果:

[{'user': 'admin1', 'psw': '123456'},
{'user': 'admin2', 'psw': '111111'},
{'user': 'admin3', 'psw': '222222'}]

2、dict嵌套list,在yaml里面写入如下内容:

nub1:
    - admin1
    - '123456'

nb2:
    - admin2
    - '111111'

nb3:
    - admin3
    - '222222'

用python读取出来的结果:

{'nub1': ['admin1', '123456'],
'nb2': ['admin2', '111111'], 
'nb3': ['admin3', '222222']}

使用python的load()方法读取yaml文件内容【反序列化】

data=yaml.load(f,Loader=yaml.FullLoader)

在 yaml.load 方法中, loader 参数有四种:

①BaseLoader:载入大部分的基础YAML
②SafeLoader:载入YAML的子集,推荐在不可信的输入时使用
③FullLoader:这是默认的载入方式,载入全部YAML
④UnsafeLoader:老版本的载入方式

注意:

需要加上参数: Loader=yaml.FullLoader 

否则会报错: YAMLLoadWarning: calling yaml.load() without Loader=... is deprecated, as the default Loader is unsafe. Please read https://msg.pyyaml.org/load for full details. 

如图:

 举例1:

import yaml
 
def main():
    with open("./data.yaml","r") as f:
    data=yaml.load(f,Loader=yaml.FullLoader)
    print(data)
 
if __name__ == '__main__':
    main()

举例2:

# coding:utf-8
import yaml
import os

# 获取当前脚本所在文件夹路径
curPath = os.path.dirname(os.path.realpath(__file__))

# 获取yaml文件路径
yamlPath = os.path.join(curPath, "cfgyaml.yaml")

# open方法打开直接读出来
f = open(yamlPath, 'r', encoding='utf-8')
cfg = f.read()

print(type(cfg))  # 读出来是字符串
print(cfg)

d = yaml.load(cfg,Loader=yaml.FullLoader) # 用load方法将json字符串转换字典类型

print(d) print(type(d))

运行结果:

使用python的safe_load()方法读取yaml文件内容【反序列化】

使用 yaml.safe_load() 方法,这个只解析基本的yaml标记,用来保证代码的安全性,不过这对于平常保存数据是足够了。

源码如下:

def safe_load(stream):
    """
    Parse the first YAML document in a stream
    and produce the corresponding Python object.

    Resolve only basic YAML tags. This is known
    to be safe for untrusted input.
    """
    return load(stream, SafeLoader)

def load(stream, Loader=None):
    """
    Parse the first YAML document in a stream
    and produce the corresponding Python object.
    """
    if Loader is None:
        load_warning('load')
        Loader = FullLoader

    loader = Loader(stream)
    try:
        return loader.get_single_data()
    finally:
        loader.dispose()

可以看到 safe_load() 方法就是在load方法中传入SafeLoader的解析器,那么yaml有些什么Loader呢?

①UnsfeLoader & Loader

The original Loader code that could be easily exploitable by untrusted data input.

②SafeLoader:

Loads a subset of the YAML language, safely. This is recommended for loading untrusted input.

安全的加载yaml语言子集,对于加载不受信任的输入,推荐使用此种方式 yaml.safe_load()

③FullLoader:

Loads the full YAML language. Avoids arbitrary code execution. This is currently (PyYAML 5.1) the default loader called by yaml.load(input) (after issuing the warning).

加载完整的yaml语言,从上方的源码可以看出这个是loade()默认的加载方式

④BaseLoader:

Only loads the most basic YAML

只加载最基本的yaml

 safe_load()方法举例:

a.yml文件:

代码如下:

import yaml
from string import Template


def yaml_template(data: dict):
    with open("a.yml", encoding="utf-8") as f:
        re = Template(f.read()).substitute(data)

        return yaml.load(stream=re, Loader=yaml.FullLoader)


if __name__ == '__main__':
    print(yaml_template({'token': 'hdadhh21uh1283hashdhuhh2hd', 'username': 'admin', 'password': '123456'}))

运行结果:

{'method': 'get', 'url': 'http://www.baidu.com', 'headers': {'Content-Type': 'application/json', 'token': 'hdadhh21uh1283hashdhuhh2hd'}, 'data': {'username': 'admin', 'password': 123456}}

使用python的dump()方法将python字典写入yaml文件【序列化】

yaml.dump(data,f,encoding='utf-8',allow_unicode=True)

当data数据中有汉字时,加上: encoding='utf-8',allow_unicode=True 

举例:

import os

import yaml

yaml_dict = {
    "user": "general",
    "country": "China",
    "gender": "male",
    "address": "北京"
}
yaml_dir = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'a.yml')
with open(yaml_dir, 'w', encoding='utf-8', ) as f:
    yaml.dump(yaml_dict, f, encoding='utf-8', allow_unicode=True)

运行结果:

如果在写入yaml文件不加 encoding='utf-8',allow_unicode=True 参数时,即:

import os

import yaml

yaml_dict = {
    "user": "general",
    "country": "China",
    "gender": "male",
    "address": "北京"
}
yaml_dir = os.path.join(os.path.dirname(os.path.realpath(__file__)), 'a.yml')
with open(yaml_dir, 'w', encoding='utf-8', ) as f:
    yaml.dump(yaml_dict, f)

运行结果:

如上图,如果在写入yaml文件不加 encoding='utf-8',allow_unicode=True可以看到汉字是以unicode码写入到yaml文件当中。

在实际使用的时候可以配合,输入参数更新配置文件中的参数使用:

def merge_config(config,args):
    for key_1 in config.keys():
        if(isinstance(config[key_1],dict)):
            for key_2 in config[key_1].keys():
                if(key_2) in dir(args):
                    config[key_1][key_2] = getattr(args,key_2)
    return config
 
config = yaml.load(open(args.config, 'r', encoding='utf-8'),Loader=yaml.FullLoader)
config = merge_config(config,args)

 

posted @ 2021-09-28 17:46  习久性成  阅读(16386)  评论(1编辑  收藏  举报