精通-Python-网络编程第二版(五)
精通 Python 网络编程第二版(五)
原文:
zh.annas-archive.org/md5/dda7e4d1dd78bc5577547014ce9b53d1
译者:飞龙
第十二章:使用 Jenkins 进行持续集成
网络触及技术堆栈的每个部分;在我工作过的所有环境中,它总是一个零级服务。它是其他服务依赖的基础服务。在其他工程师、业务经理、运营商和支持人员的心目中,网络应该只是工作。它应该始终可访问并且功能正常——一个好的网络是一个没有人听说过的网络。
当然,作为网络工程师,我们知道网络和其他技术堆栈一样复杂。由于其复杂性,构成运行网络的构件有时可能很脆弱。有时,我看着一个网络,想知道它怎么可能工作,更不用说它是如何在数月甚至数年内运行而没有对业务产生影响的。
我们对网络自动化感兴趣的部分原因是为了找到可靠和一致地重复我们的网络变更流程的方法。通过使用 Python 脚本或 Ansible 框架,我们可以确保所做的变更保持一致并可靠地应用。正如我们在上一章中看到的,我们可以使用 Git 和 GitHub 可靠地存储流程的组件,如模板、脚本、需求和文件。构成基础设施的代码是经过版本控制、协作和对变更负责的。但我们如何将所有这些部分联系在一起呢?在本章中,我们将介绍一个流行的开源工具,可以优化网络管理流程,名为 Jenkins。
传统的变更管理流程
对于在大型网络环境中工作过的工程师来说,他们知道网络变更出错的影响可能很大。我们可以进行数百次变更而没有任何问题,但只需要一个糟糕的变更就能导致网络对业务产生负面影响。
关于网络故障导致业务痛苦的故事数不胜数。2011 年最显著和大规模的 AWS EC2 故障是由于我们在 AWS US-East 地区的正常扩展活动中的网络变更引起的。变更发生在 PDT 时间 00:47,并导致各种服务出现 12 小时以上的停机,给亚马逊造成了数百万美元的损失。更重要的是,这个相对年轻的服务的声誉受到了严重打击。IT 决策者将这次故障作为“不要”迁移到 AWS 云的理由。花了多年时间才重建了其声誉。您可以在aws.amazon.com/message/65648/
阅读更多关于事故报告的信息。
由于其潜在影响和复杂性,在许多环境中,都实施了网络变更咨询委员会(CAB)。典型的 CAB 流程如下:
-
网络工程师将设计变更并详细列出所需的步骤。这可能包括变更的原因、涉及的设备、将要应用或删除的命令、如何验证输出以及每个步骤的预期结果。
-
通常要求网络工程师首先从同行那里获得技术审查。根据变更的性质,可能需要不同级别的同行审查。简单的变更可能需要单个同行技术审查;复杂的变更可能需要高级指定工程师批准。
-
CAB 会议通常按照固定时间安排,也可以临时召开紧急会议。
-
工程师将变更提交给委员会。委员会将提出必要的问题,评估影响,并批准或拒绝变更请求。
-
变更将在预定的变更窗口进行,由原始工程师或其他工程师执行。
这个过程听起来合理和包容,但在实践中证明有一些挑战:
-
撰写文稿耗时:设计工程师通常需要花费很多时间来撰写文档,有时写作过程所需时间比应用变更的时间还长。这通常是因为所有网络更改都可能产生影响,我们需要为技术和非技术 CAB 成员记录过程。
-
工程师专业知识:有不同水平的工程专业知识,有些经验更丰富,他们通常是最受欢迎的资源。我们应该保留他们的时间来解决最复杂的网络问题,而不是审查基本的网络更改。
-
会议耗时:组织会议和让每个成员出席需要很多精力。如果需要批准的人员正在度假或生病会发生什么?如果您需要在预定的 CAB 时间之前进行网络更改呢?
这些只是基于人的 CAB 流程的一些更大的挑战。就我个人而言,我非常讨厌 CAB 流程。我不否认对同行审查和优先级排序的需求;但是,我认为我们需要尽量减少潜在的开销。让我们看看在软件工程流程中采用的潜在流程。
持续集成简介
在软件开发中的持续集成(CI)是一种快速发布对代码库的小更改的方式,同时进行测试和验证。关键是对可以进行 CI 兼容的更改进行分类,即不过于复杂,并且足够小,以便可以轻松撤销。测试和验证过程是以自动化方式构建的,以获得对其将被应用而不会破坏整个系统的信心基线。
在 CI 之前,对软件的更改通常是以大批量进行的,并且通常需要一个漫长的验证过程。开发人员可能需要几个月才能看到他们的更改在生产中生效,获得反馈并纠正任何错误。简而言之,CI 流程旨在缩短从想法到变更的过程。
一般的工作流程通常包括以下步骤:
-
第一位工程师获取代码库的当前副本并进行更改
-
第一位工程师向仓库提交变更
-
仓库可以通知需要的人员仓库的变化,以便一组工程师审查变化。他们可以批准或拒绝变更
-
持续集成系统可以持续地从仓库中获取变更,或者当变更发生时,仓库可以向 CI 系统发送通知。无论哪种方式,CI 系统都将获取代码的最新版本
-
CI 系统将运行自动化测试,以尝试捕捉任何故障
-
如果没有发现故障,CI 系统可以选择将更改合并到主代码中,并可选择部署到生产系统
这是一个概括的步骤列表。对于每个组织,流程可能会有所不同;例如,可以在提交增量代码后立即运行自动化测试,而不是在代码审查后运行。有时,组织可能选择在步骤之间进行人工工程师参与进行理智检查。
在下一节中,我们将说明在 Ubuntu 16.04 系统上安装 Jenkins 的说明。
安装 Jenkins
在本章中我们将使用的示例中,我们可以在管理主机或单独的机器上安装 Jenkins。我个人偏好将其安装在单独的虚拟机上。到目前为止,虚拟机将具有与管理主机相似的网络设置,一个接口用于互联网连接,另一个接口用于 VMNet 2 连接到 VIRL 管理网络。
Jenkins 镜像和每个操作系统的安装说明可以在jenkins.io/download/
找到。以下是我在 Ubuntu 16.04 主机上安装 Jenkins 所使用的说明:
$ wget -q -O - https://pkg.jenkins.io/debian-stable/jenkins.io.key | sudo apt-key add -
# added Jenkins to /etc/apt/sources.list
$ cat /etc/apt/sources.list | grep jenkins
deb https://pkg.jenkins.io/debian-stable binary/
# install Java8
$ sudo add-apt-repository ppa:webupd8team/java
$ sudo apt update; sudo apt install oracle-java8-installer
$ sudo apt-get update
$ sudo apt-get install jenkins
# Start Jenkins
$ /etc/init.d/jenkins start
在撰写本文时,我们必须单独安装 Java,因为 Jenkins 不适用于 Java 9;有关更多详细信息,请参阅issues.jenkins-ci.org/browse/JENKINS-40689
。希望在您阅读本文时,该问题已得到解决。
Jenkins 安装完成后,我们可以将浏览器指向端口8080
的 IP 地址以继续该过程:
解锁 Jenkins 屏幕
如屏幕上所述,从/var/lib/jenkins/secrets/initialAdminPassword
获取管理员密码,并将输出粘贴到屏幕上。暂时,我们将选择“安装建议的插件”选项:
安装建议的插件
创建管理员用户后,Jenkins 将准备就绪。如果您看到 Jenkins 仪表板,则安装成功:
Jenkins 仪表板
我们现在准备使用 Jenkins 来安排我们的第一个作业。
Jenkins 示例
在本节中,我们将看一些 Jenkins 示例以及它们如何与本书中涵盖的各种技术联系在一起。Jenkins 之所以是本书的最后一章,是因为它将利用许多其他工具,例如我们的 Python 脚本、Ansible、Git 和 GitHub。如有需要,请随时参阅第十一章,使用 Git。
在示例中,我们将使用 Jenkins 主服务器来执行我们的作业。在生产中,建议添加 Jenkins 节点来处理作业的执行。
在我们的实验中,我们将使用一个简单的带有 IOSv 设备的两节点拓扑结构:
第十二章实验拓扑
让我们构建我们的第一个作业。
Python 脚本的第一个作业
对于我们的第一个作业,让我们使用我们在第二章中构建的 Parmiko 脚本,低级网络设备交互,chapter2_3.py
。如果您还记得,这是一个使用Paramiko
对远程设备进行ssh
并获取设备的show run
和show version
输出的脚本:
$ ls
chapter12_1.py
$ python3 /home/echou/Chapter12/chapter12_1.py
...
$ ls
chapter12_1.py iosv-1_output.txt iosv-2_output.txt
我们将使用“创建新作业”链接来创建作业,并选择“自由风格项目”选项:
示例 1 自由风格项目
我们将保留所有默认设置和未选中的内容;选择“执行 shell”作为构建选项:
示例 1 构建步骤
当提示出现时,我们将输入与 shell 中使用的确切命令:
示例 1shell 命令
一旦我们保存了作业配置,我们将被重定向到项目仪表板。我们可以选择立即构建选项,作业将出现在构建历史下:
示例 1 构建
您可以通过单击作业并在左侧面板上选择“控制台输出”来检查构建的状态:
示例 1 控制台输出
作为可选步骤,我们可以按照固定间隔安排此作业,就像 cron 为我们所做的那样。作业可以在“构建触发器”下安排,选择“定期构建”并输入类似 cron 的计划。在此示例中,脚本将每天在 02:00 和 22:00 运行。
示例 1 构建触发器
我们还可以在 Jenkins 上配置 SMTP 服务器以允许构建结果的通知。首先,我们需要在主菜单下的“管理 Jenkins | 配置系统”中配置 SMTP 服务器设置:
示例 1 配置系统
我们将在页面底部看到 SMTP 服务器设置。单击“高级设置”以配置 SMTP 服务器设置以及发送测试电子邮件:
示例 1 配置 SMTP
我们将能够配置电子邮件通知作为作业的后续操作的一部分:
示例 1 电子邮件通知
恭喜!我们刚刚使用 Jenkins 创建了我们的第一个作业。从功能上讲,这并没有比我们的管理主机实现更多的功能。然而,使用 Jenkins 有几个优点:
-
我们可以利用 Jenkins 的各种数据库认证集成,比如 LDAP,允许现有用户执行我们的脚本。
-
我们可以使用 Jenkins 的基于角色的授权来限制用户。例如,一些用户只能执行作业而没有修改访问权限,而其他用户可以拥有完全的管理访问权限。
-
Jenkins 提供了一个基于 Web 的图形界面,允许用户轻松访问脚本。
-
我们可以使用 Jenkins 的电子邮件和日志服务来集中我们的作业并收到结果通知。
Jenkins 本身就是一个很好的工具。就像 Python 一样,它有一个庞大的第三方插件生态系统,可以用来扩展其功能和功能。
Jenkins 插件
我们将安装一个简单的计划插件作为说明插件安装过程的示例。插件在“管理 Jenkins | 管理插件”下进行管理:
Jenkins 插件
我们可以使用搜索功能在可用选项卡下查找计划构建插件:
Jenkins 插件搜索
然后,我们只需点击“安装而不重启”,我们就能在接下来的页面上检查安装进度:
Jenkins 插件安装
安装完成后,我们将能够看到一个新的图标,允许我们更直观地安排作业:
Jenkins 插件结果
作为一个流行的开源项目的优势之一是能够随着时间的推移而增长。对于 Jenkins 来说,插件提供了一种为不同的客户需求定制工具的方式。在接下来的部分,我们将看看如何将版本控制和批准流程集成到我们的工作流程中。
网络持续集成示例
在这一部分,让我们将我们的 GitHub 存储库与 Jenkins 集成。通过集成 GitHub 存储库,我们可以利用 GitHub 的代码审查和协作工具。
首先,我们将创建一个新的 GitHub 存储库,我将把这个存储库称为chapter12_example2
。我们可以在本地克隆这个存储库,并将我们想要的文件添加到存储库中。在这种情况下,我正在添加一个将show version
命令的输出复制到文件中的 Ansible playbook:
$ cat chapter12_playbook.yml
---
- name: show version
hosts: "ios-devices"
gather_facts: false
connection: local
vars:
cli:
host: "{{ ansible_host }}"
username: "{{ ansible_user }}"
password: "{{ ansible_password }}"
tasks:
- name: show version
ios_command:
commands: show version
provider: "{{ cli }}"
register: output
- name: show output
debug:
var: output.stdout
- name: copy output to file
copy: content="{{ output }}" dest=./output/{{ inventory_hostname }}.txt
到目前为止,我们应该已经非常熟悉了运行 Ansible playbook。我将跳过host_vars
和清单文件的输出。然而,最重要的是在提交到 GitHub 存储库之前验证它在本地机器上运行:
$ ansible-playbook -i hosts chapter12_playbook.yml
PLAY [show version] **************************************************************
TASK [show version] **************************************************************
ok: [iosv-1]
ok: [iosv-2]
...
TASK [copy output to file] *******************************************************
changed: [iosv-1]
changed: [iosv-2]
PLAY RECAP ***********************************************************************
iosv-1 : ok=3 changed=1 unreachable=0 failed=0
iosv-2 : ok=3 changed=1 unreachable=0 failed=0
我们现在可以将 playbook 和相关文件推送到我们的 GitHub 存储库:
示例 2GitHub 存储库
让我们重新登录 Jenkins 主机安装git
和 Ansible:
$ sudo apt-get install git
$ sudo apt-get install software-properties-common
$ sudo apt-get update
$ sudo apt-get install ansible
一些工具可以在全局工具配置下安装;Git 就是其中之一。然而,由于我们正在安装 Ansible,我们可以在同一个命令提示符下安装 Git:
全局工具配置
我们可以创建一个名为chapter12_example2
的新自由样式项目。在源代码管理下,我们将指定 GitHub 存储库作为源:
示例 2 源代码管理
在我们进行下一步之前,让我们保存项目并运行构建。在构建控制台输出中,我们应该能够看到存储库被克隆,索引值与我们在 GitHub 上看到的匹配:
示例 2 控制台输出 1
现在我们可以在构建部分中添加 Ansible playbook 命令:
示例 2 构建 shell
如果我们再次运行构建,我们可以从控制台输出中看到 Jenkins 将在执行 Ansible playbook 之前从 GitHub 获取代码:
示例 2 构建控制台输出 2
将 GitHub 与 Jenkins 集成的好处之一是我们可以在同一个屏幕上看到所有 Git 信息:
示例 2 Git 构建数据
项目的结果,比如 Ansible playbook 的输出,可以在workspace
文件夹中看到:
示例 2 工作空间
此时,我们可以按照之前的步骤使用周期性构建作为构建触发器。如果 Jenkins 主机是公开访问的,我们还可以使用 GitHub 的 Jenkins 插件将 Jenkins 作为构建的触发器。这是一个两步过程,第一步是在您的 GitHub 存储库上启用插件:
示例 2 GitHub Jenkins 服务
第二步是将 GitHub 挂钩触发器指定为我们项目的构建触发器:
示例 2 Jenkins 构建触发器
将 GitHub 存储库作为源,可以为处理基础设施提供全新的可能性。我们现在可以使用 GitHub 的分叉、拉取请求、问题跟踪和项目管理工具来高效地共同工作。一旦代码准备就绪,Jenkins 可以自动拉取代码并代表我们执行。
您会注意到我们没有提到任何关于自动化测试的内容。我们将在第十三章中讨论测试,网络驱动开发。
Jenkins 是一个功能齐全的系统,可能会变得复杂。我们在本章中只是浅尝辄止。Jenkins 流水线、环境设置、多分支流水线等都是非常有用的功能,可以适应最复杂的自动化项目。希望本章能为您进一步探索 Jenkins 工具提供有趣的介绍。
使用 Python 与 Jenkins
Jenkins 为其功能提供了完整的 REST API:wiki.jenkins.io/display/JENKINS/Remote+access+API
。还有许多 Python 包装器,使交互更加容易。让我们来看看 Python-Jenkins 包:
$ sudo pip3 install python-jenkins
$ python3
>>> import jenkins
>>> server = jenkins.Jenkins('http://192.168.2.123:8080', username='<user>', password='<pass>')
>>> user = server.get_whoami()
>>> version = server.get_version()
>>> print('Hello %s from Jenkins %s' % (user['fullName'], version))
Hello Admin from Jenkins 2.121.2
我们可以与服务器管理一起工作,比如插件
:
>>> plugin = server.get_plugins_info()
>>> plugin
[{'supportsDynamicLoad': 'MAYBE', 'downgradable': False, 'requiredCoreVersion': '1.642.3', 'enabled': True, 'bundled': False, 'shortName': 'pipeline-stage-view', 'url': 'https://wiki.jenkins-ci.org/display/JENKINS/Pipeline+Stage+View+Plugin', 'pinned': False, 'version': 2.10, 'hasUpdate': False, 'deleted': False, 'longName': 'Pipeline: Stage View Plugin', 'active': True, 'backupVersion': None, 'dependencies': [{'shortName': 'pipeline-rest-api', 'version': '2.10', 'optional': False}, {'shortName': 'workflow-job', 'version': '2.0', 'optional': False}, {'shortName': 'handlebars', 'version': '1.1', 'optional': False}...
我们还可以管理 Jenkins 作业:
>>> job = server.get_job_config('chapter12_example1')
>>> import pprint
>>> pprint.pprint(job)
("<?xml version='1.1' encoding='UTF-8'?>\n"
'<project>\n'
' <actions/>\n'
' <description>Paramiko Python Script for Show Version and Show '
'Run</description>\n'
' <keepDependencies>false</keepDependencies>\n'
' <properties>\n'
' <jenkins.model.BuildDiscarderProperty>\n'
' <strategy class="hudson.tasks.LogRotator">\n'
' <daysToKeep>10</daysToKeep>\n'
' <numToKeep>5</numToKeep>\n'
' <artifactDaysToKeep>-1</artifactDaysToKeep>\n'
' <artifactNumToKeep>-1</artifactNumToKeep>\n'
' </strategy>\n'
' </jenkins.model.BuildDiscarderProperty>\n'
' </properties>\n'
' <scm class="hudson.scm.NullSCM"/>\n'
' <canRoam>true</canRoam>\n'
' <disabled>false</disabled>\n'
' '
'<blockBuildWhenDownstreamBuilding>false</blockBuildWhenDownstreamBuilding>\n'
' <blockBuildWhenUpstreamBuilding>false</blockBuildWhenUpstreamBuilding>\n'
' <triggers>\n'
' <hudson.triggers.TimerTrigger>\n'
' <spec>0 2,20 * * *</spec>\n'
' </hudson.triggers.TimerTrigger>\n'
' </triggers>\n'
' <concurrentBuild>false</concurrentBuild>\n'
' <builders>\n'
' <hudson.tasks.Shell>\n'
' <command>python3 /home/echou/Chapter12/chapter12_1.py</command>\n'
' </hudson.tasks.Shell>\n'
' </builders>\n'
' <publishers/>\n'
' <buildWrappers/>\n'
'</project>')
>>>
使用 Python-Jenkins 使我们有一种以编程方式与 Jenkins 进行交互的方法。
网络连续集成
连续集成在软件开发领域已经被采用了一段时间,但在网络工程领域相对较新。我们承认,在网络基础设施中使用连续集成方面我们有些落后。毫无疑问,当我们仍在努力摆脱使用 CLI 来管理设备时,将我们的网络视为代码是一项挑战。
有许多很好的使用 Jenkins 进行网络自动化的例子。其中一个是由 Tim Fairweather 和 Shea Stewart 在 AnsibleFest 2017 网络跟踪中提出的:www.ansible.com/ansible-for-networks-beyond-static-config-templates
。另一个用例是由 Dyn 的 Carlos Vicente 在 NANOG 63 上分享的:www.nanog.org/sites/default/files/monday_general_autobuild_vicente_63.28.pdf
。
即使持续集成对于刚开始学习编码和工具集的网络工程师来说可能是一个高级话题,但在我看来,值得努力学习和在生产中使用持续集成。即使在基本水平上,这种经验也会激发出更多创新的网络自动化方式,无疑会帮助行业向前发展。
总结
在本章中,我们研究了传统的变更管理流程,以及为什么它不适合当今快速变化的环境。网络需要与业务一起发展,变得更加敏捷,能够快速可靠地适应变化。
我们研究了持续集成的概念,特别是开源的 Jenkins 系统。Jenkins 是一个功能齐全、可扩展的持续集成系统,在软件开发中被广泛使用。我们安装并使用 Jenkins 来定期执行基于Paramiko
的 Python 脚本,并进行电子邮件通知。我们还看到了如何安装 Jenkins 的插件来扩展其功能。
我们看了如何使用 Jenkins 与我们的 GitHub 存储库集成,并根据代码检查触发构建。通过将 Jenkins 与 GitHub 集成,我们可以利用 GitHub 的协作流程。
在第十三章中,《面向网络的测试驱动开发》,我们将学习如何使用 Python 进行测试驱动开发。
第十三章:网络的测试驱动开发
测试驱动开发(TDD)的想法已经存在一段时间了。美国软件工程师肯特·贝克等人通常被认为是带领 TDD 运动的人,同时也是敏捷软件开发的领导者。敏捷软件开发需要非常短的构建-测试-部署开发周期;所有的软件需求都被转化为测试用例。这些测试用例通常是在编写代码之前编写的,只有当测试通过时,软件代码才会被接受。
相同的想法也可以与网络工程并行。当我们面临设计现代网络的挑战时,我们可以将这个过程分解为以下步骤:
-
我们从新网络的整体需求开始。为什么我们需要设计一个新的网络或部分新的网络?也许是为了新的服务器硬件,新的存储网络,或者新的微服务软件架构。
-
新的需求被分解为更小、更具体的需求。这可以是查看新的交换机平台,更高效的路由协议,或者新的网络拓扑(例如,fat-tree)。每个更小的需求都可以分解为必须和可选的类别。
-
我们制定测试计划,并根据潜在的解决方案进行评估。
-
测试计划将按相反的顺序进行;我们将从测试功能开始,然后将新功能集成到更大的拓扑中。最后,我们将尽可能接近生产环境来运行我们的测试。
关键是,即使我们没有意识到,我们可能已经在网络工程中采用了测试驱动的开发方法。这是我在学习 TDD 思维方式时的一部分启示。我们已经在不正式规范方法的情况下隐式地遵循了这一最佳实践。
通过逐渐将网络的部分作为代码移动,我们可以更多地使用 TDD 来进行网络。如果我们的网络拓扑以 XML 或 JSON 的分层格式描述,每个组件都可以正确映射并以所需的状态表达。这是我们可以编写测试用例的期望状态。例如,如果我们的期望状态要求交换机的全网状,我们可以始终编写一个测试用例来检查我们的生产设备的 BGP 邻居数量。
测试驱动开发概述
TDD 的顺序大致基于以下六个步骤:
-
以结果为目标编写测试
-
运行所有测试,看新测试是否失败
-
编写代码
-
再次运行测试
-
如果测试失败,则进行必要的更改
-
重复
我只是松散地遵循指南。TDD 过程要求在编写任何代码之前编写测试用例,或者在我们的情况下,在构建网络的任何组件之前。出于个人偏好的原因,我总是喜欢在编写测试用例之前看到一个工作的网络或代码版本。这给了我更高的信心水平。我也在测试的级别之间跳来跳去;有时我测试网络的一小部分;其他时候我进行系统级的端到端测试,比如 ping 或 traceroute 测试。
关键是,我不认为在测试方面有一种适合所有情况的方法。这取决于个人偏好和项目的范围。这对我合作过的大多数工程师来说都是真的。牢记框架是个好主意,这样我们就有了一个可行的蓝图,但你是解决问题风格的最佳评判者。
测试定义
让我们来看看 TDD 中常用的一些术语:
-
单元测试:检查小段代码。这是针对单个函数或类运行的测试。
-
集成测试:检查代码库的多个组件;多个单元组合在一起并作为一个组进行测试。这可以是针对 Python 模块或多个模块的测试
-
系统测试:端到端检查。这是一个尽可能接近最终用户所看到的测试
-
功能测试:针对单个功能的检查
-
测试覆盖:一个术语,用于确定我们的测试用例是否覆盖了应用程序代码。通常通过检查运行测试用例时有多少代码被执行来完成这一点。
-
测试装置:形成运行测试的基线的固定状态。测试装置的目的是确保测试运行在一个众所周知和固定的环境中,以便它们是可重复的
-
设置和拆卸:所有先决步骤都添加在设置中,并在拆卸中清理
这些术语可能看起来非常侧重于软件开发,并且有些可能与网络工程无关。请记住,这些术语是我们用来传达概念或步骤的一种方式,我们将在本章的其余部分中使用这些术语。随着我们在网络工程上下文中更多地使用这些术语,它们可能会变得更清晰。让我们深入探讨将网络拓扑视为代码。
拓扑作为代码
在我们宣称网络太复杂,无法总结成代码之前!让我们保持开放的心态。如果我告诉您,我们已经在本书中使用代码来描述我们的拓扑,这会有所帮助吗?
如果您查看本书中使用的任何 VIRL 拓扑图,它们只是包含节点之间关系描述的 XML 文件。
在本章中,我们将使用以下拓扑进行实验:
如果我们用文本编辑器打开拓扑文件chapter13_topology.virl
,我们会看到该文件是一个描述节点和节点之间关系的 XML 文件。顶级根节点是带有<node>
子节点的<topology>
节点。每个子节点都包含各种扩展和条目。设备配置也嵌入在文件中:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<topology schemaVersion="0.95" xsi:schemaLocation="http://www.cisco.com/VIRL https://raw.github.com/CiscoVIRL/schema/v0.95/virl.xsd">
<extensions>
<entry key="management_network" type="String">flat</entry>
</extensions>
<node name="iosv-1" type="SIMPLE" subtype="IOSv" location="182,162" ipv4="192.168.0.3">
<extensions>
<entry key="static_ip" type="String">172.16.1.20</entry>
<entry key="config" type="string">! IOS Config generated on 2018-07-24 00:23
! by autonetkit_0.24.0
!
hostname iosv-1
boot-start-marker
boot-end-marker
!
...
</node>
<node name="nx-osv-1" type="SIMPLE" subtype="NX-OSv" location="281,161" ipv4="192.168.0.1">
<extensions>
<entry key="static_ip" type="String">172.16.1.21</entry>
<entry key="config" type="string">! NX-OSv Config generated on 2018-07-24 00:23
! by autonetkit_0.24.0
!
version 6.2(1)
license grace-period
!
hostname nx-osv-1
...
<node name="host2" type="SIMPLE" subtype="server" location="347,66">
<extensions>
<entry key="static_ip" type="String">172.16.1.23</entry>
<entry key="config" type="string">#cloud-config
bootcmd:
- ln -s -t /etc/rc.d /etc/rc.local
hostname: host2
manage_etc_hosts: true
runcmd:
- start ttyS0
- systemctl start getty@ttyS0.service
- systemctl start rc-local
<annotations/>
<connection dst="/virl:topology/virl:node[1]/virl:interface[1]" src="/virl:topology/virl:node[3]/virl:interface[1]"/>
<connection dst="/virl:topology/virl:node[2]/virl:interface[1]" src="/virl:topology/virl:node[1]/virl:interface[2]"/>
<connection dst="/virl:topology/virl:node[4]/virl:interface[1]" src="/virl:topology/virl:node[2]/virl:interface[2]"/>
</topology>
通过将网络表示为代码,我们可以为我们的网络声明一个真理源。我们可以编写测试代码来比较实际生产值与此蓝图。我们将使用此拓扑文件作为基础,并将生产网络值与其进行比较。但首先,我们需要从 XML 文件中获取我们想要的值。在chapter13_1_xml.py
中,我们将使用ElementTree
来解析virl
拓扑文件,并构建一个包含我们设备信息的字典:
#!/usr/env/bin python3
import xml.etree.ElementTree as ET
import pprint
with open('chapter13_topology.virl', 'rt') as f:
tree = ET.parse(f)
devices = {}
for node in tree.findall('./{http://www.cisco.com/VIRL}node'):
name = node.attrib.get('name')
devices[name] = {}
for attr_name, attr_value in sorted(node.attrib.items()):
devices[name][attr_name] = attr_value
# Custom attributes
devices['iosv-1']['os'] = '15.6(3)M2'
devices['nx-osv-1']['os'] = '7.3(0)D1(1)'
devices['host1']['os'] = '16.04'
devices['host2']['os'] = '16.04'
pprint.pprint(devices)
结果是一个 Python 字典,其中包含根据我们的拓扑文件的设备。我们还可以向字典中添加习惯项目:
$ python3 chapter13_1_xml.py
{'host1': {'location': '117,58',
'name': 'host1',
'os': '16.04',
'subtype': 'server',
'type': 'SIMPLE'},
'host2': {'location': '347,66',
'name': 'host2',
'os': '16.04',
'subtype': 'server',
'type': 'SIMPLE'},
'iosv-1': {'ipv4': '192.168.0.3',
'location': '182,162',
'name': 'iosv-1',
'os': '15.6(3)M2',
'subtype': 'IOSv',
'type': 'SIMPLE'},
'nx-osv-1': {'ipv4': '192.168.0.1',
'location': '281,161',
'name': 'nx-osv-1',
'os': '7.3(0)D1(1)',
'subtype': 'NX-OSv',
'type': 'SIMPLE'}}
我们可以使用我们在第三章中的示例,API 和意图驱动网络,cisco_nxapi_2.py
,来检索 NX-OSv 版本。当我们结合这两个文件时,我们可以比较我们从拓扑文件中收到的值以及生产设备信息。我们可以使用 Python 内置的unittest
模块编写测试用例。
我们稍后将讨论unittest
模块。如果您愿意,可以跳过并回到这个例子。
以下是chapter13_2_validation.py
中相关的unittest
部分:
import unittest
# Unittest Test case
class TestNXOSVersion(unittest.TestCase):
def test_version(self):
self.assertEqual(nxos_version, devices['nx-osv-1']['os'])
if __name__ == '__main__':
unittest.main()
当我们运行验证测试时,我们可以看到测试通过了,因为生产中的软件版本与我们预期的相匹配:
$ python3 chapter13_2_validation.py
.
----------------------------------------------------------------------
Ran 1 test in 0.000s
OK
如果我们手动更改预期的 NX-OSv 版本值以引入失败案例,我们将看到以下失败的输出:
$ python3 chapter13_3_test_fail.py
F
======================================================================
FAIL: test_version (__main__.TestNXOSVersion)
----------------------------------------------------------------------
Traceback (most recent call last):
File "chapter13_3_test_fail.py", line 50, in test_version
self.assertEqual(nxos_version, devices['nx-osv-1']['os'])
AssertionError: '7.3(0)D1(1)' != '7.4(0)D1(1)'
- 7.3(0)D1(1)
? ^
+ 7.4(0)D1(1)
? ^
----------------------------------------------------------------------
Ran 1 test in 0.004s
FAILED (failures=1)
我们可以看到测试用例的结果返回为失败;失败的原因是两个值之间的版本不匹配。
Python 的 unittest 模块
在前面的例子中,我们看到了如何使用assertEqual()
方法来比较两个值,以返回True
或False
。以下是内置的unittest
模块比较两个值的示例:
$ cat chapter13_4_unittest.py
#!/usr/bin/env python3
import unittest
class SimpleTest(unittest.TestCase):
def test(self):
one = 'a'
two = 'a'
self.assertEqual(one, two)
使用python3
命令行界面,unittest
模块可以自动发现脚本中的测试用例:
$ python3 -m unittest chapter13_4_unittest.py
.
----------------------------------------------------------------------
Ran 1 test in 0.000s
OK
除了比较两个值之外,这里还有更多的例子,测试预期值是否为True
或False
。当发生失败时,我们还可以生成自定义的失败消息:
$ cat chapter13_5_more_unittest.py
#!/usr/bin/env python3
# Examples from https://pymotw.com/3/unittest/index.html#module-unittest
import unittest
class Output(unittest.TestCase):
def testPass(self):
return
def testFail(self):
self.assertFalse(True, 'this is a failed message')
def testError(self):
raise RuntimeError('Test error!')
def testAssesrtTrue(self):
self.assertTrue(True)
def testAssertFalse(self):
self.assertFalse(False)
我们可以使用-v
选项来显示更详细的输出:
$ python3 -m unittest -v chapter13_5_more_unittest.py
testAssertFalse (chapter13_5_more_unittest.Output) ... ok
testAssesrtTrue (chapter13_5_more_unittest.Output) ... ok
testError (chapter13_5_more_unittest.Output) ... ERROR
testFail (chapter13_5_more_unittest.Output) ... FAIL
testPass (chapter13_5_more_unittest.Output) ... ok
======================================================================
ERROR: testError (chapter13_5_more_unittest.Output)
----------------------------------------------------------------------
Traceback (most recent call last):
File "/home/echou/Master_Python_Networking_second_edition/Chapter13/chapter13_5_more_unittest.py", line 14, in testError
raise RuntimeError('Test error!')
RuntimeError: Test error!
======================================================================
FAIL: testFail (chapter13_5_more_unittest.Output)
----------------------------------------------------------------------
Traceback (most recent call last):
File "/home/echou/Master_Python_Networking_second_edition/Chapter13/chapter13_5_more_unittest.py", line 11, in testFail
self.assertFalse(True, 'this is a failed message')
AssertionError: True is not false : this is a failed message
----------------------------------------------------------------------
Ran 5 tests in 0.001s
FAILED (failures=1, errors=1)
从 Python 3.3 开始,unittest
模块默认包含module
对象库(docs.python.org/3/library/unittest.mock.html
)。这是一个非常有用的模块,可以对远程资源进行假的 HTTP API 调用,而无需实际进行调用。例如,我们已经看到了使用 NX-API 来检索 NX-OS 版本号的示例。如果我们想运行我们的测试,但没有 NX-OS 设备可用怎么办?我们可以使用unittest
模拟对象。
在chapter13_5_more_unittest_mocks.py
中,我们创建了一个简单的类,其中包含一个用于进行 HTTP API 调用并期望 JSON 响应的方法:
# Our class making API Call using requests
class MyClass:
def fetch_json(self, url):
response = requests.get(url)
return response.json()
我们还创建了一个模拟两个 URL 调用的函数:
# This method will be used by the mock to replace requests.get
def mocked_requests_get(*args, **kwargs):
class MockResponse:
def __init__(self, json_data, status_code):
self.json_data = json_data
self.status_code = status_code
def json(self):
return self.json_data
if args[0] == 'http://url-1.com/test.json':
return MockResponse({"key1": "value1"}, 200)
elif args[0] == 'http://url-2.com/test.json':
return MockResponse({"key2": "value2"}, 200)
return MockResponse(None, 404)
最后,我们在我们的测试用例中对两个 URL 进行 API 调用。然而,我们使用mock.patch
装饰器来拦截 API 调用:
# Our test case class
class MyClassTestCase(unittest.TestCase):
# We patch 'requests.get' with our own method. The mock object is passed in to our test case method.
@mock.patch('requests.get', side_effect=mocked_requests_get)
def test_fetch(self, mock_get):
# Assert requests.get calls
my_class = MyClass()
# call to url-1
json_data = my_class.fetch_json('http://url-1.com/test.json')
self.assertEqual(json_data, {"key1": "value1"})
# call to url-2
json_data = my_class.fetch_json('http://url-2.com/test.json')
self.assertEqual(json_data, {"key2": "value2"})
# call to url-3 that we did not mock
json_data = my_class.fetch_json('http://url-3.com/test.json')
self.assertIsNone(json_data)
if __name__ == '__main__':
unittest.main()
当我们运行测试时,我们会看到测试通过,而无需实际调用远程端点的 API:
$ python3 -m unittest -v chapter13_5_more_unittest_mocks.py
test_fetch (chapter13_5_more_unittest_mocks.MyClassTestCase) ... ok
----------------------------------------------------------------------
Ran 1 test in 0.001s
OK
有关unittest
模块的更多信息,Doug Hellmann 的 Python 模块一周(pymotw.com/3/unittest/index.html#module-unittest
)是一个关于unittest
模块的简短而精确的示例的绝佳来源。一如既往,Python 文档也是一个很好的信息来源:docs.python.org/3/library/unittest.html
。
更多关于 Python 测试的内容
除了内置的unittest
库之外,社区中还有许多其他 Python 测试框架。Pytest 是另一个强大的 Python 测试框架,值得一看。pytest
可以用于各种类型和级别的软件测试。它可以被开发人员、QA 工程师、练习测试驱动开发的个人和开源项目使用。许多大型开源项目已经从unittest
或nose
转换到pytest
,包括 Mozilla 和 Dropbox。pytest
的主要吸引力在于第三方插件模型、简单的装置模型和断言重写。
如果您想了解更多关于pytest
框架的信息,我强烈推荐 Brian Okken 的Python Testing with PyTest(ISBN 978-1-68050-240-4)。另一个很好的来源是pytest
文档:docs.pytest.org/en/latest/
。
pytest
是命令行驱动的;它可以自动找到我们编写的测试并运行它们:
$ sudo pip install pytest
$ sudo pip3 install pytest
$ python3
Python 3.5.2 (default, Nov 23 2017, 16:37:01)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pytest
>>> pytest.__version__
'3.6.3'
让我们看一些使用pytest
的例子。
pytest 示例
第一个pytest
示例将是对两个值的简单断言:
$ cat chapter13_6_pytest_1.py
#!/usr/bin/env python3
def test_passing():
assert(1, 2, 3) == (1, 2, 3)
def test_failing():
assert(1, 2, 3) == (3, 2, 1)
当您使用-v
选项运行时,pytest
将为我们提供一个相当强大的失败原因的答案:
$ pytest -v chapter13_6_pytest_1.py
============================== test session starts ===============================
platform linux -- Python 3.5.2, pytest-3.6.3, py-1.5.4, pluggy-0.6.0 -- /usr/bin/python3
cachedir: .pytest_cache
rootdir: /home/echou/Master_Python_Networking_second_edition/Chapter13, inifile:
collected 2 items
chapter13_6_pytest_1.py::test_passing PASSED [ 50%]
chapter13_6_pytest_1.py::test_failing FAILED [100%]
==================================== FAILURES ====================================
__________________________________ test_failing __________________________________
def test_failing():
> assert(1, 2, 3) == (3, 2, 1)
E assert (1, 2, 3) == (3, 2, 1)
E At index 0 diff: 1 != 3
E Full diff:
E - (1, 2, 3)
E ? ^ ^
E + (3, 2, 1)
E ? ^ ^
chapter13_6_pytest_1.py:7: AssertionError
======================= 1 failed, 1 passed in 0.03 seconds =======================
在第二个示例中,我们将创建一个router
对象。router
对象将使用一些值进行初始化,其中一些值为None
,另一些值为默认值。我们将使用pytest
来测试一个具有默认值的实例和一个没有默认值的实例:
$ cat chapter13_7_pytest_2.py
#!/usr/bin/env python3
class router(object):
def __init__(self, hostname=None, os=None, device_type='cisco_ios'):
self.hostname = hostname
self.os = os
self.device_type = device_type
self.interfaces = 24
def test_defaults():
r1 = router()
assert r1.hostname == None
assert r1.os == None
assert r1.device_type == 'cisco_ios'
assert r1.interfaces == 24
def test_non_defaults():
r2 = router(hostname='lax-r2', os='nxos', device_type='cisco_nxos')
assert r2.hostname == 'lax-r2'
assert r2.os == 'nxos'
assert r2.device_type == 'cisco_nxos'
assert r2.interfaces == 24
当我们运行测试时,我们将看到实例是否准确地应用了默认值:
$ pytest chapter13_7_pytest_2.py
============================== test session starts ===============================
platform linux -- Python 3.5.2, pytest-3.6.3, py-1.5.4, pluggy-0.6.0
rootdir: /home/echou/Master_Python_Networking_second_edition/Chapter13, inifile:
collected 2 items
chapter13_7_pytest_2.py .. [100%]
============================ 2 passed in 0.04 seconds ============================
如果我们要用pytest
替换之前的unittest
示例,在chapter13_8_pytest_3.py
中,我们将有一个简单的测试用例:
# pytest test case
def test_version():
assert devices['nx-osv-1']['os'] == nxos_version
然后我们使用pytest
命令行运行测试:
$ pytest chapter13_8_pytest_3.py
============================== test session starts ===============================
platform linux -- Python 3.5.2, pytest-3.6.3, py-1.5.4, pluggy-0.6.0
rootdir: /home/echou/Master_Python_Networking_second_edition/Chapter13, inifile:
collected 1 item
chapter13_8_pytest_3.py . [100%]
============================ 1 passed in 0.19 seconds ============================
如果我们为自己编写测试,我们可以自由选择任何模块。在unittest
和pytest
之间,我发现pytest
是一个更直观的工具。然而,由于unittest
包含在标准库中,许多团队可能更喜欢使用unittest
模块进行测试。
编写网络测试
到目前为止,我们大多数时间都在为我们的 Python 代码编写测试。我们使用了unittest
和pytest
库来断言True/False
和equal/Non-equal
值。我们还能够编写模拟来拦截我们的 API 调用,当我们没有实际的 API 可用设备但仍想运行我们的测试时。
几年前,Matt Oswalt 宣布了Testing On Demand: Distributed(ToDD)验证工具,用于测试网络连接和分布式容量。这是一个旨在测试网络连通性和分布式容量的开源框架。您可以在其 GitHub 页面上找到有关该项目的更多信息:github.com/toddproject/todd
。Oswalt 还在 Packet Pushers Priority Queue 81 上谈到了该项目,标题是 Network Testing with ToDD:packetpushers.net/podcast/podcasts/pq-show-81-network-testing-todd/
。
在这一部分,让我们看看如何编写与网络世界相关的测试。在网络监控和测试方面,商业产品并不少见。多年来,我接触过许多这样的产品。然而,在这一部分,我更喜欢使用简单的开源工具进行测试。
可达性测试
通常,故障排除的第一步是进行小范围的可达性测试。对于网络工程师来说,ping
是我们在进行网络可达性测试时的好朋友。这是一种通过向目的地发送一个小数据包来测试 IP 网络上主机可达性的方法。
我们可以通过OS
模块或subprocess
模块自动化ping
测试:
>>> import os
>>> host_list = ['www.cisco.com', 'www.google.com']
>>> for host in host_list:
... os.system('ping -c 1 ' + host)
...
PING e2867.dsca.akamaiedge.net (69.192.206.157) 56(84) bytes of data.
64 bytes from a69-192-206-157.deploy.static.akamaitechnologies.com (69.192.206.157): icmp_seq=1 ttl=54 time=14.7 ms
--- e2867.dsca.akamaiedge.net ping statistics ---
1 packets transmitted, 1 received, 0% packet loss, time 0ms
rtt min/avg/max/mdev = 14.781/14.781/14.781/0.000 ms
0
PING www.google.com (172.217.3.196) 56(84) bytes of data.
64 bytes from sea15s12-in-f196.1e100.net (172.217.3.196): icmp_seq=1 ttl=54 time=12.8 ms
--- www.google.com ping statistics ---
1 packets transmitted, 1 received, 0% packet loss, time 0ms
rtt min/avg/max/mdev = 12.809/12.809/12.809/0.000 ms
0
>>>
subprocess
模块提供了捕获输出的额外好处:
>>> import subprocess
>>> for host in host_list:
... print('host: ' + host)
... p = subprocess.Popen(['ping', '-c', '1', host], stdout=subprocess.PIPE)
... print(p.communicate())
...
host: www.cisco.com
(b'PING e2867.dsca.akamaiedge.net (69.192.206.157) 56(84) bytes of data.\n64 bytes from a69-192-206-157.deploy.static.akamaitechnologies.com (69.192.206.157): icmp_seq=1 ttl=54 time=14.3 ms\n\n--- e2867.dsca.akamaiedge.net ping statistics ---\n1 packets transmitted, 1 received, 0% packet loss, time 0ms\nrtt min/avg/max/mdev = 14.317/14.317/14.317/0.000 ms\n', None)
host: www.google.com
(b'PING www.google.com (216.58.193.68) 56(84) bytes of data.\n64 bytes from sea15s07-in-f68.1e100.net (216.58.193.68): icmp_seq=1 ttl=54 time=15.6 ms\n\n--- www.google.com ping statistics ---\n1 packets transmitted, 1 received, 0% packet loss, time 0ms\nrtt min/avg/max/mdev = 15.695/15.695/15.695/0.000 ms\n', None)
>>>
这两个模块在许多情况下都非常有用。我们可以通过OS
或subprocess
模块执行在 Linux 和 Unix 环境中可以执行的任何命令。
网络延迟测试
网络延迟的话题有时可能是主观的。作为网络工程师,我们经常面对用户说网络很慢的情况。然而,慢是一个非常主观的词。如果我们能构建测试,将主观的词转化为客观的值,那将非常有帮助。我们应该始终如一地这样做,这样我们就可以比较一系列数据的值。
这有时可能很难做到,因为网络是无状态的设计。成功发送一个数据包并不保证下一个数据包也会成功。多年来我见过的最好的方法就是经常使用 ping 跨多个主机,并记录数据,进行 ping-mesh 图。我们可以利用前面示例中使用的相同工具,捕获返回结果的时间,并保留记录:
$ cat chapter13_10_ping.py
#!/usr/bin/env python3
import subprocess
host_list = ['www.cisco.com', 'www.google.com']
ping_time = []
for host in host_list:
p = subprocess.Popen(['ping', '-c', '1', host], stdout=subprocess.PIPE)
result = p.communicate()[0]
host = result.split()[1]
time = result.split()[14]
ping_time.append((host, time))
print(ping_time)
在这种情况下,结果被保存在一个元组中,并放入一个列表中:
$ python3 chapter13_10_ping.py
[(b'e2867.dsca.akamaiedge.net', b'time=13.8'), (b'www.google.com', b'time=14.8')]
这绝不是完美的,只是监控和故障排除的起点。然而,在没有其他工具的情况下,这提供了一些客观值的基线。
安全测试
我们已经在第六章中看到了我认为是用 Python 进行网络安全测试的最佳工具,即 Scapy。有很多开源安全工具,但没有一个能提供构建数据包的灵活性。
网络安全测试的另一个很好的工具是hping3
(www.hping.org/
)。它提供了一种简单的方法来一次生成大量的数据包。例如,您可以使用以下一行命令生成 TCP Syn flood:
# DON'T DO THIS IN PRODUCTION #
echou@ubuntu:/var/log$ sudo hping3 -S -p 80 --flood 192.168.1.202
HPING 192.168.1.202 (eth0 192.168.1.202): S set, 40 headers + 0 data bytes
hping in flood mode, no replies will be shown
^C
--- 192.168.1.202 hping statistic ---
2281304 packets transmitted, 0 packets received, 100% packet loss
round-trip min/avg/max = 0.0/0.0/0.0 ms
echou@ubuntu:/var/log$
同样,由于这是一个命令行工具,我们可以使用subprocess
模块来自动化任何我们想要的hping3
测试。
交易测试
网络是基础设施的重要组成部分,但它只是其中的一部分。用户关心的通常是运行在网络之上的服务。如果用户试图观看 YouTube 视频或收听播客却无法做到,他们会认为服务出现了故障。我们可能知道这不是网络传输的问题,但这并不能让用户感到安慰。
因此,我们应该实施尽可能接近用户体验的测试。在 YouTube 视频的例子中,我们可能无法 100%复制 YouTube 体验(除非你是 Google 的一部分),但我们可以尽可能接近网络边缘实现第七层服务。然后,我们可以模拟来自客户端的交易作为事务性测试。
Python 的HTTP
标准库模块是我在需要快速测试第七层可达性的 Web 服务时经常使用的模块:
# Python 2
$ python -m SimpleHTTPServer 8080
Serving HTTP on 0.0.0.0 port 8080 ...
127.0.0.1 - - [25/Jul/2018 10:14:39] "GET / HTTP/1.1" 200 -
# Python 3
$ python3 -m http.server 8080
Serving HTTP on 0.0.0.0 port 8080 ...
127.0.0.1 - - [25/Jul/2018 10:15:23] "GET / HTTP/1.1" 200 -
如果我们可以模拟预期服务的完整交易,那就更好了。但是标准库中的 Python 简单HTTP
服务器模块始终是运行一些临时 Web 服务测试的好选择。
网络配置测试
在我看来,对网络配置的最佳测试是使用标准化模板生成配置并经常备份生产配置。我们已经看到了如何使用 Jinja2 模板来根据设备类型或角色标准化我们的配置。这将消除许多由人为错误引起的错误,比如复制和粘贴。
一旦配置生成,我们可以针对我们在将配置推送到生产设备之前期望的已知特征编写测试。例如,在网络的所有部分中,当涉及到环回 IP 时,IP 地址不应重叠,因此我们可以编写一个测试来查看新配置是否包含在我们的设备中唯一的环回 IP。
测试 Ansible
在我使用 Ansible 的时间里,我记不起来使用类似unittest
的工具来测试 Playbook。在大多数情况下,Playbooks 使用了模块,这些模块是由模块开发人员测试过的。
Ansible 为他们的模块库提供单元测试。目前,Ansible 中的单元测试是从 Python 驱动测试的唯一方式。今天运行的单元测试可以在/test/units
(github.com/ansible/ansible/tree/devel/test/units
)下找到。
可以在以下文档中找到 Ansible 测试策略:
-
测试 Ansible:
docs.ansible.com/ansible/2.5/dev_guide/testing.html
-
单元测试:
docs.ansible.com/ansible/2.5/dev_guide/testing_units.html
-
单元测试 Ansible 模块:
docs.ansible.com/ansible/2.5/dev_guide/testing_units_modules.html
Ansible 测试框架中有一个有趣的工具是molecule (pypi.org/project/molecule/2.16.0/
)。它旨在帮助开发和测试 Ansible 角色。Molecule 支持使用多个实例、操作系统和发行版进行测试。我没有使用过这个工具,但如果我想对我的 Ansible 角色进行更多测试,这是我会开始的地方。
Jenkins 中的 Pytest
持续集成(CI)系统,如 Jenkins,经常用于在每次代码提交后启动测试。这是使用 CI 系统的主要好处之一。想象一下,有一个隐形的工程师一直在观察网络中的任何变化;在检测到变化后,工程师将忠实地测试一堆功能,以确保没有任何故障。谁不想要这样的工程师呢?
让我们看一个将pytest
集成到 Jenkins 任务中的例子。
Jenkins 集成
在我们将测试用例插入到我们的持续集成之前,让我们安装一些可以帮助我们可视化操作的插件。我们将安装的两个插件是 build-name-setter 和 Test Result Analyzer:
Jenkins 插件安装
我们将运行的测试将会连接到 NXOS 设备并检索操作系统版本号。这将确保我们可以通过 API 访问 Nexus 设备。完整的脚本内容可以在chapter13_9_pytest_4.py
中阅读,相关的pytest
部分和结果如下:
def test_transaction():
assert nxos_version != False
## Test Output
$ pytest chapter13_9_pytest_4.py
============================== test session starts ===============================
platform linux -- Python 3.5.2, pytest-3.6.3, py-1.5.4, pluggy-0.6.0
rootdir: /home/echou/Chapter13, inifile:
collected 1 item
chapter13_9_pytest_4.py . [100%]
============================ 1 passed in 0.13 seconds ============================
我们将使用--junit-xml=results.xml
选项来生成 Jenkins 需要的文件:
$ pytest --junit-xml=results.xml chapter13_9_pytest_4.py
$ cat results.xml
<?xml version="1.0" encoding="utf-8"?><testsuite errors="0" failures="0" name="pytest" skips="0" tests="1" time="0.134"><testcase classname="chapter13_9_pytest_4" file="chapter13_9_pytest_4.py" line="25" name="test_transaction" time="0.0009090900421142578"></testcase></testsuite>
下一步将是将此脚本检入 GitHub 存储库。我倾向于将测试放在其目录下。因此,我创建了一个/test
目录,并将测试文件放在那里:
项目存储库
我们将创建一个名为chapter13_example1
的新项目:
第十三章示例 1
我们可以复制上一个任务,这样我们就不需要重复所有步骤:
从第十二章示例 2 复制任务
在执行 shell 部分,我们将添加pytest
步骤:
项目执行 shell
我们将添加一个发布 JUnit 测试结果报告的构建后步骤:
构建后步骤
我们将指定results.xml
文件作为 JUnit 结果文件:
测试报告 XML 位置
运行构建几次后,我们将能够看到测试结果分析器图表:
测试结果分析器
测试结果也可以在项目主页上看到。让我们通过关闭 Nexus 设备的管理接口来引入一个测试失败。如果有测试失败,我们将能够立即在项目仪表板上的测试结果趋势图上看到它:
测试结果趋势
这是一个简单但完整的例子。我们可以将测试集成到 Jenkins 中的许多方式。
总结
在本章中,我们看了测试驱动开发以及如何将其应用于网络工程。我们从 TDD 的概述开始;然后我们看了使用unittest
和pytest
Python 模块的示例。Python 和简单的 Linux 命令行工具可以用来构建各种测试,包括网络可达性、配置和安全性。
我们还看了如何在 Jenkins 中利用测试,这是一个持续集成工具。通过将测试集成到我们的 CI 工具中,我们可以更加确信我们的更改是合理的。至少,我们希望在用户之前捕捉到任何错误。
简而言之,如果没有经过测试,就不能信任。我们网络中的一切都应尽可能地进行程序化测试。与许多软件概念一样,测试驱动开发是一个永无止境的服务轮。我们努力实现尽可能多的测试覆盖率,但即使在 100%的测试覆盖率下,我们总是可以找到新的方法和测试用例来实现。这在网络中尤其如此,网络通常是互联网,而互联网的 100%测试覆盖是不可能的。