新客户上云 –虚拟机及相关服务常见问题集锦

本课程汇总了 Azure 新用户上云在虚拟机及相关服务(如磁盘,存储,网络)使用中遇到的常见问题和解决方案。

虚拟机常见问题之系统重启

为什么我的虚拟机会被重启?

  • Azure 平台计划内的维护和升级会造成虚拟机的升级。建议将虚拟机部署在高可用集内
  • Windows 虚拟机默认启用安全补丁自动更新并重启生效。可根据业务需求,更改为自动更新手动安装

高可用集内的虚拟机为什么还会被重启?

  • 高可用集不等同于有特殊保障的虚拟机实例
  • 高可用集内的虚拟机不会在同一时间被同时重启
  • ASM模式更改虚机的高可用集需要重启
  • ARM模式虚机创建后无法更改可用性集

当虚拟机无法连接时,有哪些可以自查的方法么?

  • 通过门户管理网站检查是否有针对虚拟机的网络访问权限的限制如 ACL,NSG
  • 虚拟机默认禁止 ping,可以用 telnet,psping,paping 等工具进行连接测试
  • 对于 ARM 虚拟机,通过启动诊断功能查看虚拟机的屏幕快照(Windows)或启动日志输出(Linux)来判断虚拟机状态

 

虚拟机常见问题之部署

如何确定 vCPU 的性能和型号?

 

  • 不同系列的虚拟机,根据其工作负荷及适用环境,底层使用了不同的硬件;
  • 官方没有明确说明CPU 型号的虚拟机系列,我们无法保证虚拟机一定能位于Intel 或AMD 的特定型号;
  • 中国区仅有Dv2 和F 系列明确使用Intel Xeon® E5。如明确要求使用Intel 处理器,可以考虑这两种机型。

为什么我的虚拟机不可以升级到某些系列( A5+, D )来提高性能?

  • 由于后台服务器硬件及资源设定,当创建云服务的第一台虚拟机时,该云服务所支持的类型就已确定
  • 通过命令来确定云服务所支持的虚拟机类型:get-azureservice| where {$_.ServiceName.Contains(“abcd")}
  • 如果虚拟机的大小调整范围较大,建议在创建时选择 A5 以上或 D 系列的。ARM模式的虚拟机同样适用 

在配置可用性集中的虚拟机时,为什么系统会有时报告存储账号问题?

对于可用集中的虚拟机,如果启用了诊断日志,请确保存储诊断日志的存储账号可用。有时管理员会误删除存储账号:

  • 对于可用性集中任何虚拟机的管理操作,后台都会先检查整个可用性集中的虚拟机的配置完整性。如果检查到存储账号不存在,则会视为错误,不会继续操作。
  • 对于只用于放诊断数据的存储账号,不会有锁机制,后台在删除时则能够成功删除存储账号。

订阅中虚拟机使用核数并没有超过总核数限制,为什么创建新虚机会失败?

在 ARM 模式中,对核数的限制是细化到每个类型的虚拟机的。某个系列虚拟创建报错,很可能是该类型核数已经达到上限。可以通过 Get-AzureRmVMUsage-Location "China East" 命令查看对资源限制的上限和用量。

虚拟机核心数存在区域总数限制,以及单独强制实施的每个大小系列(Dv2、F 等)的区域性限制。例如,假设某个订阅的中国东部VM 核心总数限制为 30,A 系列核心数限制为 30,D 系列核心数限制为 30 。此订阅允许部署 30 个A1 VM,或30 个D1 VM,或者两者的组合,但其总数不能超过 30 个核心(例如,10 个 A1 VM 和 20 个 D1 VM)。

如何选择信价比最高的虚拟机序列来满足需求?

  • 根据虚拟机负载的类型(通用内存优化计算优化)确定虚拟机系列
  • 根据 ACU 来估计此系列中的虚拟机大小,为保证生产应用性能,可以在计算结果上+1
  • 启用性能监视功能(Linux 启动文档)了解虚拟机负载情况,进一步调整

ARM 模板中中国化

GitHub 中的 Azure 快速部署模板是针对 Global Azure 开发的。在使用到中国区时,需要确认以下几点是否满足中国区环境:

  • 模板中使用的镜像是否是 中国区 Azure 所支持的,如 imagePublisher,imageOffer 等。
  • 模板中的 Endpoint 相关信息是否需要修改。根据作者习惯不同,可能会内嵌了如 windows.net 这样的全球区域名
  • 模板中除了常规资源,是否有一些 中国区 Azure 不支持的资源,如扩展等。

 

虚拟机常见问题之临时盘

临时磁盘的来源:

临时磁盘是物理机上的本地硬盘的一部分,不具有共享功能,一旦丢失,不可恢复

临时磁盘的大小:

根据虚拟机尺寸的不同,临时磁盘的大小各异。也可能随平台更新而更新

临时磁盘的性能:

临时存储是来自虚拟机运行的物理主机,一般会有更高的 IOPS 和更低的延迟

临时磁盘的目的:

临时存储最初的设计目的是用于保存系统的交换数据和页文件。

但是你也可以使用临时磁盘存放一些你可以承担随时丢失风险的临时数据。

 

虚拟机常见问题之存储性能

理解存储性能的必读宝典

存储可伸缩性和

存储性能和可伸缩性清单性能目标

高级存储的可伸缩行、性能目标、限制

  

注意事项

  • 对于标准存储账号,每个账号中的生产系统磁盘数目不高于 40 个
  • 要使用高级存储账号,先确保VM 上有足够的带宽来驱动磁盘通信。
    例如:STANDARD_DS1 (32MB/S) + P10 (100MB/S) = 32 MB/S 存储带宽
  • 严重的磁盘读写瓶颈(延时超过 120 秒)会导致虚拟机服务中断
  • 高级存储账号中,在虚拟机开机情况下对虚拟机磁盘进行如拷贝等操作会失败,这是系统设计所致。

 

虚拟机常见问题之磁盘管理

在虚拟机内部是否需要配置 Software RAID?

配置 Software RAID 有助于提高虚机存储性能,在 Azure 上,每分客户存储都具有 3 份拷贝,所以客户可以不用考虑配置带有校验位的如 RAID3、RAID5,而配置 RAID0 即可。

如何获取超额的磁盘空间?

虚拟机本身对数据磁盘的数量虚拟机大小相关。如果客户达到这个上限,可以使用 Azure File Share 服务,这样可以使用额外的 5TB SMB 共享空间。注意支持文件服务的 Linux 系统版本:

SLES 12 | Ubuntu 14.04+ | RHEL 7+ | CentOS 7+ | Debian 8

Linux LUN 0 的相关问题

将数据磁盘添加到 Linux VM 时,如果 LUN 0 位置没有磁盘,则可能会遇到错误。

如果使用 Azure VM disk attach-new 命令并指定 LUN (--lun) 来手动添加磁盘,而不是让 Azure 平台确定适当的 LUN,则请务必确认 LUN 0 已经有磁盘或者将有磁盘。

 

虚拟机常见问题之网络架构

是否可以在Azure虚拟网络内部使用 IPv6?

IPv6 在目前阶段仍不可用。过去几年,微软一直在帮助客户从 IPv4 平稳过渡到 IPv6 方面,并已在其许多产品和解决方案中建立了 IPv6 支持。在 Azure 环境中启用 IPv6 的基础工作正在进行中。

可以虚拟网络对等互连应用到任意网络之间吗?

虚拟网络对等互联只可以连接在同一个区域内的虚拟网络,并且其中之一必须以 Resource Manager 部署模型创建。

我为虚拟机申请的公有 IP 为什么会经常变动?

虚拟机绑定的非静态公有 IP 在运行时是不会变动的,但是在任何导致虚拟机在平台重新分配时,会导致 IP 变动,例如更改虚拟机尺寸,物理主机更新,物理主机故障等。建议有固定 IP 需求的环境使用保留 IP 。前 5 个保留的 IP 如果在使用中则免费,如果只保留但未使用则需要收费。

为什么云服务中的虚拟机的出站连接会失败?

根据虚拟机的不同配置方案,可能会产生不同的出站连接方式。对于ASM架构下云服务中的虚拟机,通过 SNAT 的方式连接 Internet。Azure 平台预设保留了 160 个SNAT 的映射表,当预设映射端口耗尽,新的 SNAT 端口还未分配时,会导致虚拟机对外连接失败。

如何让虚拟机得到更高的带宽?

最大网络带宽是每个 VM 分配的最大聚合带宽,其上限与 VM size 成正相关,且暂不提供官方宽带 SLA 保障。其意义是增加网卡数量不能增加虚拟机的带宽吞吐量。另外,网络带宽独立于存储的 IO 吞吐量。

 

如何选择 VPN 设备?

强烈建议使用经官方验证的 VPN 设备 以避免兼容性问题和配置问题。

如何使用 Ping 测试虚拟机的连通性?

在同一个虚拟网络内的虚拟机,可以用 ICMP Ping 来测试系统的连通性。但如果是虚拟网络之外,或是源地址和目的地址之间跨越 LB,只能 通过公有IP解决

如何设定 Azure 负载平衡器的空闲超时?

在默认配置下,Azure 负载平衡器的“空闲超时”设置是 4 分钟。如果 TCP 或 HTTP 会话不活动的时间超过这个超时值,客户端和服务之间的连接将无法保证是否可以维持下去。让连接长时间保持连接状态的常见做法是使用 TCP Keep-alive,但在特定移动端应用会有耗电影响。另外的做法是可以调整负载平衡器的空闲超时

为什么我创建的应用程序网关的规则不生效?

应用程序网关建立之后会生成默认规则,用户应当直接在默认规则上进行修改,或者删除默认规则后添加自定义规则。如果在不删除默认规则的情况下直接添加自定义规则,后者不会生效。

可否使用 Azure 默认二级域名进行 ICP 备案?

Azure 默认二级域名(Chinacloudapp.cn、Chinacloudapi.cn 和Chinacloudsites.cn)仅出于提供客户便利之用,由于无法进行 ICP 备案,不适合向外提供服务。客户需要进行自定义域名注册以及备案。否则需要承担其他用户的不合规行为而被某些应用屏蔽的风险。

如何配置 SLB 后端的 Apache 服务器?

Apache 的 Keep Alive Time out 参数默认值5秒。Azure SLB HTTP 探测也为5秒。当 HTTP 探测包正好与 Apache 发出的终止 TCP 会话时间冲突时,Apache 不会响应探测包,进而导致 Azure 认为探测失败,并将该 server 标记为 Down 。后续探测建立新的 TCP 会话后, Azure 认为探测成功,并重新将其标记为 UP。而在 Down、UP 的切换过程中,导致已登录的用户会话被重置。解决办法是将 Apache 的 Keep Alive Time out 值调大,例如 7 秒。

 立即访问http://market.azure.cn

posted on 2017-08-23 14:02  DavidZang  阅读(368)  评论(0编辑  收藏  举报