Python:通过执行100万次打印来比较C和python的性能,以及用C和python结合来解决性能问题的方法 .
python作为动态语言,开发效率相当高,但如我们所知,动态语言的执行效率往往是比较低的,请看下面简单的测试过程:
一、 C语言实现100万次打印:
代码:
- #include<stdio.h>
- #include <time.h>
- int main(int argc, char* argv[])
- {
- unsigned long i = 1;
- unsigned long ulNum = 1000000;
- clock_t start, finish;
- double duration;
- start = clock();
- while (ulNum != 0)
- {
- printf("\nThe ulNum is: %u ", i);
- ulNum--;
- i++;
- }
- finish = clock();
- duration = (double)(finish - start) / CLOCKS_PER_SEC;
- printf( "\n Use Time: %f seconds\n", duration );
- system("pause");
- return 0;
- }
测试:
可看出,执行了约489秒。
二、python实现100万次打印:
代码:
- #!/usr/bin/env python
- # -*- coding: utf-8 -*-
- import time
- import os
- time_begin = time.clock()
- i = 1
- ulNum = 1000000
- while (ulNum != 0):
- print "The ulNum is: %u " % i
- ulNum -= 1
- i += 1
- print "Use time: %s" % (time.clock() - time_begin)
- os.system("pause")
测试:
可看出,执行了约675秒。
三、性能问题解决方法:
通过上面的比较,可以看出,同样一个算法,C和python执行所需要的时间相差180多秒,所以我们需要一个解决方法,使编程既有python般的开发效率,又有C般的执行效率,所以我们想到如果将python程序中消耗性能最大的语句用C来实现,将会比较好地解决此问题,当然,实现方法可能有多种,本文仅通过python调用dll的方法来实现,其他方法后续再分析。
思路如下:
1、将程序中循环部分用C实现,并封装为一个dll;
2、在python中调用此dll来计算;
方案实现:
1、制作dll,使用VC可以很方便的制作一个dll出来,代码如下,编译一下就会生成一个test_dll.dll文件,注意编译成Release版本。
- // test_dll.cpp : Defines the entry point for the DLL application.
- //
- #include "stdafx.h"
- #include <stdio.h>
- BOOL APIENTRY DllMain( HANDLE hModule,
- DWORD ul_reason_for_call,
- LPVOID lpReserved
- )
- {
- return TRUE;
- }
- extern "C" _declspec(dllexport) void print_sum(unsigned long ulNum)
- {
- unsigned long i = 1;
- while (ulNum != 0)
- {
- printf("\nThe ulNum is: %u ", i);
- ulNum--;
- i++;
- }
- }
2、使用python调用test_dll.dll文件,代码如下:
- import os
- import ctypes
- import time
- time_begin = time.clock()
- test_dll = ctypes.cdll.LoadLibrary('test_dll.dll')
- test_dll.print_sum(1000000)
- print "Use time: %s" % (time.clock() - time_begin)
- os.system("pause")
3、测试一下这次的执行时间:
这次我们用了507秒,可以看出和C程序运行结果的差不多。
四、后记
通过pyhton调用dll文件仅是提高性能的一个办法,如C和python混合编程等方法均可实现此目的,具体请见后续博文。