中文数字转换为阿拉伯数字

需求

今天写了三千二百行代码。
今天写了3200行代码。

两行意思相同,只是表达方式不太能够,统一掉。

 

原理

数字的特征是   数字 + 单位,例如三百,四十二,九千零二

可以从后往前遍历,遇到的是0到9的数字,就乘以前一位的单位,遇到新的单位(十百千万)就替换成数字供下一个数字用。 

举例 

五百四十三
1. 三-->3  3 <10  :  total = 3
2. 十-->10, 10 ≥10,且不为0 : r = 10
3. 四-->4, 4<10 : total = 3 + 4*10 = 43
4. 百-->100, 10 0≥10,且不为0 : r = 100
5. 五-->5, 5<10 : total = 43 + 5*100 = 543 

 

参考代码

#-*- coding: cp936 -*-
import re
import string

common_used_numerals_tmp ={'':0, '':1, '':2, '':2, '':3, '':4, '':5, '':6, '':7, '':8, '':9, '':10, '':100, '':1000, '':10000, '亿':100000000}
common_used_numerals = {}
for key in common_used_numerals_tmp:
    common_used_numerals[key.decode('cp936')] = common_used_numerals_tmp[key]

def chinese2digits(uchars_chinese):
    total = 0
    r = 1                           #表示单位:个十百千...
    for i in range(len(uchars_chinese) - 1, -1, -1):
        val = common_used_numerals.get(uchars_chinese[i])
        if val >= 10 and i == 0:    #应对 十三 十四 十*之类
            if val > r:
                r = val
                total = total +  val
            else:
                r = r * val
                #total =total +  r * x 
        elif val >= 10:
            if val > r:
                r = val
            else:
                r = r * val
        else:
            total = total +  r * val
    
    return total


print chinese2digits('两百三十二'.decode('cp936'))
print "-------------------------"
print chinese2digits('十二'.decode('cp936'))
print "-------------------------"
print chinese2digits('一亿零八万零三百二十三'.decode('cp936'))

 

结果

 

posted @ 2014-03-07 19:54  jihite  阅读(19420)  评论(5编辑  收藏  举报