参考资料:https://www.cnblogs.com/miaoxiaochao/p/13234589.html
一、Faker模块是什么?
- 一个Python第三方模块,主要用来创建伪数据
- 无需再手动生成或者手写随机数来生成数据,是否faker提供的方法,即可完成数据的生成
二、使用背景介绍
- 在软件测试过程中,我们经常需要使用一些测试数据,针对这种情况,我们一般要么使用已有的系统数据,要么需要手动制造一些数据。
- 在手动制造数据的过程中,可能需要花费大量精力和工作量。现在有faker,就可以很方便的完成这些事情。
三、Faker模块应用
3.1 faker模块安装
pip install faker
3.2 基础使用
from faker import Faker
f=Faker(locale='zh_CN') # 为生成数据的文化选项,默认为en_US,只有使用了相关文化,才能生成相对应的随机信息
for i in range(10):
print( f.name() + " : " + f.address() ) # 随机生成中文姓名和地址
上述代码执行完毕后,大家会发现能随机生成中文姓名和地址。及name()函数能生成姓名,address()函数能生成地址。
3.3 常用函数介绍
city_suffix():市,县
country():国家
country_code():国家编码
district():区
geo_coordinate():地理坐标
latitude():地理坐标(纬度)
longitude():地理坐标(经度)
lexify():替换所有问号(“?”)带有随机字母的事件。
numerify():三位随机数字
postcode():邮编
province():省份
street_address():街道地址
street_name():街道名
street_suffix():街、路
random_digit():0~9随机数
random_digit_not_null():1~9的随机数
random_element():随机字母
random_int():随机数字,默认0~9999,可以通过设置min,max来设置
random_letter():随机字母
random_number():随机数字,参数digits设置生成的数字位数
color_name():随机颜色名
hex_color():随机HEX颜色
rgb_color():随机RGB颜色
safe_color_name():随机安全色名
safe_hex_color():随机安全HEX颜色
bs():随机公司服务名
company():随机公司名(长)
company_prefix():随机公司名(短)
company_suffix():公司性质
credit_card_expire():随机信用卡到期日,类似08/21格式
credit_card_full():生成完整信用卡信息
credit_card_number():信用卡号
credit_card_provider():信用卡类型
credit_card_security_code():信用卡安全码
currency_code():货币编码
am_pm():AM/PM
century():随机世纪
date():随机日期
date_between():随机生成指定范围内日期,不加参数类似2012-12-23,参数:start_date,end_date取值:具体日期或者today,-30d,-30y类似
f.date_between(start_date='-30d',end_date='today')
date_between_dates():随机生成指定范围内日期,用法同上
date_object():随机生产从1970-1-1到指定日期的随机日期。
date_this_month():
date_this_year():
date_time():随机生成指定时间(1970年1月1日至今)
date_time_ad():生成公元1年到现在的随机时间
date_time_between():用法同dates 类似2020-12-20 00:39:44
f.date_time_between(start_date='-30d',end_date='now')
future_date():未来日期
future_datetime():未来时间
month():随机月份
month_name():随机月份(英文)
past_date():随机生成已经过去的日期
past_datetime():随机生成已经过去的时间
time():随机24小时时间
timedelta():随机获取时间差
time_object():随机24小时时间,time对象
time_series():随机TimeSeries对象
timezone():随机时区
unix_time():随机Unix时间
year():随机年份
file_extension():随机文件扩展名
file_name():随机文件名(包含扩展名,不包含路径)
file_path():随机文件路径(包含文件名,扩展名)
mime_type():随机mime Type
ascii_company_email():随机ASCII公司邮箱名
ascii_email():随机ASCII邮箱
ascii_free_email():
ascii_safe_email():
company_email():
domain_name():生成域名
domain_word():域词(即,不包含后缀)
email():
free_email():
free_email_domain():
f.safe_email():安全邮箱
f.image_url():随机URL地址
ipv4():随机IP4地址
ipv6():随机IP6地址
mac_address():随机MAC地址
tld():网址域名后缀(.com,.net.cn,等等,不包括.)
uri():随机URI地址
uri_extension():网址文件后缀
uri_page():网址文件(不包含后缀)
uri_path():网址文件路径(不包含文件名)
url():随机URL地址
user_name():随机用户名
isbn10():随机ISBN(10位)
isbn13():随机ISBN(13位)
job():随机职位
paragraph():随机生成一个段落
paragraphs():随机生成多个段落,通过参数nb来控制段落数,返回数组
sentence():随机生成一句话
sentences():随机生成多句话,与段落类似
text():随机生成一篇文章(不要幻想着人工智能了,至今没完全看懂一句话是什么意思)
word():随机生成词语
words():随机生成多个词语,用法与段落,句子,类似
binary():随机生成二进制编码
boolean():True/False
language_code():随机生成两位语言编码
locale():随机生成语言/国际 信息
md5():随机生成MD5
null_boolean():NULL/True/False
password():随机生成密码,可选参数:length:密码长度;special_chars:是否能使用特殊字符;digits:是否包含数字;upper_case:是否包含大写字母;lower_case:是否包含小写字母
sha1():随机SHA1
sha256():随机SHA256
uuid4():随机UUID
first_name():
first_name_female():女性名
first_name_male():男性名
first_romanized_name():罗马名
last_name():
last_name_female():女姓
last_name_male():男姓
last_romanized_name():
name():随机生成全名
name_female():男性全名
name_male():女性全名
romanized_name():罗马名
msisdn():移动台国际用户识别码,即移动用户的ISDN号码
phone_number():随机生成手机号
phonenumber_prefix():随机生成手机号段
profile():随机生成档案信息
simple_profile():随机生成简单档案信息
3.4 随机生成指定类型数据
pybool():布尔类型
pydecimal():数字
pydict():字典
pyfloat():left_digits=5 #生成的整数位数, right_digits=2 #生成的小数位数, positive=True #是否只有正数
pyint():整型
pyiterable():迭代器
pylist():列表
pyset():集合
pystr():字符串
pystruct():结构体
pytuple():元组
3.5 随机生成常用数据
ssn():生成身份证号
chrome():随机生成Chrome的浏览器user_agent信息
firefox():随机生成FireFox的浏览器user_agent信息
internet_explorer():随机生成IE的浏览器user_agent信息
opera():随机生成Opera的浏览器user_agent信息
safari():随机生成Safari的浏览器user_agent信息
linux_platform_token():随机Linux信息
user_agent():随机user_agent信息
四、利用pycharm构造数据-存储到mysql
1、pycharm for循环批量操作插入mysql数据######################################################
from faker import Faker
f=Faker(locale='zh_CN') # 为生成数据的文化选项,默认为en_US,只有使用了相关文化,才能生成相对应的随机信息
name=[]
address=[]
for i in range(10):
name.append(f.name())
address.append(f.address())
i=i+1
import pymysql
# 创建连接
con = pymysql.connect(host="127.0.0.1", user="aa", password="2018", database="aa", port=3306)
# 创建游标对象
cur = con.cursor()
sql = "insert into wzx_test1224 (name,address,starttime) values (%s, %s,%s)"
try:
for i in range(10):
cur.executemany(sql,[(name[i],address[i],f.date_time_between(start_date='-30d', end_date='now'))])
con.commit()
i=i+1
print("插入数据成功")
except Exception as e:
print(e)
con.rollback()
print("插入数据失败")
finally:
# 关闭游标连接
cur.close()
# 关闭数据库连接
con.close()
2、pycharm死循环单行操作插入mysql数据######################################################
from faker import Faker
f=Faker(locale='zh_CN')
import pymysql
# 创建连接
con = pymysql.connect(host="127.0.0.1", user="aa", password="2018", database="aa", port=3306)
# 创建游标对象
cur = con.cursor()
sql = "insert into wzx_test1224 (name,address,starttime) values (%s, %s,%s)"
try:
while True:
cur.execute(sql, [f.name(),f.address(), f.date_time_between(start_date='-30d', end_date='now')])
con.commit()
print("插入数据成功")
except Exception as e:
print(e)
con.rollback()
print("插入数据失败")
finally:
# 关闭游标连接
cur.close()
# 关闭数据库连接
con.close()
五、利用pycharm构造数据-存储到excel
1、pycharm for循环批量操作插入excel数据######################################################
from faker import Faker
f=Faker(locale='zh_CN') # 为生成数据的文化选项,默认为en_US,只有使用了相关文化,才能生成相对应的随机信息
name=[]
address=[]
for i in range(10):
name.append(f.name())
address.append(f.address())
i=i+1
import openpyxl
#读取excel文件,获取workbook对象
wb=openpyxl.load_workbook("Test.xlsx")
sheet=wb['Sheet'] #通过名称获取工作薄
for i in range(10):
sheet.append([name[i], address[i],f.date_time_between(start_date='-30d', end_date='now')]) #插入一行数据
i=i+1
wb.save("Test.xlsx") #保存,传入原文件则在原文件上追加数据,也可以保存为新文件
六、利用pycharm构造数据-存储到txt
from faker import Faker
fk=Faker(locale='zh_CN')
with open("test.txt", "w") as kk:
for i in range(20):
aa = {"data":[{ '"user_id":' + '"' + fk.ssn() + '",''"user_name":' + '"' + fk.name() + '",' '"terminal_id":' + '"' + fk.ipv4() + '",' '"operate_time":' + '"' + str(fk.date_time_between(start_date='-30d',end_date='now')) + '",'
}]}
kk.write(str(aa)+"\n")