天马行空 实验五 团队作业2:《网店工商网店工商信息图片文字提取》
项目 | 内容 |
---|---|
课程班级博客链接 | https://edu.cnblogs.com/campus/xbsf/2018CST |
这个作业要求链接 | https://www.cnblogs.com/nwnu-daizh/p/14687473.html |
团队名称 | 天马行空 |
团队成员分工描述 | * 梦涛:PM,主持项目会议 癿 * 盼:进行文档的编写 * 蕊媛:进行项目开发 * 钦颖:进行项目测试 各个阶段大家一起讨论思考。 |
团队的课程学习目标 | 1、确定项目选题; 2、初步了解和分析项目选题,完成团队项目可行性评审; 3、学习填写《2021年学生“创新能力提升计划”项目申请表》。 |
这个作业在哪些方面帮助团队实现学习目标 | 1、对项目的内容有了了解; 2、确定选题后,进一步知道了项目的需求以及一些具体要求。 |
团队博客链接 | https://i.cnblogs.com/posts/edit |
团队项目Github仓库地址链接 | https://github.com/cuimt/DOC-CARMER |
任务1:团队组长主持(企业微信)会议,确定团队项目选题
因为我们组四个人来自不同的宿舍,所以我们选择在线上开展会议和聚集在食堂面对面交流来确定团队项目选题,最终确定的选题为《网店工商网店工商信息图片文字提取》。选题确定之后,商讨完成了《2021年学生“创新能力提升计划”项目申请表》具体内容的填写,以及项目在今后大概的实施方案和每个阶段的安排。
![](https://img2020.cnblogs.com/blog/2365842/202104/2365842-20210427161102406-1568749814.jpg)
任务2:采用NABCD法,从五个视角对初选项目可行性进行团队合议
- 项目名称:
网店工商网店工商信息图片文字提取
- 项目NABCD描述:
N(需求):根据国家工商总局《网络交易管理办法》要求对网店营业执照信息进行公示,天猫网店经营者营业执照信息会在天猫店铺上以图片形式进行公示,但图片信息不能进行结构化处理,需要提取出图片中的企业注册号、企业名称形成结构化文档。
A(做法):利用图像识别技术将信息从图片中采集下来进行结构化处理,然后利用爬虫技术提取出有效文字信息,最后汇总进excel作为交付文件。
B(好处):可用于图片信息的结构化处理,方便用户对网店工商信息进行汇总管理。
C(竞争):市面上存在类似产品,但是多而不精,我们可以针对网店工商信息的图片文字处理开发出一款功能明确的软件,实现“精”的目的。
D(推广):联系需求方(如:天猫)推广项目,利用网络及各种平台进行线上线下宣传。
任务3:点击此链接,填报选题信息
已根据链接里的要求,完整地填写了选题信息:
![](https://img2020.cnblogs.com/blog/2365842/202104/2365842-20210427161138914-248376628.png)
任务4:任课教师确认团队选题或指导调整
经过大家的认真思考以及详细探讨,我们最终选择了《网店工商信息图片文字提取》这一项目,并且和任课教师沟通后,确认了团队选题。
以下是团队项目的相关信息:
赛题名称: 《网店工商信息图片文字提取》
赛题简介:
根据国家工商总局《网络交易管理办法》要求对网店营业执照信息进行公示,天猫网店经营者营业执照信息会在天猫店铺上以图片形式进行公示,但图片信息不能进行结构化处理,需要提取出图片中的企业注册号、企业名称形成结构化文档。
赛题的业务场景:
如果需要统计某家企业在天猫平台的网店经营情况,就需要先把天猫平台的企业信息采集下来进行结构化处理。参赛者可以用附件提供的天猫平台上采集的50家企业图片作为测试数据,提取出文字信息后汇总进Excel作为交付文件。
功能需求:
1、程序能够自动读取企业工商信息图片所在的文件夹路径。
2、从图片文件夹路径中顺序取出图片进行识别。
3、因为天猫平台公示的图片内容没有固定格式,所以需要程序能匹配不同格式的图片内容提取信息。
4、能够提取出图片中的企业注册号、企业名称数据项,并保存进Excel中,因为企业注册号、企业名称数据项要进行分析处理,所以需要保证提取信息的准确性,识别准确率需要保证在95%以上。
5、最终的识别结果以一份汇总的Excel交付。
非功能需求:
识别速度保持在60秒识别50张图片。
![](https://img2020.cnblogs.com/blog/2365842/202104/2365842-20210427161332421-1818247521.jpg)
任务5:各团队确定选题后,尝试对项目进行初步的需求调研,并依据调研结果填写《2021年学生“创新能力提升计划”项目申请表》
-
项目初步需求调研的方式
1、询问身边的人对信息图片文字提取的需求和要求;
2、上网了解信息图片文字提取的目前趋势和市场需求。 -
项目初步需求调研的成果
根据目前掌握的资料,我们了解到:
随着近些年计算机技术、互联网技术和通信技术的飞速发展,各类电商网站活跃在广大群众的日常生活中,而电商网站的规模也在不断增大。以天猫网站为例,其上的电商的数量不断增长,如何收集大批量的网店的企业执照信息并形成结构化文档,从而规范网店管理,对企业营业情况进行数据分析,就成为了日益突出和紧迫的需求。
根据国家工商总局《网络交易管理办法》要求对网店营业执照信息进行公示,天猫网店经营者营业执照信息会在天猫店铺上以图片形式进行公示,但图片信息不能进行结构化处理,需要提取出图片中的企业注册号、企业名称形成结构化文档。
目前,主流的文字识别技术是OCR,OCR (光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,即将图片或扫描件中的文字识别成可编辑的文本,供文字处理软件进一步编辑加工的技术。OCR技术广泛适用于远程身份认证、财税报销、文档电子化等场景,为企业降本增效。
任务6:将任务5编制的申请表上传到Github团队项目仓库
已将编制的申请表上传到Github团队项目仓库中:
任务7:完成《实验五 团队作业2:团队项目选题》博文作业
- 记录完成《实验五 团队作业2:团队项目选题》各项任务实际花费的时间
任务 | 实际花费的时间(min) |
---|---|
确定项目选题 | 30 |
采用NABCD法,从五个视角对初选项目可行性进行团队合议 | 25 |
填报选题信息 | 20 |
对项目进行初步的需求调研 | 25 |
填写《2021年学生“创新能力提升计划”项目申请表》 | 40 |
- 学习《现代软件工程—构建之法》第9章内容,从团队分工和沟通手段角度,谈谈完成本次作业的感受和体会
学习《现代软件工程—构建之法》第9章内容
NABCD法:
N (Need 需求)
你的创意解决了用户的什么需求?这个需求可以是明确的,公开的,也可能是说不清道不明的。
我们要充分了解用户的痛苦, 他们对已有软件, 服务不满意的地方。
需求可以进一步分析:这是刚性需求,或辅助性需求?需求的量有多大?需求会一直存在么?很多同学想象力非常丰富,觉得一定会成千上万的用户来使用我想出来的软件。那么可以实践一下,找到10个潜在用户,他们表示“一定会试用你的软件”,那么就算你找到了合适的需求 (Need)。
A (Approach 做法)
了解需求后,我们需要采取方法来解决用户的痛苦。这些招数不光是技术上的,也可以是商业模式上的,地域的,人脉的,行业的。
招数也可以进一步分析:基本的招数,独特的招数,招数的可行性,技术可行性,法律法规可行性。
B (Benefit 好处)
这时候你已经弄清了需求,有了独特的解决问题的办法,那你这个产品/服务会给客户/用户带来什么具体好处呢?如果用户已经有一个解决方案 (例如用户已经在用 QQ 聊天),那你的产品具体有哪些好处,能让用户离开现有产品,使用你的产品来聊天呢?另外这还有一个 Benefit/Cost (成本) 的问题。
Benefit 还可以指对自己团队/公司的好处。
C (Competitors 竞争)
竞争对手也没有闲着,这个市场有多大,目前有多少竞争者在瓜分,你了解么?竞争者是单独的,还是存在一个行业链,各个阶段的竞争者都一样么? 你如果不是最先进入某个市场的产品,你还能赢么?我们的新想法可能要和已有的产品竞争,说服用户放弃一个已经使用了一段时间的产品,来用我们的产品,是有不少困难。
我们还要想到,还有一个隐藏着的竞争对手是 “不消费” -- 很多用户根本就不用这个领域的任何产品,你怎么能让他们完成从 0 到 1 的转变?如果你成为他们的第一个产品,那你就是 First Mover,有很多优势。
D (Delivery 交付,Data 数据)
怎样把你的创新产品交到用户的手中?用户怎么能知道你的产品?你如何利用互联网(或者其他途径)把这一福音传遍你的目标用户?这一方面在早期的软件开发者的角度来看,应该是 “市场部门” 该做的事。但是,现在网络已经成为绝大多数软件产品一一部分,对社交网络的应用不会发生在产品开发完毕之后,而是在早期就会成为产品规划和功能的一部分。
除了交付给用户的手段,你还要了解你的应用到底产生了什么效果。我们还要看 D: Data 你有什么数据来证明新的功能带来的好处?团队做了用户调查么?有什么量化的指标?
需要注意的是,“创新”可以分为改良性的创新 incremental innovation - (软件中增加几个功能,把某个程序变得更快一点,把程序移植到新的平台),和颠覆性的创新 (disruptive innovation)。这两种类型各有其重要性,颠覆性的创新往往还没有明确定义的市场或竞争对手,但并不能说此类创新的威力不大,创新者要锻炼表达能力,把自己项目真正的独特之处展现出来。
完成本次作业的感受和体会
1、* 梦涛:作为本队的负责人,我负责将大家召集在一起,进行讨论和完成老师布置的任务,根据每个人所擅长的东西,进行大家的任务分工,主要分为开发,测试,文档三个部分。沟通的时候,我们将地点选在食堂,面对面的交流,方便了大家的沟通,所有人都畅所欲言,完成本次任务的效率都非常的高。希望在接下来的项目研究过程中,大家继续团结协作,共同努力!
2、* 钦颖:众人拾柴火焰高,从团队成立到项目的选题和讨论,每一个过程都是进步的阶梯。本次团队作业完成过程中,首先我们在队长的带领下经过会议讨论的方式,团队成员各自表达了自己的想法,最后确定了选题。其次就是本次项目评审过程中老师也参与了进来,对我们提出的申请项目进行审核。第二次的团队合作学习,相比第一次彼此之间更加的默契,发挥出了更强大的团队力量。
3、癿 * 盼:对于一个团队项目,注重的是各个团队成员之间相互的协作,既然是团队我们就需要每个人都参与进来,划分好项目的分工后,大家要用认真严谨的态度去对待自己承担的角色,大家也要积极发表自己的想法。在项目负责人的带领下,一步步的按照老师的要求步骤,认真思考对于该项目如何实施的方法。每个人都有自己的想法,我们可能避免不了有时候存在想法分歧,这个时候我们就要互相调节,互相理解,互相包容,这样才能使团队项目的构建更加和谐。
4、* 蕊媛:本次的团队任务主要是确定项目选题,并对今后的项目实施做出大致的规划,虽然团队中每个有不同的具体分工,但是对于项目的整体规划和重要决策,每个人都是重要的参与者。在完成本次的团队任务时,我们在队长的组织下进行了一次线下讨论,每个人都发表了意见,最后汇总意见,对各个选题的可行性进行了大致的分析,决定出最终选题。在团队任务中,一群人齐心协力,大家有共同的目标,每个人发表意见,也倾听意见,从而建立起有效的沟通,这使得团队项目集合了大家的脑力与创造力,能够朝着一个好的方向逐步推进。