第07组 团队Git现场编程实战

组员职责分工

团队成员 分工
杨明哲 爬数据,做网页
林兴源 合作编码完成了对美团数据的分析,分析出最有发展潜力的十佳好店
卞永亨 从大众点评分析出了服装商圈
林鑫 合作编码完成了对美团数据的分析,分析出最有发展潜力的十佳好店
薛紫微 处理了七个商圈的一个商圈的数据
陈碧芬 处理筛选了两个商圈的数据
朱丽辰 找七个商圈涵盖的路、找了俩商圈的总评论数
黄森敏 处理七个商圈中两个商圈的数据
容慧珺 写了一点点的界面,博客编写
高星 界面设计(没用上)、博客

Github 的提交日志截图




程序运行截图



程序运行环境

Windows 10

GUI界面

基础功能实现

  1. 通过python爬取数据,然后通过html+css+JavaScript把数据可观的展示
  2. 测评出了福州最受欢迎的商圈
  3. 测评各个性价比最高的前五家美食餐厅,点击该餐厅,让用户全面了解该餐厅的信息例如菜单、价格、地点以及评价
  4. 测评了最具潜力的商圈和美食聚散地
  5. 写了该现场编程的心得

鼓励有想法且有用的功能

  1. 首先我觉得美食排行榜中可以分开个下午茶排行榜以及正餐排行榜(下午茶当然是奶茶类面包蛋糕这类的,正餐就是米面饺子这类的),用户才能根据需求不同看有需要的排行榜
  2. 其次有了吃喝还有了服饰类的商圈,应该还有商圈有的那些娱乐项目(比如蹦床,星空博物馆,失恋博物馆这样的)

遇到的困难及解决方法

遇到的困难及解决方法

  • 杨明哲

困难:爬虫一直被封,大众点评防爬虫太强了。

解决方法:使用ip代理池。

  • 卞永亨

困难:大众点评反爬虫太强,爬不下来。

解决方法:取每个商圈的前十名进行手动爬取,并取平均分,来得到服装店最佳商圈。

  • 林兴源

困难:困难是如何合理的评测综合好店的指标。

解决方法:把从美团爬取的人均消费、评价数、评分、地理位置按一定的缩放映射到每个指标0-100分,得分加起来得到综合分,按综合分排序即可得到一个较合理的综合好店排行榜。

  • 林鑫

困难:代码太过朴素,高级感不强,分析的性能也较弱。

解决方法:由于时间原因,没能用代码分析出商圈。

  • 薛紫微

困难:本来打算用python将查到的数据进行处理,但是发现对代码比较生疏

解决方法:在当时比较赶的情况下,采取人工对excel表格进行处理。

  • 陈碧芬

困难:这次编程实战我一开始的打算是写前端的,但是后面突然改成vue,我只能默默去筛选处理数据了,一开始是尝试用代码处理数据,但是一直没能成功。

解决方法:最后选择了人工处理 。

  • 朱丽辰

困难:这次编程实战在查找路线的时候找了很多超出范围的。

解决方法:辛亏我们温柔友善的杨老板提醒我范围应当与商业圈匹配;另外,在筛选最受欢迎的商业圈时用人工算?????最后好像数据挺准确的,但是这个方法真的很菜。

  • 黄森敏

困难: 本来打算写代码来处理execl分析数据的,后来感觉处理起来有点麻烦。

解决方法:怕时间赶不上,就选择人工(dbq太菜了)

  • 容慧珺

困难:遇到的困难就是一开始准备用vue,但由于自己的不熟练,并不能及时完成

解决方法:临时更改,组长给了模板,由于改模板速度太慢,工作被组长承包了

  • 高星

困难:一开始考虑界面怎样设计才能美观简洁,又能使基本数据可视化。

解决方法:组长给了模板,工作被组长承包了。

马后炮

  • 杨明哲

如果早一点找到爬虫的代码,那么我就美滋滋了。

  • 卞永亨

如果我有时间,那么就不应该只选质量评分为评价指标应考虑其他因素如环境评分等。

  • 林兴源

如果能把按照上述做法得到的前500家好店的地理位置坐标标点以此在地图上圈定一些密度较高的圈,那么就可以得到更合理的潜力商圈。因为想到的时候来不及做了,只能完成一个较粗狂的结果。

  • 林鑫

如果再给一次机会,那么我要把python学得更加好更能解决实际问题。

  • 薛紫微

如果可以重来,那么我一定提前了解python相关用法,人工看着真的挺多

  • 陈碧芬

如果可以的话,那么还是希望自己能够用专业的方法去处理数据(可能这样会更有成就感

  • 朱丽辰

如果还能重来一次,那么我希望自己能写个算法,这样显得比较有技术性。

  • 黄森敏

如果还能重来一次,那么我希望能实现一下当时查到的方法,写个算法实现。

  • 容慧珺

如果我早做准备,那么我相信我能写出一个好看的界面的,以及模板我也能改好的,不会再让组长承担我的工作的

  • 高星

如果还能重来,那么我一定提前找好素材

贡献比例

成员 贡献比例(%)
杨明哲 40%
卞永亨 8%
林兴源 9%
林鑫 9%
薛紫微 7%
陈碧芬 6%
朱丽辰 7%
黄森敏 6%
容慧珺 4%
高星 4%

PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 10 15
Estimate 估计这个任务需要多少时间 100 120
Development 开发 0 0
Analysis 需求分析 (包括学习新技术) 0 0
Design Spec 生成设计文档 0 0
Design Review 设计复审 0 0
Coding Standard 代码规范 (为目前的开发制定合适的规范) 0 0
Design 具体设计 10 20
Coding 具体编码 50 40
Code Review 代码复审 0 0
Test 测试(自我测试,修改代码,提交修改) 0 0
Reporting 报告 40
Test Repor 测试报告
Size Measurement 计算工作量
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划
合计 95

学习进度条

周数 新增代码(行) 累计代码(行) 本周学习耗时(小时) 累计学习耗时(小时) 重要成长
9 126 3316 3 42 用Python数据分析

posted on 2019-11-02 21:46  sky星  阅读(92)  评论(0编辑  收藏  举报

导航