01 2017 档案
摘要:1.使用VPN+ipv6(测试于2017-01,该方法已经不可用) 首先你需要有北邮的VPN账号和密码,只要是北邮的学生都有 账号和密码不懂的请查看 VPN账号密码说明 接下来登录https://sslvpn.bupt.edu.cn,输入账号和密码 已经登录好了 但是还是不能上BYR BT,是因为没
阅读全文
摘要:奇异值分解(Singular Value Decompositon,SVD),可以实现用小得多的数据集来表示原始数据集。 优点:简化数据,取出噪声,提高算法的结果 缺点:数据的转换可能难以理解 适用数据类型:数值型数据 SVD最早的应用之一是信息检索,我们称利用SVD的方法为隐形语义索引(LSI)或
阅读全文
摘要:jieba——“结巴”中文分词是sunjunyi开发的一款Python中文分词组件,可以在Github上查看jieba项目。 要使用jieba中文分词,首先需要安装jieba中文分词,作者给出了如下的安装方法: 1.全自动安装:easy_install jieba 或者 pip install ji
阅读全文
摘要:pandas是python特征预处理常用的框架 1.查看数据 加载数据 #-*- coding: utf-8 -*- import pandas as pd train_data = pd.read_csv("./data/train.csv") print(train_data) pandas显示
阅读全文
摘要:降维技术的好处: 1.使得数据集更易使用 2.降低很多算法的计算开销 3.取出噪声 4.使得结果易懂 在已标注和未标注的数据上都有降维技术,降维的方法: 1.主成分分析(Principal Component Analysis,PCA)。在PCA中,数据从原来的坐标系转换到新的坐标系,新坐标系的选择
阅读全文
摘要:从大规模的数据集中寻找隐含关系被称作为关联分析(association analysis)或者关联规则学习(association rule learning)。 Apriori算法 优点:易编码实现 缺点:在大数据集上可能较慢 使用数据类型:数值型或者标称型数据 关联分析寻找的是隐含关系,这些关系
阅读全文
摘要:安装mongo数据库,在shell下输入 sudo apt-get install mongodb 如果需要在Python中使用mongo数据库,还需要额外安装Python封装库 pip install pymongo 检测安装是否成功,可以使用下面命令在本地启动MongoDB mongod -db
阅读全文
摘要:1.首先在浏览器中进入WAP版微博的网址,因为手机版微博的内容较为简洁,方便后续使用正则表达式或者beautifulSoup等工具对所需要内容进行过滤 https://login.weibo.cn/login/ 2.人工输入账号、密码、验证字符,最后最重要的是勾选(记住登录状态) 3.使用Wires
阅读全文
摘要:用homebrew 在电脑上安装tesseract库 brew install tesseract 用pip安装支持python的tesseract 接口 pip install pytesseract 使用pytesseract库对图片文件(jpg、png、bmp等)进行识别,把图片转换成字符串输
阅读全文
摘要:可以使用pprof来分析golang程序的CPU性能,内存占用,block死锁,Goroutine性能等,pprof一般是在需要分析代码性能的时候才加入 1.分析Gin web服务的性能 可以使用 gin-contrib/pprof 这个工具,参考:Gin框架中使用pprof 添加依赖 go get
阅读全文
摘要:阻塞队列与Semaphore有些相似,但也不同,阻塞队列是一方存放数据,另一方释放数据,Semaphore通常则是由同一方设置和释放信号量。 ArrayBlockingQueue 只有put方法和take方法才具有阻塞功能 用3个空间的队列来演示阻塞队列的功能和效果。 用两个具有1个空间的队列来实现
阅读全文
摘要:CyclicBarrier 适用于:创建一组任务,它们并行地执行任务,然后在进行下一个步骤之前等待,直至所有任务完成。它使得所有的并行任务都将在栅栏处列队,因此可以一致地向前移动。 表示大家彼此等待,大家集合好后才开始出发,分散活动后又在指定地点集合碰面,这就好比整个公司的人员利用周末时间集体郊游一
阅读全文
摘要:Semaphore [ˈseməfɔːr] 可以维护当前访问自身的线程个数,并提供了同步机制。使用Semaphore可以控制同时访问资源的线程个数(即允许n个任务同时访问这个资源),例如,实现一个文件允许的并发访问数。 Semaphore实现的功能就类似厕所有5个坑,假如有十个人要上厕所,那么同时能
阅读全文
摘要:Lock比传统线程模型中的synchronized方式更加面向对象,与生活中的锁类似,锁本身也应该是一个对象。两个线程执行的代码片段要实现同步互斥的效果,它们必须用同一个Lock对象。 1.重入锁 ReentrantLock 使用ReentrantLock实现交替打印zhangxiaoxiang和l
阅读全文
摘要:线程池的概念与Executors类的应用 1.创建固定大小的线程池 2.创建缓存线程池 3.创建单一线程池 关闭线程池 shutdown与shutdownNow的比较 用线程池启动定时器 调用ScheduledExecutorService的schedule方法,返回的ScheduleFuture对
阅读全文
摘要:多个线程访问共享对象和数据的方式 1.如果每个线程执行的代码相同,可以使用同一个Runnable对象,这个Runnable对象中有那个共享数据,例如,买票系统就可以这么做。 package java_thread; class MyThread_2 implements Runnable{ priv
阅读全文
摘要:转自 SiteMesh的使用 SiteMesh的介绍就不多说了,主要是用来统一页面风格,减少重复编码的。 它定义了一个过滤器,然后把页面都加上统一的头部和底部。 需要先在WEB-INF/lib下引入sitemesh的jar包:http://wiki.sitemesh.org/display/site
阅读全文
摘要:1.创建clickhouse环境 安装clickhouse 参考:ubuntu16.04安装clickhouse 或者使用docker 参考:https://hub.docker.com/r/clickhouse/clickhouse-server docker run -d -p 18123:81
阅读全文
摘要:1.搭建环境的第一步是导包,把下面这些包都导入工程中 /media/common/工作/Ubuntu软件/SpringMVC_jar包整理/aop/media/common/工作/Ubuntu软件/SpringMVC_jar包整理/apache-commons-logging/media/commo
阅读全文
摘要:当使用S3作为Amazon EMR的存储的时候,当写入的流量比较大的时候,有时会遇到性能瓶颈,报错如下 Caused by: com.amazonaws.services.s3.model.AmazonS3Exception: Please reduce your request rate. 在如下
阅读全文
摘要:1.实现文件上传首先需要导入Apache的包,commons-fileupload-1.2.2.jar和commons-io-2.1.jar 实现上传就在add.jsp文件中修改表单 完整的add.jsp文件 2.在user-servlet.xml中配置上传文件 3.在控制器中修改add()方法 还
阅读全文
摘要:1.在user-servlet.xml中加入以下代码,才能使得对静态文件的请求不被Controller捕获,而映射到一个固定的地址 2.在WebContent文件下面,添加resources文件夹和css/main.css文件 mian.css文件,文字的大小和颜色 3.在list.jsp文件中,加
阅读全文
摘要:1.在WEN-INF文件夹下面,添加一个login.jsp文件 2.在UserController.java中加入login 3.其中需要new UserException,再创建UserException.java 如果只是做到这些的话,当输出的用户名和密码错误的时候,报错如下图 4.在UserC
阅读全文