摘要:
1."\d"匹配数字 2.“\d*”匹配0-N位数字 3.“\d+”匹配1-N个 4.“\*”匹配“*”,“\n”匹配换行符,“\r”匹配回车符 阅读全文
随笔档案-2020年02月
eclipse生成JavaDoc文档
2020-02-29 13:32 by 默默不语, 300 阅读, 收藏, 编辑
摘要:
1.项目名右击-->“Export” 2.搜索“JavaDoc”-->选择“JavaDoc”-->"next" 3.选择项目或者要生成JavaDoc的文件,这里选择的是整个项目。然后选择存放的路径,点击“Finish”。 4.运行完成后(警告可忽略)打开刚才选择的路径就可以看到生成的JavaDoc文 阅读全文
Java反射
2020-02-28 21:04 by 默默不语, 231 阅读, 收藏, 编辑
摘要:
1.Java反射机制 反射是Java语言的特征之一。反射机制是 Java 的动态性之一动态语言,在程序运行时,可以改变程序的结构或变量类型。Java 不是动态语言,但具有一定的动态性,可以称为”准动态语言”,具备类似动态语言的特性。Java的动态性让编程变得更加的灵活,功能就更加的强大。 2.Jav 阅读全文
java调用python代码
2020-02-27 20:25 by 默默不语, 1699 阅读, 收藏, 编辑
摘要:
最近做项目时需要用Java调用python的文件,本篇博客介绍用java调用python的代码。 一、使用Jpython来实现用java调用python的代码 1.下载JPython的包 我下载的是jython-2.7-b1.jar,下载好后在项目classpath中添加这个jar包。 2.编写简易 阅读全文
js绘制canvas图
2020-02-26 19:00 by 默默不语, 2750 阅读, 收藏, 编辑
摘要:
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> <!DOCTYPE html> <html> <head> <meta charset='utf-8'> <title>画图< 阅读全文
python文件操作
2020-02-26 14:28 by 默默不语, 212 阅读, 收藏, 编辑
摘要:
1.打开文件() #参数1为文件路径#参数2为打开方式f = open('D:\spider\\shoesItem.txt','w') 2.向文件写入内容(参数必须为字符串) f.write(content) 3.关闭文件流 f.close() 4.向文件写入内容时,每次换行输入 f = open( 阅读全文
echarts绘制柱状图
2020-02-25 19:59 by 默默不语, 913 阅读, 收藏, 编辑
摘要:
<script src="assets/js/vendor/modernizr-3.7.1.min.js"></script> <div class="tab-pane fade" id="sheet" role="tabpanel" > <div id="compare_price" style= 阅读全文
eclipse中修改jsp文件中内容,但是刷新网页内容却不变问题
2020-02-24 22:17 by 默默不语, 1464 阅读, 收藏, 编辑
摘要:
问题:今天在jsp文件中修改其内容,刷新网页时内容却不变。 解决办法:清空缓存。 步骤: 1.右击项目,点击“Remove”。 2.右击Tomcat,点击“Clean”. 重新运行即可解决!!! 阅读全文
JavaScript基础2
2020-02-24 21:27 by 默默不语, 185 阅读, 收藏, 编辑
摘要:
1.字符串转为字符串数组:split函数 <% String price = "496.0 398.0 269.0 "; %> <script type="text/javascript"> var pr = "<%=price%>"; alert(pr); var pri = pr.split(" 阅读全文
Java List集合中元素比较大小
2020-02-24 12:20 by 默默不语, 11224 阅读, 收藏, 编辑
摘要:
list排序方法一Comparator形式: 1.比较数字 List<Shoes> all_shoes = new ArrayList<Shoes>(); Collections.sort(all_shoes, new Comparator<Shoes>(){ @Override /* * * in 阅读全文
Java集合类
2020-02-23 23:03 by 默默不语, 239 阅读, 收藏, 编辑
摘要:
如今经常用到Java中的各种集合类,所以特地在网上学习了一下Java的几种集合类,总结在这篇博客中。 首先。集合是Java SE API所提供的一系列类(java.util包内)的实例,可以用于动态存放多个对象,便于我们操作。 1.Collection接口 Collection接口声明了一组管理它所 阅读全文
java将字符串转为字符串数组
2020-02-23 22:45 by 默默不语, 45428 阅读, 收藏, 编辑
摘要:
现在有一个由汉字组成的字符串,想要将他们转为字符串数组,数组中每个元素为一个汉字。 1.split函数 public static void main(String[] args) throws SQLException { String str1 = "阿迪达斯adidas neo VS JOG男 阅读全文
HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.
2020-02-22 23:51 by 默默不语, 1191 阅读, 收藏, 编辑
摘要:
今天用pip安装第三方库时总报超时,可能是网络不稳定地原因。 解决方法:将超时时间延长,重新下载。 命令:1.pip --default-timeout=100 install -U pip 2.pip --default-timeout=100 install -U +第三方库名 如:pip -- 阅读全文
python绘制疫情图
2020-02-22 22:54 by 默默不语, 5223 阅读, 收藏, 编辑
摘要:
python中进行图表绘制的库主要有两个:matplotlib 和 pyecharts, 相比较而言: matplotlib中提供了BaseMap可以用于地图的绘制,但是个人觉得其绘制的地图不太美观,而且安装相较而言有点麻烦。 pyecharts是基于百度开源的js库echarts而来,其最大的特点 阅读全文
Port 8009 required by Tomcat v8.0 Server at localhost is already in use. The server may already be running in another process, or a system process may be using the port.
2020-02-21 20:16 by 默默不语, 1571 阅读, 收藏, 编辑
摘要:
今天启动web项目时报错“Port 8009 required by Tomcat v8.0 Server at localhost is already in use. The server may already be running in another process, or a syste 阅读全文
python 爬取新冠肺炎疫情数据
2020-02-21 19:55 by 默默不语, 1382 阅读, 收藏, 编辑
摘要:
在腾讯新闻和支付宝中我们都能看到疫情数据,但是支付宝的数据获取难度相对大一些,所以我们获取的腾讯新闻的数据,链接地址:https://news.qq.com/zt2020/page/feiyan.htm?from=timeline&isappinstalled=0 打开该网页后,我们通过浏览器的开发 阅读全文
MySql数据库去重
2020-02-20 15:04 by 默默不语, 1404 阅读, 收藏, 编辑
摘要:
shoes表结构 在此表中,shoes_name可能有重复,本篇博客记录如何去除重复数据。 1.首先要知道哪些数据是重复的, 可用group by 聚集函数找到: SELECT shoes_name,count(*) from shoes GROUP BY shoes_name having COU 阅读全文
sql基础操作语句
2020-02-19 21:54 by 默默不语, 361 阅读, 收藏, 编辑
摘要:
本次项目中用到了大量的数据库操作,但每次用到时都要去网上查,所以本篇博客记录一下经常用到的一些基础的sql语句。 1.基本查询——无条件查询 ①查询表中所有数据 select * from 表名 ② 查询某一列 select 列名 from 表名 2.基本查询——有条件查询 ①where 根据某一列 阅读全文
基于物品的协同过滤算法ItemCF算法实现
2020-02-18 23:00 by 默默不语, 2419 阅读, 收藏, 编辑
摘要:
基于物品的协同过滤算法(ItemCF)的基本思想是:给用户推荐那些和他们之前喜欢的物品相似的物品。 比如,该算法会因为你购买过《Java从入门到精通》而给你推荐《Java并发编程实战》。不过,基于物品的协同过滤算法并不利用物品的内容属性计算物品之间的相似度,二是通过分析用户的行为数据计算物品之间的相 阅读全文
计算两组标签相似度算法——levenshtein distance 编辑距离算法
2020-02-17 23:34 by 默默不语, 959 阅读, 收藏, 编辑
摘要:
标签在数据分析中起到很重要的作用,给用户打标签,给商品打标签,给新闻打标签,好的标签可以为我们后期分析数据时提供很大的便利。有时我们需要计算两个对象之间标签的相似度。目前学习的算法是levenshtein distance 编辑距离算法。 代码示例: //标签相似度 public static do 阅读全文
Java JDBC 中获取 ResultSet 的大小
2020-02-16 22:25 by 默默不语, 3252 阅读, 收藏, 编辑
摘要:
当执行完一条Sql语句后我们获取到一个 ResultSet 对象,有时我们需要知道返回元素的数量,但是 ResultSet 并没有提供一个 size() 方法或者length 属性,这时我们可以通过调用 next() 去累加计算,但是我们也可以通过一个更为方便的方法。 实例代码: public in 阅读全文
jacascrpt基础1
2020-02-16 22:04 by 默默不语, 216 阅读, 收藏, 编辑
摘要:
1.jsp向js中传入参数 语法:var a = "<%=要传入的变量 %>",一定要加双引号。 var history_price = "<%=shoes.getHistory_price() %>"; 2.js中字符串截取 ①slice() 第一个参数代表开始位置,第二个参数代表结束位置的下一个 阅读全文
java多线程基础2
2020-02-15 21:03 by 默默不语, 186 阅读, 收藏, 编辑
摘要:
1.线程加锁 多个线程需要共享对同一个数据的访问。如果每个线程都会调用一个修改共享数据状态的方法,那么,这些线程将会互相影响对方的运行。在Java语言中,引入对象互斥锁的概念,保证共享数据操作的完整性。每个对象都对应一个可称为“互斥锁”的标记,这个标记保证在任一时刻,只能有一个线程访问对象。就像上一 阅读全文
python 列表(list)排序总结
2020-02-14 09:40 by 默默不语, 17525 阅读, 收藏, 编辑
摘要:
使用python的sorted函数,该函数默认从小到大排序。 1.对列表中元素排序 ①列表中为普通元素 a = [5,2,9,8,6] a = sorted(a) print(a) 倒序排序为从大到小排序,使用reverse=True a = [5,2,9,8,6] a = sorted(a,rev 阅读全文
UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence
2020-02-14 00:06 by 默默不语, 1158 阅读, 收藏, 编辑
摘要:
pyhon读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence 代码如下: #获取电影列表 def getMovieList(item): 阅读全文
java 多线程基础
2020-02-13 12:05 by 默默不语, 139 阅读, 收藏, 编辑
摘要:
1.创建新线程 ①继承自Thread 将类声明为java.lang.Thread的子类并重写run方法 public class MyThread extends Thread { @Override public void run() { //线程体的执行方法 //线程体 for(int i = 阅读全文
java HashSet的使用
2020-02-12 19:07 by 默默不语, 3764 阅读, 收藏, 编辑
摘要:
今天在写代码时想要使用HashSet,由于之前并不了解,就在网上查了一下原理及使用方法。 HashSet原理 该类实现了Set接口,HashSet中不允许元素重复,不保证集合中元素的顺序,元素可为null,但最多只能一个。对于 HashSet 而言,HashSet继承自AbstractSet,它是基 阅读全文
基于用户行为为用户推荐商品
2020-02-11 17:08 by 默默不语, 1484 阅读, 收藏, 编辑
摘要:
1、用户行为数据 用户行为数据在网站中最简单的存在形式就是日志,用户行为就是指用户在系统中进行的各种操作,比如用户在电商网站中进行的浏览、点击、搜索、购买、收藏等行为。我们可以通过分析这些数据来推测用户喜爱哪种商品,从而为用户推荐他们更偏爱的商品。 2、用户行为分类 根据反馈的明确性来说,用户行为在 阅读全文
今日进度
2020-02-10 17:22 by 默默不语, 138 阅读, 收藏, 编辑
摘要:
今天毕设的任务是获取用户行为,根据TF-IDF算法计算标签权重,并写入数据库; 代码: Action.java package entity; public class Action { private int user_id;//用户id private int tag_id;//标签id pri 阅读全文
java基础知识2
2020-02-10 17:16 by 默默不语, 163 阅读, 收藏, 编辑
摘要:
1.java字符串转为int型: String id= 1; int id_int = Integer.parseInt(id); 2.java 字符串转为bool类型: parseBoolean函数:如果 String 参数不是 null 且在忽略大小写时等于"true",则返回的 boolean 阅读全文
java异常处理
2020-02-09 19:25 by 默默不语, 152 阅读, 收藏, 编辑
摘要:
今天学习了一些新的java基础知识,方便使用,在此分享给大家! 1.java for循环 在JDK5.0中新增了一个增强的for循环语法: for(type element:array){ System.out.println(element); } 示例代码: public static void 阅读全文
python jieba分词
2020-02-08 19:20 by 默默不语, 446 阅读, 收藏, 编辑
摘要:
#!/usr/bin/python # -*- coding: UTF-8 -*- import jieba import jieba.analyse import pymysql id = 1 # shoes.txt中的标签库 tag_ku = [] #精确模式分成的tag tag = [] # 阅读全文
selenium对iframe操作小结
2020-02-08 13:23 by 默默不语, 1841 阅读, 收藏, 编辑
摘要:
selenium获取iframe中内容 selenium提供了三种方法来获取iframe中的内容: 语法: driver.switch_to_frame() 或 driver.switch_to.frame() ①iframe有id,传入id获取 ②iframe有name,传入name获取 ③通过t 阅读全文
json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
2020-02-08 12:56 by 默默不语, 41335 阅读, 收藏, 编辑
摘要:
上篇博客提到了爬取动态数据,但是在构造request_url时,其中的url我用的浏览器的网址,但是经过运行发现,有时可以运行成功,有时 request_url = "http://tool.manmanbuy.com/history.aspx?DA=1&action=gethistory&url= 阅读全文
Java中时间与时间戳的转换
2020-02-08 00:06 by 默默不语, 22504 阅读, 收藏, 编辑
摘要:
Timestamp就是时间戳,主要用于数据库中,该类在java.sql下。如果在数据库中用Date类,只能到某一天,而时间戳可以到秒,比Date要精确,通常用于防止数据脏读现象。 代码: package TimeAndStamp; import java.util.Arrays; import ja 阅读全文
python爬取网页数据
2020-02-07 15:28 by 默默不语, 10550 阅读, 收藏, 编辑
摘要:
python时间戳 将时间戳转为日期 #!/usr/bin/python # -*- coding: UTF-8 -*- # 引入time模块 import time #时间戳 timeStamp = 1581004800 timeArray = time.localtime(timeStamp) 阅读全文
selenium爬取网页内容知识点总结(代码均亲测可用)
2020-02-06 16:04 by 默默不语, 2293 阅读, 收藏, 编辑
摘要:
1.selenium获取网页iframe内容 语法:driver.switch_to.frame(iframe) ①通过tag_name driver.get(url) #该iframe为页面的第几个iframe iframe = driver.find_elements_by_tag_name(' 阅读全文
绘制用户画像——根据用户行为计算标签权重介绍及实现
2020-02-05 18:03 by 默默不语, 4559 阅读, 收藏, 编辑
摘要:
上篇博客说到绘制用户画像时根据用户行为计算标签权重很重要,计算标签权重最常用的算法是TF-IDF标签权重算法,但是如何计算并没有详细介绍,那么这篇博客咱们就来详细说说基于TF-IDF算法计算用户标签权重。 TF-IDF算法用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度,常用于计 阅读全文
jaccard相似系数(Jaccard similarity coefficient)
2020-02-04 20:28 by 默默不语, 12024 阅读, 收藏, 编辑
摘要:
jaccard相似系数 jaccard相似系数(Jaccard similarity coefficient)主要应用场景为数据聚类、比较文本的相似度,用于文本的查重与去重,计算对象间的距离。 jaccard相似系数用于比较有限样本集之间的相似性和差异性J(A,B)为A与B交集的大小与A与B并集的大 阅读全文
推荐系统——冷启动问题
2020-02-03 20:26 by 默默不语, 790 阅读, 收藏, 编辑
摘要:
冷启动 推荐系统主要是通过用户的历史行为来构建用户画像,从而为用户推荐他们感兴趣的内容,但是新注册的用户在系统中无历史行为,该如何为他们推荐内容是一个很重要的问题,即冷启动问题。推荐系统冷启动问题指的就是对于新注册的用户或者新入库的标的物, 该怎么给新用户推荐标的物让用户满意,怎么将新标的物分发出去 阅读全文
<%@ taglib uri="http://java.sun.com/jsp/jstl/core" prefix="c"%>报错
2020-02-03 00:08 by 默默不语, 10097 阅读, 收藏, 编辑
摘要:
jsp界面想要使用c:if标签,结果使用后报错说找不到这个标签,最后发现缺少<%@ taglib uri="http://java.sun.com/jsp/jstl/core" prefix="c"%>这个引用,加上这行代码后又报错 经查找,原因为缺少这两个jar包。 解决方法: 这两个jar包位于 阅读全文
jieba 分词库(python)
2020-02-02 18:11 by 默默不语, 2254 阅读, 收藏, 编辑
摘要:
安装jieba:pip install jieba 原理: 基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG) 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合 对于未登录词,采用了基于汉字成词能力的 HMM 模型,使用了 Viterbi 算法 阅读全文
Server Tomcat v8.0 Server at localhost was unable to start within 45 seconds. If the server requires more time, try increasing the timeout in the server editor.
2020-02-02 18:02 by 默默不语, 373 阅读, 收藏, 编辑
摘要:
eclipse在tomcat上部署网页时报错:Server Tomcat v8.0 Server at localhost was unable to start within 45 seconds. 问题:本地的tomcat服务器不能够在45秒内启动。 原因:在tomcat中部署的项目太多因此不能 阅读全文
用户画像——“打标签”
2020-02-01 17:58 by 默默不语, 3845 阅读, 收藏, 编辑
摘要:
用户画像是根据用户社会属性、生活习惯、兴趣爱好和消费行为等信息而抽象出的一个标签化的用户模型,简而言之,就是给用户“打标签”。通过获取用户的信息,并对其进行分析,绘制用户画像。 用户信息可以分为两个维度,静态信息和动态信息,静态信息则指用户的固有属性,如性别,年龄,消费水平等,动态信息则是通过观察用 阅读全文