随笔分类 - 其他技术
摘要:最近学机器学习涉及很多的数学公式,公式如果用截图显示,会比较low而且不方便。因此需要对Hexo做些配置,支持公式渲染。同时文末整理了各种公式的书写心得,比如矩阵、大小括号、手动编号、上下角标和多行对其等,有兴趣的可以看看。 通过hexo math插件安装MathJax 有个插件hexo math,
阅读全文
摘要:前言 记得从大二开始,就一直想搭个专属网站,当时使劲抠页面【前端页面是从QQ空间抠的,现在想抠估计没这么容易了】,写代码,忙活半天才把程序弄好。 可惜最终项目还是没上线,因为当时有两问题绕不开 需要购买服务器【服务器太贵,现在便宜的阿里云服务器每月都需100左右】。 需要运维管理【麻烦且危险,服务器
阅读全文
摘要:最近爬取了百万数据,以下是学习爬虫时汇总的相关知识点 什么是爬虫和反爬虫 爬虫 —— 使用任何技术手段批量获取网站信息的一种方式,关键在批量。 反爬虫 —— 使用任何技术手段,阻止别人批量获取自己网站信息的一种方式。关键也在于批量。 误伤 —— 在反爬虫的过程中,错误的将普通用户识别为爬虫。误伤率高
阅读全文
摘要:最近进行了微信公众号的预研,目前支持的功能如下 支持关键字回复,目前能回复图文信息。 支持自定义菜单创建及菜单事件响应。 支持各消息类型的识别。目前可以识别用户发送的文本、图片、声音、地址和链接信息等。 支持拍照答题。微信公众号内带拍照功能,用户发送图片后,后端可调用接口进行图片识别,并回复图文信息
阅读全文
摘要:背景 在互联网教育行业,做内容相关的项目经常碰到的一个问题就是如何解析word文档。 因为系统如果无法智能的解析word,那么就只能通过其他方式手动录入word内容,效率低下,而且人工成本和录入出错率都较高。 疑难点 word解析可以预见的困难主要有以下几个方面: word 结构问题 —— word
阅读全文
摘要:最近安装了API文档工具swagger,因为Github上已有详细安装教程,且安装过程中没有碰到大的阻碍,所以此文仅对这次安装做一份大致记录 相关网站 Swagger 官方地址: http://swagger.wordnik.com Github安装详解【springmvc集成swagger】: h
阅读全文
摘要:公司之前有个用Lucene实现的伪分布式项目,实时性很差,后期数据量逐渐增大的时候,数据同步一次需要十几小时。当时项目重构考虑到的是Solr和ES,我参与的是Solr技术的预研。因为项目实时性要求很高,最终选择的是ES。 Elasticsearch 简介 Elasticsearch是一个实时的分布式
阅读全文
摘要:环境搭建 1、到apache下载solr,地址:http://mirrors.hust.edu.cn/apache/lucene/solr/ 2、解压到某个目录 3、cd into D:\Solr\solr 4.10.3\example 4、Execute the server by “java j
阅读全文
摘要:二维码不一定是单调的黑白格子,也可以很丰富。 最近用到的二维码在线生成网站: 二维工坊: "http://visual.2weima.com/" 云来图形二维码: "http://qrcode.yunlai.cn/" 我给"星空博客"网站生成的二维码: 生成的动图二维码如果较大,需要进行相关压缩,不
阅读全文
摘要:TWaver 2D for HTML5试用下载: "http://download.servasoft.com/dl/twaver/sssyuwyeriUR/k/twaver html5 5.4.7.zip" TWaver GIS for HTML5试用下载: "http://download.se
阅读全文

浙公网安备 33010602011771号