09 2013 档案
摘要:把字符串用后缀树的形式表现出来如下:a b c a b c a b c d e .substr[0]b c a b c a b c d e ....substr[1]c a b c a b c d e .......substr[2]a b c a b c d e ..........substr[3]b c a b c d e .............substr[4]c a b c d e ...............substr[5]a b c d e .................substr[6]b c d e ...................substr[7]c d
阅读全文
摘要:这些天找工作,在描述自己的语言技能时,总不知道该怎么说比较清楚。精通?不敢……熟悉?多少才算……一般?了解?索性今天写了个统计代码量的小工具,把最近在做的项目放进去跑了一下,python果然只是“一般”了解,这么少的量……贴个图:代码:using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using System.Drawing;using System.Linq;using System.Text;using System.Windows.Forms;using
阅读全文
摘要:2013百度校园招聘数据挖掘工程师一、简答题(30分)1、简述数据库操作的步骤(10分)步骤:建立数据库连接、打开数据库连接、建立数据库命令、运行数据库命令、保存数据库命令、关闭数据库连接。经萍萍提醒,了解到应该把preparedStatement预处理也考虑在数据库的操作步骤中。此外,对实时性要求不强时,可以使用数据库缓存。2、TCP/IP的四层结构(10分)3、什么是MVC结构,简要介绍各层结构的作用(10分)Model、view、control。我之前有写过一篇《MVC层次的划分》二、算法与程序设计(45分)1、由a-z、0-9组成3位的字符密码,设计一个算法,列出并打印所有可能的密码组
阅读全文
摘要:一个暑假回来到了该找工作的紧张时期了。不过项目还是要继续做嘛,╮(╯_╰)╭,放假前用python爬到了一些网页,也尝试着分了词。现在进入文本挖掘阶段吧。R在数据挖掘和机器学习方面好似很方便,安了试试看。界面跟Matlab有几分相似呢……o(≧v≦)o~~-------2013.9.13----python分词、词频统计、寻找公共词--R还是有点偏向学术计算的语言了,最后还是换上半生不熟的python来做。之前爬到了网页数据(见上片文章【网络爬虫】最后8.3的记录),而且尝试了分词。现在完善了以下处理:1、对所有爬到是网页数据进行分词(没有设立自定义词典)如果设置自定义词典,那么分词效果会更好
阅读全文