摘要: 转自http://blog.csdn.net/iwtbavcp/article/details/6455704真的是一篇很冷的帖子,解决了我的大问题Mysql Update sData truncation: Truncated incorrect DOUBLE value:??s最近用JSP和mysql做个东西,遇到一个问题:当使用update语句时出现Data truncation: Truncated incorrect DOUBLE value:??错误.我的一个sql语句这样是:update users set userPwd='12345678' and userR 阅读全文
posted @ 2012-09-28 08:26 todoit 阅读(1420) 评论(0) 推荐(0) 编辑
摘要: 测试环境:Windows XP,MySql 5.0.18,MySql编码gb2312用OUTFILE方法:SELECT 列名 FROM 表名 INTO OUTFILE 'D:/text.xls';如果有乱码,尝试以下方法(来自于http://bjiokn.blog.51cto.com/1021758/390158,没有经过测试)select convert(列名1 using gb2312),convert(列名2 using gb2312) into outfile 'c:/xlstt12.xls' from 表名;、因为EXCEL的默认编码方式是GB2312 阅读全文
posted @ 2012-09-22 11:46 todoit 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 先打pport再回过来打su即可。其他的情况类似。 阅读全文
posted @ 2012-09-13 15:27 todoit 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 作者:吴军http://www.google.com.hk/ggblog/googlechinablog/2006/04/blog-post_7327.html看了第一篇都让人心潮澎湃,决定买本书看看。前言也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个语言问题时,总会感叹数学之美。我们希望利用 Google 中文黑板报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发 Google 产品的。系列一: 统计语言模型 (Statistical Language Models)Google 阅读全文
posted @ 2012-08-31 15:31 todoit 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 开完会后还没有静下心来总结一下,需要反省一下了,下一个阶段还需要很多事情要做:1、统计学和R语言的学习有计划,不能放松;循序渐进,不能贪快;多练习,在暑假开学前把《统计建模与R软件》认真看一遍并实现。2、研究方向既然已经确定,不管喜欢不喜欢,要认真研究下去。目前的打算是看国外的综述文章,找几个重要的模型深入研究下去,争取年前写一篇高质量的论文;同时8月底需要写个大概的出来作为基本科研经费,看来时间还是很紧张,但是这个必须搞定。3、工作与锻炼并重坚持锻炼,晚上小跑一会还是很惬意的。4、这次回家有很多事情要处理,好多同学、老师都很久没见了,好好聊聊。期待和kx,sf的见面。 阅读全文
posted @ 2012-07-30 20:17 todoit 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 在http://www.biostatistic.net/thread-3291-1-1.html看到这样的用法library ( cluster )clusplot ( x, pam(x, 2)$clustering )可以画出如下的图形,明天研究一下。 阅读全文
posted @ 2012-07-23 21:24 todoit 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 1、前面读取数据库不变##连接数据库,将数据库中的文件读取出来#加载包library(RMySQL) #建立连接conn <- dbConnect(dbDriver("MySQL"), dbname = "eswp", user="root", password="root")#读取 表2008yearnewtext = dbReadTable(conn, "sixclasscleaned")[1:594,2:2]#只读取mesh词的那一列,通过前面的第一个下标修改读取的行数,读取20行2 阅读全文
posted @ 2012-07-23 18:58 todoit 阅读(984) 评论(2) 推荐(0) 编辑
摘要: 数据挖掘的隐私边界[2012年07月号总第51期]http://www.ceibsonline.com/commentary/show/index/classid/4/id/1967周庭锐 中国人民大学商学院教授、博导, 北京盛德大业国际管理咨询首席顾问“夜来皓月才当午,重帘悄悄无人语。”古人之所以设下“重帘”,是为了防人耳目,保护隐私。中国古代相术之发达,大概也和这种偏好有关,所谓相由心生。如果单看相貌就可以窥知人心,那么它的威力不亚于今日的数据挖掘技术。有形的重帘容易布置,人类通过行为不知不觉泄露的心事却难防。人类有意识地想要保护自己的隐私,但受制于心智负荷(mental workload 阅读全文
posted @ 2012-07-21 12:10 todoit 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 1、6类数据的导入和处理2、层次聚类和kmeans 的具体理解,包括 (1)如何降维,仅仅靠tf-idf吗,除此以外还有没有别的方法? (2)对层次聚类中每种参数和变量的设置,探讨其对结果的影响,选出最优的参数设置,并写成报告;对其绘图的思考。 (3)对kmeans方法的参数和变量的设置,如何将相关的term画到一起。3、LDA方法的研究。4、本体距离的计算公式。4、最终报告的撰写。 阅读全文
posted @ 2012-07-20 13:31 todoit 阅读(163) 评论(0) 推荐(0) 编辑
摘要: ##连接数据库,将数据库中的文件读取出来#加载包library(RMySQL) #建立连接conn <- dbConnect(dbDriver("MySQL"), dbname = "eswp", user="root", password="root")#读取 表2008yearnewtext = dbReadTable(conn, "2008yearnew")[100:102,2:2]#只读取mesh词的那一列,通过前面的第一个下标修改读取的行数,读取20行#加载tm包library( 阅读全文
posted @ 2012-07-20 13:22 todoit 阅读(1200) 评论(0) 推荐(0) 编辑