TF-IDF算法概念
摘要:TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果中出现的顺序。 TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,.
阅读全文
posted @
2013-05-30 14:13
叮叮猫的编程世界
阅读(429)
推荐(0)
abstract让你的远程代码承受住数据结构的变化
摘要:最近接了一个项目,但是项目比较大一个人在要求的时间根本无法完成。没有办法,只有找外援。外援找到了,为了代码的公用性,我们采用了比较普遍的三层架构的方式。但是我们没有远程的VSS服务器,于是最后商定。一个前台一个后台的方式来做。但是做着做着又出现问题了,项目需求是不断变化的,于是数据库就发生了变化,数据库发生了变化,双方的东西又不一致了。没有办法,就采用了公用的Model层和数据操作层。但是做着还是会因为数据库结构的发生变化而导致DAL层发生变化。最后我们通过一段时间的磨合,采用了abstract类的方式而得到解决。同时也能让你的代码达到更好的协作性。当数据库发生变化时,只要不设计到前台和后台的
阅读全文
posted @
2012-03-22 11:06
叮叮猫的编程世界
阅读(137)
推荐(0)
UML中数据流图详细讲述
摘要:这个文章,是我在急需的情况下在园子里搜索到的,原创作者是:DO-websoftware,为了自己看方便,所以复制到我的空间,希望原创者不要介意哦~~~~很详细的介绍,对我的帮助很大,谢谢哦。。。。类图,对象图,角色图: 一、UML中基本的图范畴: 在UML2中有二种基本的图范畴:结构图和行为图。每个UML图都属于这二个图范畴。结构图的目的是显示建模系统的静态结构。它们包括类,组件和(或)对象图。另一方面,行为图显示系统中的对象的动态行为,包括如对象的方法,协作和活动之类的内容。行为图的实例是活动图,用例图和序列图。二、UML中的类图: 1.类图的表示: 类的UML表示是一个长方形,垂直地分为三
阅读全文
posted @
2012-02-28 12:57
叮叮猫的编程世界
阅读(1875)
推荐(1)
BaiDuSEO影响百度排名的因素
摘要:在SEO行业,很多朋友对Google的排名算法如数家珍,操作起来非常顺手,但对于百度的降权或不收录等问题却一筹莫展,君不见Google左侧排名,Google排名优化等关键字充斥网络,但君可见百度关键字排名?百度搜索引擎优化? Google可以开发网站管理工具给尊贵的站长配合使用,百度仅仅放送网站登入口给您,当然,这个登入口几乎没有什么用。 深入了解百度排名算法才能更好地针对百度进行排名优化,虽然真正的细节只有百度的某些人和天知道。 百度能带给你的流量至少在Google的五倍以上,相对于简体中文网站来说的。 很明显,至少在目前阶段,做好百度的优化要比做好Google优化重要得多,以下是第一页S.
阅读全文
posted @
2012-02-03 12:36
叮叮猫的编程世界
阅读(156)
推荐(0)
搜索引擎排名算法最重要的因素总览
摘要:每两年,SEOmoz都向世界各地的SEO专家们做有关搜索引擎排名算法的调查。今年主要收到了美国、英国、加拿大、澳大利亚、新西兰、冰岛、乌克兰和多米尼加等地方的回复。 每个参加调查的人通过回答特定的问题来评估超过100个有关搜索引擎排名的因素。这篇文章代表了这些专家集体的智慧,也给了SEO各个提供了很好的资源。 影响搜索引擎排名算法的因素总览 24% 域名的权威性和信誉 22% 页面的外链数量和质量 20% 外部链接的锚文字 15% 页面上关键字使用情况 7% 流量和点击率 6% 网络社交关系指标 5% 域名注册和主机数据 5个对搜索引擎排名最重要的因素 外部链接含有关键字...
阅读全文
posted @
2012-02-03 12:35
叮叮猫的编程世界
阅读(154)
推荐(0)
单个页面的优化操作-细节决定排名
摘要:单个网页的最优化时搜索引擎优化的(SEO)的细致工作,需要一页页的展开,所以,这个工作也是让人感到郁闷和不耐烦的事情,特别是要优化很多页面时,那种心情更是…… 可是即时非常的郁闷,但,优化工作,每一页的优化都马虎不得,它直接关系到搜索引擎排名是否如意出现,因此,开始这个工作之前,是需要毅力和耐力的。 网站的优化也被称为页面优化(on-page optimization),就是通过改进页面的修饰性的因素,如标题、描述、题头文字等等,就是尽可能的当搜索引擎访问网站时,能让它迅速的抓住网页的要领,完整的将网页所发布的信息带走,而这些改进,都是围绕着关键词的使用来进行的。 1、重要的网页重命名 一..
阅读全文
posted @
2012-02-03 12:34
叮叮猫的编程世界
阅读(164)
推荐(0)
关于数据库大并发量(未完成)
摘要:一个数据库并发数量是有限制的,比如连接池有多大,如果超出了,怎么处理。有时候就用固定连接数,每个连接处理一个队列。这是一种简单的方式。也比较好理解。还有就是根据数据读写频率,变化频率不同,将表分为多种类别,不同类别数据放入不同的缓存中,利用缓冲区数据减少数据库操作。这种就只是考虑数据存储层的设计当然还有硬件方式提升数据库读写效率的方式数据存储层的设计,是比较麻烦的,根据不同的系统特征和并发特征,有不同的设计模式。当然还要考虑到接口的点简单性,持久化组件将SQL语句完全封装的方式,提升了业务层的开发效率,牺牲了数据层的灵活性。而纯ADO的数据操作模式,虽然增加了灵活度,但是增加了业务层的编写量。
阅读全文
posted @
2012-01-18 11:11
叮叮猫的编程世界
阅读(232)
推荐(0)
管理心得体会
摘要:我对做管理的一些体会,看看不同时期的我是不是看法还是一样的。很多人都觉得,做管理就是那种指手划脚,吩咐别人做事情就好了。刚刚开始做管理的职务的时候,也是犯了这样的问题。让下面的员工很是排斥,于是我问了周围的一些做管理的朋友,一起谈谈他们的管理经验。有人说:管理主要还是动脑筋。在公司内部要自己站好自己的队伍,站中间和朝思慕想的是死得最惨也是最快的。也有人说:管理其本身就是做服务,当你的下面的员工有那个地方需要帮助的时候,你要勇敢的站出来,承担风险,同事给他一个教训。当然也有人说:管理很简单了,就是把事情分派下去就好了。谁不听话就干掉谁。听了类似的很多话,然后结合自己的工作的一些事情总结了下面的一
阅读全文
posted @
2011-12-14 17:07
叮叮猫的编程世界
阅读(151)
推荐(0)
关于http协议头
摘要:转自:http://hi.baidu.com/code100line/blog/item/5c8bb08a072394779f2fb4ee.htmlRequestsHeaderDescriptionExampleAcceptContent-Types that are acceptableAccept: text/plainAccept-CharsetCharacter sets that are acceptableAccept-Charset: iso-8859-5Accept-EncodingAcceptable encodingsAccept-Encoding: compress, g
阅读全文
posted @
2011-12-08 13:22
叮叮猫的编程世界
阅读(254)
推荐(0)
开心一下 你古代的身份。超级好玩~
摘要:很简单,用你名字的拼音首字母。例如:“王二小”=“WEX”=“大理白痴诗人”代码在下面姓氏:A:曹魏;B:东吴;C:蜀汉;D:土番;E:大秦;F:大金;G:大明;H:鲜卑;J:晚清;k西周;L:赵国;M:大辽;N:西夏;O:大宋;P:中山国;Q:东晋;R:羌族;S:民国;T:齐国;W:大理;X:太平天国;Y:南唐;Z:蒙古。中间字:A:阴损;B:绝顶;C:猥琐;D:豪门;E.白痴;F:天才;G:狗屎;H:无敌;J:英勇;:k狗头;L:无双;M:饭桶;N:变态;O:阴暗;P:嗜血;Q:旷世;R:脓包;S:血手;T:平庸;Y:爱国;D:亡国;W:暴力;X:坏鬼;Y:粗旷;Z:逍遥。结字(最后字):
阅读全文
posted @
2010-02-10 09:08
叮叮猫的编程世界
阅读(113)
推荐(0)
Ajax的一些体会
摘要:Ajax的一些体会 Ajax一直都是一个很热的话题。其主要就是运用JavaScript在客户端执行的特性,异步的向服务器发起请求。同时服务器接受请求,获取请求过来的参数,同时返回一些数据。数据主要包括string类型和XML类型。 Ajax好在什么地方呢:首先他提交的数据相对较少,或者说他提交的是可控的,不会提交一些无用的数据。而一些像aspx,asp这些请求,他会把控件状态以及页面信息发送到服务器。从而提交了很多的不必要的数据,必然会影响速度。而且提交的数据多了,服务器反映也会慢一些。处理的数据也会多一些。不错Ajax在这一方面肯定有自己的优势,能够异步提交,不影响客户端的操作,同时提交的数
阅读全文
posted @
2009-09-22 08:48
叮叮猫的编程世界
阅读(100)
推荐(0)
我对三层架构的理解
摘要:架构网站有1多点的时间了吧。但是什么架构才是真正的好的架构的架构呢?不得而知。真正的运用于每个系统,作用于每个系统得东西才是好的吧。三层,一个很通用的架构,其优点,便于网站维护和后续开发。说实话,感觉还是有些不敢苟同。便于网站维护,如果说到网站维护我把DAL层和BLL(数据访问层和业务逻辑层)结合成一层也没有什么吧。即使涉及后续开发,也只是简化了。并没有加重呀。当然,接口还是有一定必要。不是为了好维护,而是为了在进行网站结构的时候能指导程序员进行网站程序的具体实现(其实这一点,很多时候都不会遇见。只有当遇见一个真正大的网站的时候你才会真正的遇见)。下面我简单的说下三成架构。DBUtility
阅读全文
posted @
2009-08-11 08:40
叮叮猫的编程世界
阅读(162)
推荐(0)
大型网站的架构
摘要:转自 http://blog.csdn.net/LoveCherry/archive/2008/06/19/2564096.aspx我们知道,对于一个大型网站来说,可伸缩性是非常重要的,怎么样在纵向和横向有良好的可伸缩性,就需要在做架构设计的时候考虑到一个分的原则,我想在多个方面说一下怎么分:首先是横向的分: 1.大的网站化解为多个小网站:当我们一个网站有多个功能的时候,可以考虑把这个网站拆分成几个小模块,每一个模块可以是一个网站,这样的话我们到时候就可以很灵活地去把这些网站部署到不同的服务器上。 2.静态动态分离:静态文件和动态文件最好分离开成2个网站,我们知道静态网站和动态网站对服务器来说
阅读全文
posted @
2009-04-21 13:10
叮叮猫的编程世界
阅读(157)
推荐(0)
ASP.NET 3.5 企业级开发
摘要:转载自清清月儿的博客空间:http://blog.csdn.net/21aspnet/archive/2008/04/14/2292001.aspx议题.NET Framework 3.5 和Visual Studio 2008C# 面向对象程序设计ASP.NET 状态管理和页面传值ASP.NET 中的错误处理ADO.NET与数据访问架构与模式安全与性能优秀的团队开发管理功能C# 面向对象程序设计封装继承性多态性抽象类接口装箱和拆箱泛型ASP.NET 状态管理和页面传值状态管理概述基于客户端的状态管理基于服务器的状态管理Session stateASP.NET 中的错误处理错误类型错误处理对策
阅读全文
posted @
2009-04-20 10:21
叮叮猫的编程世界
阅读(152)
推荐(0)
今天关于Linq,NHibernate等持久数据的理解
摘要:声明:这篇文章仅仅是我自己对这个东西的理解.读者最好只做一个参考之用最近比较闲,于是我对VS2008 Linq技术进行了研究.其实Linq的实质就是对数据库访问类的一个封装.在java的hibernate开源中,这点可以清晰的理解到. 这个样子,你可以完全把数据当做一个对象进行操纵.这个样子就完成了对数据里面数据的操作. 换句话说,他把面向对象化更加的对象化了.他的最好的一个问题就是,不用你再到数据查询分析器里面去测试那些SQL.Linq里面你必须根据他的规则进行SQL的组合.当你有错误之后也能及时的提示你.减少了SQL中那些无用功.对于初学者,这个是很好的一个东西.上手相对比较容易.不过写了
阅读全文
posted @
2009-04-17 15:47
叮叮猫的编程世界
阅读(118)
推荐(0)
深入浅出net泛型编程
摘要:NET 2.0中泛型的出现是一个令人激动的特征。但是,什么是泛型?你需要它们吗?你会在自己的应用软件中使用它们?在本文中,我们将回答这些问题并细致地分析泛型的使用,能力及其局限性。前言 .NET 2.0中泛型的出现是一个令人激动的特征。但是,什么是泛型?你需要它们吗?你会在自己的应用软件中使用它们?在本文中,我们将回答这些问题并细致地分析泛型的使用,能力及其局限性。类型安全 .NET中的许多语言如C#,C++和VB.NET(选项strict为on)都是强类型语言。作为一个程序员,当你使用这些语言时,总会期望编译器进行类型安全的检查。例如,如果你把对一个Book类型的引用转换成一个Vehic..
阅读全文
posted @
2009-04-17 13:48
叮叮猫的编程世界
阅读(143)
推荐(0)
编程的一些思索
摘要:进入程序的世界有好久了?很久了吧。。。。 曾经有个同学很牛叉的说:“程序嘛,不就是对增 ,删 ,改 ,查”。但是对此很是不敢恭维。反而在深入程序以后,我放到了解到其实这个句话还是有些道理的,不管是一般的软件或者各种的网站,都是把数据提交到数据库或者相应的地方保存。。等等。当然,这也只是一般来说罢了,如果是一个画图软件呢。。呵呵。。。说笑罢了。 程序的最终的目的并不是对数据库的操作,而是利用数据达到对数据的保存。他把数据库当成了最终目的了。换句话说,数据库只是一个中间介质罢了,方便我对数据的统筹。相反,数据库只是为了让我达成程序想要达成的效果。就好像武林高手总是很牛叉的说:“你还停留在以剑驭人的
阅读全文
posted @
2009-01-08 09:12
叮叮猫的编程世界
阅读(116)
推荐(0)
NET 网站优化思想
摘要:新的一年,你的老板或客户,是否曾和你抱怨公司的网站性能愈来愈差?网站大家都会写,自从有了 Visual Studio 之后,连你家楼下的正妹小喵和隔壁的王大婶都会写 ASP.NET。但同样的一个画面,背后的性能却可能是天差地远,更惶论多人同时上线的企业网站,而程序员的身价也因此有所差别。本帖提供一些改善网站性能的点子,从硬件、软件、程序技巧的层面都有,也欢迎大家分享自己的经验或秘技。(1) 重新调整或重新设计 DB schema、索引 (index)一个在线系统的性能不佳,主要原因都是来自于数据库规划及 SQL 语句层面,至于 .NET 程序撰写不良都还在其次。先将数据库适度地做正规化,如:一
阅读全文
posted @
2009-01-05 15:42
叮叮猫的编程世界
阅读(122)
推荐(0)