如何做数据的分类?

常见的数据分类方式有2种,一种是按照数据所属的类别进行层次分类,一种是采用关键字或者标签的方式进行分类。

到底哪种方式好呢?我想本身并不应该有明显的界限,如果数据本身就不叫有层次划分如:生物学中的种、属、科、目等层次的分类,那么采用层次分类比较好;一般而言采用关键字的方式比较有弹性,使数据可以隶属为多个关键字,使单一数据适应多个分类。

现在产品的系统中主要采用的层次分类的方式,明显发现了一个数据对应多个特性的时候,检索的不方便,我想最佳的方式是可以兼顾2种方式,以达到更好的效果。

但是在分析的时候发现,关键字的提取,就是现在流行的打标签做法,比较麻烦,如果录入数据的时候在录入关键字,用户是比较讨厌的,因此如果录入的数据纯文本的,标签应该可以从录入的数据中辅助用户采集,如果录入的数据是2进制的数据,则只能手工来做了。

现在看通过标签来扩展系统的特性,是一个很不错的办法,我们系统中原先存在一个“锁定”的特性,只有“锁定”和“解锁”2个状态,现在用户希望出现“锁定、解锁、临时锁定。。。”给“锁定”增加多种状态,原先的设计就不合适了,因此关键字的做法就更好了。

posted on 2007-01-15 15:57  Duiker  阅读(2060)  评论(0编辑  收藏  举报

导航