从README.md开始
Requirements
*Fedora Core 22(基于Red Hat Linux)
*clang++ 3.4(Linux 下常用的 C/C++ 编译器,了解一下,clang++的安装看这里)
*boost 1.57(拓展的C++程序库,了解一下,boost的安装看这里)
*yaml-cpp 0.5.1(C++下yaml的解析包,yaml了解一下,yaml-cpp了解一下,yaml-cpp的安装看这里)
*ICU4C 54.1(ICU在C/C++平台下的版本,了解一下)
USAGE
Compilation
1 ``` 2 tar xzf cnn.tar.gz 3 tar xzf eigen.tar.gz 4 mkdir build 5 cd build 6 cmake .. -DEIGEN3_INCLUDE_DIR=eigen -DCMAKE_CXX_COMPILER=/usr/bin/clang++ 7 make 8 cd .. 9 ```
解释:
cnn是C++的神经网络库,安装cnn需要boost库和eigen库。eigen是开源的C++矩阵计算工具,非常方便矩阵操作。详细内容
解压缩命令可以看一下这里。
cmake的介绍看这里,上边的cmake语句中指定了eigen和clang++的路径作为参数。cmake具体执行的CMakeLists.txt中的操作看这里。
Creation of Directories
1 mkdir dict models
建立dict和models目录。
Preparation of the pretrained embeddings
1 cd dict/ 2 wget http://tti-coin.jp/data/wikipedia200.bin 3 cd ..
在dict目录中下载GloVe的pretrained word embeddings作为实验中用到的word embeddings。关于各种pretrained word embeddings详情可以看这里。
Preparation of the data sets
see [data/README.md] (data/README.md)
关于data的README的详情看这里。
Training Models
ACE 2005 (Relation extraction)
1 ./build/relation/RelationExtraction --train -y yaml/parameter-ace2005.yaml