平台环境:在windows 7中建立VMware虚拟机,操作系统为Ubuntu_14.04_amd_64

1.安装GIZA++

安装步骤如下:

wget http://giza-pp.googlecode.com/files/giza-pp-v1.0.2.tar.gz

tar -xzvf giza-pp-v1.0.2.tar.gz

cd giza-pp

make

cd ../

mkdir bin

cp giza-pp/GIZA++-v2/GIZA++ bin/

cp giza-pp/mkcls-v2/mkcls bin/

cp giza-pp/GIZA++-v2/snt2cooc.out bin/

2.安装SRILM

2.1安装SRILM依赖的包:

(1)C/C++ compiler:编译器gcc 3.4.3及以上版本,本机实验环境为gcc 4.5.22。

(2)GNU make:构建和管理工程的工具,解释Makefile里的指令,描述了整个工程所有文件的编译顺序和编译规则。这里是为了控制SRILM的编译和安装。

(3)GNU gawk:GNU所做的awk程序语言。对于文字资料的修改、对比、抽取等处理,使用c或passcal等不方便且费时,awk 能够以很短的程序完成。这里是处理SRILM里的一些脚本文件。

(4)GNU gzip:使用C语言编写的一种解压缩软件。这里是为了使 SRILM能够处理.Z和.GZ后缀的压缩文件。

(5)bzip2:数据压缩软件,压缩效率更高。这里是使SRILM能处理.bz2后缀的压缩文件。

(6)P7zip:数据压缩软件。这里是使SRILM能处理7-Zip的压缩文件。

(7)Tcl:可嵌入式脚本语言。用于脚本编程和测试。这里是为了SRILM的测试。最好安装tcl8.x和tcl8.x-dev。可以不安装。

(8)csh:Unix shell的一种(这个很重要,安装过程中有个问题困扰了很久,最后发现是csh没有安装的原因)

2.2下载SRILM安装包:

下载链接http://www.speech.sri.com/projects/srilm/download.html

创建安装的目录,并把压缩包解压到该目录。

mkdir srilm

cd srilm

tar -xzvf srilm.tgz

chmod +w Makefile

2.3修改Makefile文件(在srilm目录下)

(1)找到此行:

# SRILM = /home/speech/stolcke/project/srilm/devel,

另起一行输入srilm的安装路径,

SRILM=/home/kkdown/work/mt/srilm

(2)找到此行:

MACHINE_TYPE := (shell (SRILM)/sbin/machine-type),

在其前加#注释掉,并另起一行输入:

MACHINE_TYPE := i686-m64。

此行告诉Makefile之后要看的设置在/home/user/srilm/common/Makefile.machine.i686-m64中。(此处也很重要,因为ubuntu9.0.4 64bit的系统,跟32bit系统的配置方法有所不同。)

(3)需要同时修改sbin/machine-type,将其中对应位置改为

set MACHINE_TYPE =i686-m64

2.4把Ubuntu 14.04系统的相关设定告诉Makefile

用编辑器修改/home/kkdown/work/mt/srilm/common目录下的文件:Makefile.machine.i686-m64

(1)找到:

GCC_FLAGS = -march=athlon64 -m64 -Wreturn-type -Wimplicit

CC = $(GCCPATH)gcc $(GCC_FLAGS) -Wimplicit-int

CXX = $(GCCPATH)g++ $(GCC_FLAGS) -DINSTANTIATE_TEMPLATES

这里是为了告诉SRILM系统使用的compiler(c和c++),符合安装情况,不需要修改。

(2)找到:

# Tcl support (standard in Linux)

TCL_INCLUDE =

TCL_LIBRARY =

NO_TCL = 1

这里是为了告诉SRILM函数库(TCL)在系统中的安装位置,符合安装情况,不需要修改。

(3)找到:GAWK = /usr/bin/awk

修改为:GAWK = /usr/bin/gawk

注:各系统中这些软件的安装情况可能不同,查找软件的安装位置,可使用命令:which is gcc或which is g++或which is gawk等。

2.5修改环境变量

有两种方法可以修改环境变量,任选一种即可。

(1)第一种方法:输入命令:sudo gedit /etc/profilecd ..

找到:

if [ “

PS1′′];thenif[“

BASH” ]; then
PS1=’\u@\h:\w$ ‘
if [ -f /etc/bash.bashrc ]; then
. /etc/bash.bashrc
fi

else
if [ “`id -u`” -eq 0 ]; then
PS1=’# ‘
else
PS1=’

‘fififi在其后另起一行输入:exportPATH=”

PATH:/home/user/srilm/bin/i686-m64:/home/user/srilm/bin”

(2)第二种方法:运行命令:

export PATH=/home/kkdown/work/mt/srilm/bin/i686-m64:/home/kkdown/work/mt/srilm/bin:$PATH

2.6编译SRILM

在srilm目录下面,执行以下命令:

make World

2.7测试是否安装成功

编译通过不等于编译成功,必须利用SRILM提供的测试模块进行测试。需要说明的是,SRILM 1.5.10之前的版本,test文件在主目录下,而从版本1.5.10开始,test文件已不在主目录下,而是分别位于:$SRILM/lm & flm & lattice下,因此他们的测试方法不太一样。

(1)旧版本,进入SRILM根目录,执行

cd test

make all

(2)新版本,进入SRILM根目录,执行

make test

(3)测试过程需要一段时间才能完成,期间会在终端显示一大堆东西,若绝大多数是IDENTICAL,少数是DIFFERS,则表明 SRILM 编译成功了!

3.安装Moses

3.1安装依赖包

(1)官方文档指出必须安装的:

安装命令:sudo apt-get install [package name]

安装以下组件:

g++

git

subversion

automake

libtool

zlib1g-dev

libboost-all-dev

libbz2-dev

liblzma-dev

python-dev

libgoogle-perftools-dev (for tcmalloc)

(2)其他攻略说明必须安装的:

安装命令:sudo apt-get install [package name]

安装组件:

autoconf

automake(重复)

texinfo

zlib1g

zlib1g-dev(重复)

zlib-bin

zlibc

libtool(重复)

libboost-all-dev(重复)

libxmlrpc-c3-dev(找不到,libxmlrpc-core-c3-dev代替)

build-essential

其他组件:

apt-get install mpi-default-dev #安装mpi库
    apt-get install libicu-dev #支持正则表达式的UNICODE字符集

(3)在上一步中,libxmlrpc-c3-dev找不到。

如果安装下面的包, 随后安装Moses,安装失败。

libxmlrpc-core-c3

libxmlrpc-core-c3-dev

但是安装下面的包, 随后安装Moses,安装成功。

xmlrpc-api-utils

libxmlrpc-core-c3

libxmlrpc-core-c3-dev

libxmlrpc-core-c++8

libxmlrpc-core-c++8-dev

3.2编译Moses

(1)下载Moses安装包,执行以下命令:

mkdir moses

git clone git://github.com/moses-smt/mosesdecoder.git moses

(2)编译Moses

cd moses

./bjam -j4 --with-srilm=/home/kkdown/work/mt/srilm --with-giza=/home/kkdown/work/mt/tools  >& log.m &

说明:./bjam -jx,其中x说明是几核处理器,可以加快处理速度,另外两个参数分别指定srilm和giza的安装位置。可以查看log日志文件看是否在编译过程中存在错误。

注意:Moses编译不成功往往都是由于依赖包没有安装完整,比如boost库没有装好。

Moses在Ubuntu14.04平台的安装过程的更多相关文章

  1. Ubuntu14.04下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)

    不多说,直接上干货! 写在前面的话 (1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责.认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentO ...

  2. Ubuntu14.04 Django Mysql安装部署全过程

    Ubuntu14.04 Django Mysql安装部署全过程   一.简要步骤.(阿里云Ubuntu14.04) Python安装 Django Mysql的安装与配置 记录一下我的部署过程,也方便 ...

  3. ubuntu14.04下编译安装ambari-2.4.2.0

    ubuntu14.04下编译安装ambari-2.4.2.0 编译前的准备工作 准备工作有: 系统参数 系统依赖(编译环境) 离线安装包 java环境 maven环境 Nodejs环境 git环境 a ...

  4. Ubuntu14.04(64位)安装ATI_Radeon_R7_M265显卡驱动

    电脑型号:Dell inspiron 14-5447 笔记本 显卡配置:集成显卡Intel核心显卡,Cpu是i5-4210U;独立显卡ATI_Radeon_R7_M265 网上关于ATI/Intel双 ...

  5. eclipse在Ubuntu 13.04下的安装过程

    eclipse在Ubuntu 13.04下的安装过程及问题小记 一.eclipse安装过程 首先确保在安装eclipse之前已经安装好Java虚拟机 1. eclipse官网下载压缩包 下载地址:ht ...

  6. ubuntu14.04下手动安装eclipse

    ubuntu14.04下手动安装eclipse 第一步: 安装jdk 第二步: 下载eclipse,假设下载的文件文件名为eclipse.tar.gz 第三步: 解压 sudo -zxvf ./ecl ...

  7. ubuntu14.04 下手动安装java jdk

    ubuntu14.04 下手动安装java jdk 第一步: 下载jdk.tar.gz (这里假设下载的文件名为jdk.tar.gz) 第二步: 解压 sudo tar -zxvf ./jdk.tar ...

  8. ubuntu14.04 64位 安装Tomcat

    ubuntu14.04 64位 安装Tomcat 1 下载Tomcat 在htt://www.tomcat.apache.org官网上下载apache-tomcat-7.0.57.tar.gz 2 解 ...

  9. ubuntu14.04 64位 安装eclipse

    ubuntu14.04 64位 安装eclipse 1 在官网上下载eclipse http://www.eclipse.org/downloads/下载eclipse-jee-luna-SR1-li ...

随机推荐

  1. 解决WordPress中无法将上传的文件移动至wp-content/uploads

    搭建lnmp环境,放一个wordpress建站系统 lnmp环境很快就搭建完成了,但是在放wordpress的时候出现了一些问题 最主要的问题: 1.第一个是wp-content/uploads没有权 ...

  2. 使用 IntraWeb (38) - TIWAppForm、TIWForm、TIWBaseHTMLForm、TIWBaseForm

    窗体 TIWAppForm 所在单元及继承链: IWAppForm.TIWAppForm 主要成员: property OnURLRequest: TOnURLRequest //响应下面的 DoUR ...

  3. CDN在中国的发展的九个年头的点点滴滴

    对于发展快速的互联网行业来说,8年时间已经足够让一个产业跌宕起伏.但CDN在国内的发展却没有大红大紫,直到2005... 对于发展快速的互联网行业来说,8年时间已经足够让一个产业跌宕起伏.但CDN在国 ...

  4. 获取当前html标签自定义属性的值

    <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/ ...

  5. memcache的一致性hash算法使用

    一.概述 1.我们的memcache客户端(这里我看的spymemcache的源码),使用了一致性hash算法ketama进行数据存储节点的选择.与常规的hash算法思路不同,只是对我们要存储数据的k ...

  6. 实践中的Git常用指令分析

    从工作开始,一直都在使用为知笔记(作为程序员需要知道的内容很多---不需要很深入理解,一段时不使用的东西可能就会忘记).但本周一同步不同PC端时,了解到为知会在2017/1/1开始收费! 既然收费了, ...

  7. php array转json、xml

    class Encode{ public static function jsonEncode($code,$message,$data){ $result = array( 'code' => ...

  8. MYSQL 查询出最大/最小值所在的记录

    基本上都知道用MAX()/MIN()来求出所需的最大/最小值,但是只能查出那个最值的字段,而想查出整条记录或是对应的其他值却不行(SELECT MAX(grade), name FROM test;- ...

  9. DHCP工作过程

    第一步是客户机发出的DHCPDSCOVER广播消息在网络上查找DHCP服务器. 任何收到这个消息的DHCP服务器产生一个DHCPOFFER的广播信息,其中包含配置信息,诸如IP地址.租期和域名.如果在 ...

  10. 【排列组合】bzoj3505 [Cqoi2014]数三角形

    http://blog.csdn.net/zhb1997/article/details/38474795 #include<cstdio> #include<algorithm&g ...