单机搭建了2.6.5的伪分布式集群,写了一个tf-idf计算程序,分词用的是结巴分词,使用standalone模式运行没有任何问题,切换到伪分布式模式运行一直报错: hadoop is running beyond virtual memory limits 大概意思就是使用虚拟内存超出了限制. 网上参考了好几篇博客,几乎都是再说更改hadoop-env和mapred-site.xml hadoop-env直接更改堆大小 export HADOOP_HEAPSIZE=1000 mapred-si…