参数名称 | 描述 | 示例值 |
mapreduce.jobtracker.address | JobTracker的地址和端口 | localhost:50030 |
mapreduce.tasktracker.map.tasks.maximum | 每个TaskTracker上可以运行的最大Map任务数 | 2 |
mapreduce.tasktracker.reduce.tasks.maximum | 每个TaskTracker上可以运行的最大Reduce任务数 | 2 |
mapreduce.tasktracker.memory.mb | 分配给TaskTracker的内存量(MB) | 1024 |
mapreduce.task.timeout | Task的超时时间(毫秒) | 600000 |
mapreduce.map.memory.mb | 每个Map任务的内存限制(MB) | 512 |
mapreduce.reduce.memory.mb | 每个Reduce任务的内存限制(MB) | 512 |
mapreduce.jobtracker.http.address | JobTracker的HTTP地址和端口 | localhost:50070 |
mapreduce.cluster.local.dir | TaskTracker和JobTracker用于存储本地文件的目录 | /var/lib/hadoop/mapred |
mapreduce.task.io.sort.mb | Task的内部排序缓冲区大小(MB) | 100 |
mapreduce.reduce.shuffle.parallelcopies | Reduce任务并行复制数据的数量 | 5 |
mapreduce.map.output.compress | 是否压缩Map任务的输出 | true |
mapreduce.map.output.compress.codec | Map输出压缩使用的编解码器 | org.apache.hadoop.io.compress.DefaultCodec |
mapreduce.output.fileoutputformat.compress | 是否压缩最终输出数据 | true |
mapreduce.output.fileoutputformat.compress.codec | 最终输出压缩使用的编解码器 | org.apache.hadoop.io.compress.DefaultCodec |
mapreduce.job.jvm.numtasks | JVM实例运行的任务数量,设置这个参数可以减少启动JVM的开销 | 10 |
mapreduce.tasktracker.blacklist.timeout | TaskTracker被加入黑名单后的超时时间(毫秒) | 600000 |
mapreduce.tasktracker.expiry.interval | TaskTracker的心跳超时时间(毫秒) | 600000 |