Pada mapreduce job disedikan 2 metode untuk memberikan inputan kepada program map, yaitu single input dan multiple input. Single input digunakan ketika sebuah program hanya membutuhkan 1 inputan baik itu folder/file. Sedangkan multiple input adalah program disetting menerima beberapa folder/file dalam prosesnya.
Dasar Input path pada Hadoop Map Job
Example Single input:
FileInputFormat.addInputPath(job, InputPath);
Multiple Input File/Folder pada Hadoop Map Job
Example Multiple Input:
Path masukanPertama = new Path(args[1]);
Path masukanKedua = new Path(args[2]);
Path keluaran = new Path(args[3]);
MultipleInputs.addInputPath(job, masukanPertama, TextInputFormat.class, Mapper1.class);
MultipleInputs.addInputPath(job, masukanKedua, TextInputFormat.class, Mapper2.class);
FileOutputFormat.setOutputPath(job, keluaran);
No comments:
Post a Comment