在好例子网,分享、交流、成长!
您当前所在位置:首页Others 开发实例一般编程问题 → hadoop权威指南(第四版)配套源码及气象数据集示例

hadoop权威指南(第四版)配套源码及气象数据集示例

一般编程问题

下载此实例
  • 开发语言:Others
  • 实例大小:2.94M
  • 下载次数:6
  • 浏览次数:103
  • 发布时间:2021-01-11
  • 实例类别:一般编程问题
  • 发 布 人:好学IT男
  • 文件格式:.rar
  • 所需积分:2
 

实例介绍

【实例简介】
便宜出售了,hadoop权威指南(第四版)配套源码、气象数据集文件,包括1901和1902年的部分数据,第三和第四版都可用的源代码,吐血奉献。
【实例截图】
【核心代码】
0afe0fad-8435-46ee-801f-0146d5c99086
├── 1901
├── 1902
└── hadoop-book-第三四版都可用
├── appc
│   └── src
│   └── main
│   └── sh
│   ├── create_ncdc_files.sh
│   ├── load_ncdc_map.sh
│   ├── load_ncdc.sh
│   └── ncdc_files.txt
├── book
│   ├── pom.xml
│   └── src
│   └── main
│   └── assembly
│   ├── jar.xml
│   └── oozie-workflow-application.xml
├── ch02-mr-intro
│   ├── pom.xml
│   └── src
│   └── main
│   ├── awk
│   │   └── max_temperature.sh
│   ├── cpp
│   │   ├── Makefile
│   │   └── max_temperature.cpp
│   ├── examples
│   │   ├── MaxTemperature
│   │   │   ├── input.txt
│   │   │   └── output
│   │   │   └── part-r-00000
│   │   ├── max_temperature.cpp.input.txt
│   │   ├── max_temperature_hadoop_cluster.input.txt
│   │   ├── max_temperature_hadoop.input.txt
│   │   ├── max_temperature_py
│   │   │   ├── 2
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-00000
│   │   │   ├── input.txt
│   │   │   ├── output
│   │   │   │   └── part-r-00000
│   │   │   └── pseudo
│   │   │   ├── input.txt
│   │   │   └── output
│   │   │   └── part-00000
│   │   ├── MaxTemperatureWithCombiner
│   │   │   ├── input.txt
│   │   │   └── output
│   │   │   └── part-r-00000
│   │   └── OldMaxTemperature
│   │   ├── input.txt
│   │   └── output
│   │   └── part-00000
│   ├── java
│   │   ├── MaxTemperature.java
│   │   ├── MaxTemperatureMapper.java
│   │   ├── MaxTemperatureReducer.java
│   │   ├── MaxTemperatureWithCombiner.java
│   │   ├── oldapi
│   │   │   ├── MaxTemperature.java
│   │   │   ├── MaxTemperatureMapper.java
│   │   │   ├── MaxTemperatureReducer.java
│   │   │   └── MaxTemperatureWithCombiner.java
│   │   └── OldMaxTemperature.java
│   ├── python
│   │   ├── max_temperature_map.py
│   │   └── max_temperature_reduce.py
│   ├── ruby
│   │   ├── max_temperature_map.rb
│   │   └── max_temperature_reduce.rb
│   └── sh
│   └── max_temp.sh
├── ch03-hdfs
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── conf
│   │   │   ├── core-site.xml
│   │   │   └── hdfs-site.xml
│   │   ├── java
│   │   │   ├── DateRangePathFilter.java
│   │   │   ├── FileCopyWithProgress.java
│   │   │   ├── FileSystemCat.java
│   │   │   ├── FileSystemDoubleCat.java
│   │   │   ├── ListStatus.java
│   │   │   ├── RegexExcludePathFilter.java
│   │   │   ├── RegexPathFilter.java
│   │   │   └── URLCat.java
│   │   └── sh
│   │   ├── file.sh
│   │   └── hars.sh
│   └── test
│   └── java
│   ├── CoherencyModelTest.java
│   ├── FileSystemDeleteTest.java
│   ├── FileSystemGlobTest.java
│   └── ShowFileStatusTest.java
├── ch04-yarn
│   ├── capacity-scheduler.xml
│   └── fair-scheduler.xml
├── ch05-io
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── examples
│   │   │   ├── FileDecompressor.java.input.txt
│   │   │   ├── hadoop-fs-text.input.txt
│   │   │   ├── hadoop-fs-text.output.txt
│   │   │   ├── MapFile-data-head.input.txt
│   │   │   ├── MapFile-data-head.output.txt
│   │   │   ├── MapFile-index.input.txt
│   │   │   ├── MapFile-index.output.txt
│   │   │   ├── MapFile-ls.input.txt
│   │   │   ├── MapFile-ls.output.txt
│   │   │   ├── MapFileWriteDemo.java.input.txt
│   │   │   ├── MaxTemperatureWithCompression
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-r-00000.gz
│   │   │   ├── MaxTemperatureWithMapOutputCompression.ignore
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-r-00000
│   │   │   ├── SequenceFileMapReduceSort.java.input.txt
│   │   │   ├── SequenceFileMapReduceSortResults.java.input.txt
│   │   │   ├── SequenceFileMapReduceSortResults.java.output.txt
│   │   │   ├── SequenceFileMapReduceSortResults.java.pre.sh
│   │   │   ├── SequenceFileReadDemo.java.input.txt
│   │   │   ├── SequenceFileReadDemo.java.output.txt
│   │   │   ├── SequenceFileReadDemo.java.pre.sh
│   │   │   ├── SequenceFileToMapFileConverter-fix.java.input.txt
│   │   │   ├── SequenceFileToMapFileConverter-mv.java.input.txt
│   │   │   ├── SequenceFileToMapFileConverter-sort.java.input.txt
│   │   │   ├── SequenceFileWriteDemo.java.input.txt
│   │   │   ├── SequenceFileWriteDemo.java.output.txt
│   │   │   ├── StreamCompressor.java.input.txt
│   │   │   ├── StreamCompressor.java.output.txt
│   │   │   ├── TextIterator.java.input.txt
│   │   │   └── TextIterator.java.output.txt
│   │   └── java
│   │   ├── FileDecompressor.java
│   │   ├── IntPair.java
│   │   ├── MapFileFixer.java
│   │   ├── MapFileWriteDemo.java
│   │   ├── MaxTemperatureWithCompression.java
│   │   ├── MaxTemperatureWithMapOutputCompression.java
│   │   ├── oldapi
│   │   │   ├── IntPair.java
│   │   │   ├── MaxTemperatureWithCompression.java
│   │   │   ├── MaxTemperatureWithMapOutputCompression.java
│   │   │   └── TextPair.java
│   │   ├── PooledStreamCompressor.java
│   │   ├── SequenceFileReadDemo.java
│   │   ├── SequenceFileWriteDemo.java
│   │   ├── StreamCompressor.java
│   │   ├── TextArrayWritable.java
│   │   ├── TextIterator.java
│   │   └── TextPair.java
│   └── test
│   ├── java
│   │   ├── ArrayWritableTest.java
│   │   ├── BinaryOrTextWritable.java
│   │   ├── BooleanWritableTest.java
│   │   ├── BytesWritableTest.java
│   │   ├── FileDecompressorTest.java
│   │   ├── GenericWritableTest.java
│   │   ├── IntPairTest.java
│   │   ├── IntWritableTest.java
│   │   ├── MapFileSeekTest.java
│   │   ├── MapWritableTest.java
│   │   ├── NullWritableTest.java
│   │   ├── ObjectWritableTest.java
│   │   ├── SequenceFileSeekAndSyncTest.java
│   │   ├── StringTextComparisonTest.java
│   │   ├── TextPairTest.java
│   │   ├── TextTest.java
│   │   ├── VIntWritableTest.java
│   │   ├── VLongWritableTest.java
│   │   └── WritableTestBase.java
│   └── resources
│   └── file.gz
├── ch06-mr-dev
│   ├── input
│   │   └── ncdc
│   │   └── micro
│   │   └── sample.txt
│   ├── output
│   │   ├── part-r-00000
│   │   └── _SUCCESS
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── examples
│   │   │   ├── ConfigurationPrinterSystem.java.input.txt
│   │   │   ├── ConfigurationPrinterWithConfAndD.java.input.txt
│   │   │   ├── ConfigurationPrinterWithConf.java.input.txt
│   │   │   ├── ConfigurationPrinterWithConf.java.output.txt
│   │   │   ├── ConfigurationPrinterWithD.java.input.txt
│   │   │   ├── ConfigurationPrinterWithD.java.output.txt
│   │   │   ├── MaxTemperatureDriver.java.input.txt
│   │   │   ├── MaxTemperatureDriverV2GOP.ignore
│   │   │   │   └── input.txt
│   │   │   ├── MaxTemperatureDriverV2.ignore
│   │   │   │   └── input.txt
│   │   │   ├── MaxTemperatureDriverV3
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-r-00000
│   │   │   └── MaxTemperatureDriverV3GOP
│   │   │   ├── input.txt
│   │   │   └── output
│   │   │   └── part-r-00000
│   │   ├── java
│   │   │   ├── ConfigurationPrinter.java
│   │   │   ├── LoggingDriver.java
│   │   │   ├── LoggingIdentityMapper.java
│   │   │   ├── v1
│   │   │   │   ├── MaxTemperatureMapper.java
│   │   │   │   └── MaxTemperatureReducer.java
│   │   │   ├── v2
│   │   │   │   ├── MaxTemperatureDriver.java
│   │   │   │   ├── MaxTemperatureMapper.java
│   │   │   │   └── NcdcRecordParser.java
│   │   │   ├── v3
│   │   │   │   ├── MaxTemperatureDriver.java
│   │   │   │   └── MaxTemperatureMapper.java
│   │   │   └── v4
│   │   │   ├── MaxTemperatureDriver.java
│   │   │   ├── MaxTemperatureMapper.java
│   │   │   └── NcdcRecordParser.java
│   │   └── resources
│   │   ├── configuration-1.xml
│   │   ├── configuration-2.xml
│   │   ├── max-temp-workflow
│   │   │   └── workflow.xml
│   │   └── max-temp-workflow.properties
│   └── test
│   ├── java
│   │   ├── MultipleResourceConfigurationTest.java
│   │   ├── SingleResourceConfigurationTest.java
│   │   ├── v1
│   │   │   ├── MaxTemperatureMapperTest.java
│   │   │   └── MaxTemperatureReducerTest.java
│   │   ├── v2
│   │   │   ├── MaxTemperatureDriverMiniTest.java
│   │   │   ├── MaxTemperatureDriverTest.java
│   │   │   └── MaxTemperatureMapperTest.java
│   │   └── v4
│   │   └── MaxTemperatureMapperTest.java
│   └── resources
│   └── expected.txt
├── ch08-mr-types
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── examples
│   │   │   ├── default_streaming.input.txt
│   │   │   ├── MaxTemperatureWithMultipleInputs
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-r-00000
│   │   │   ├── MinimalMapReduce
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-00000
│   │   │   ├── MinimalMapReduce.java.input.txt
│   │   │   ├── MinimalMapReduceWithDefaults
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-00000
│   │   │   ├── minimal_streaming.input.txt
│   │   │   ├── PartitionByStationUsingMultipleOutputFormat.java.input.txt
│   │   │   ├── PartitionByStationUsingMultipleOutputs
│   │   │   │   ├── 2
│   │   │   │   │   ├── input.txt
│   │   │   │   │   └── output
│   │   │   │   │   ├── 029070-99999-r-00000
│   │   │   │   │   ├── 029500-99999-r-00000
│   │   │   │   │   ├── 029600-99999-r-00000
│   │   │   │   │   ├── 029720-99999-r-00000
│   │   │   │   │   ├── 029810-99999-r-00000
│   │   │   │   │   ├── 227070-99999-r-00000
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   ├── 029070-99999-r-00000
│   │   │   │   ├── 029500-99999-r-00000
│   │   │   │   ├── 029600-99999-r-00000
│   │   │   │   ├── 029720-99999-r-00000
│   │   │   │   ├── 029810-99999-r-00000
│   │   │   │   ├── 227070-99999-r-00000
│   │   │   │   └── part-r-00000
│   │   │   ├── PartitionByStationYearUsingMultipleOutputs
│   │   │   │   ├── 2
│   │   │   │   │   ├── input.txt
│   │   │   │   │   └── output
│   │   │   │   │   ├── 029070-99999
│   │   │   │   │   │   ├── 1901
│   │   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   │   └── 1902
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   ├── 029500-99999
│   │   │   │   │   │   ├── 1901
│   │   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   │   └── 1902
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   ├── 029600-99999
│   │   │   │   │   │   ├── 1901
│   │   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   │   └── 1902
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   ├── 029720-99999
│   │   │   │   │   │   ├── 1901
│   │   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   │   └── 1902
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   ├── 029810-99999
│   │   │   │   │   │   ├── 1901
│   │   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   │   └── 1902
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   ├── 227070-99999
│   │   │   │   │   │   ├── 1901
│   │   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   │   └── 1902
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   ├── 029070-99999
│   │   │   │   │   ├── 1901
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   └── 1902
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── 029500-99999
│   │   │   │   │   ├── 1901
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   └── 1902
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── 029600-99999
│   │   │   │   │   ├── 1901
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   └── 1902
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── 029720-99999
│   │   │   │   │   ├── 1901
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   └── 1902
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── 029810-99999
│   │   │   │   │   ├── 1901
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   └── 1902
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── 227070-99999
│   │   │   │   │   ├── 1901
│   │   │   │   │   │   └── part-r-00000
│   │   │   │   │   └── 1902
│   │   │   │   │   └── part-r-00000
│   │   │   │   └── part-r-00000
│   │   │   ├── SmallFilesToSequenceFileConverter.ignore
│   │   │   │   └── input.txt
│   │   │   └── SmallFilesToSequenceFileConverter.java.input.txt
│   │   ├── java
│   │   │   ├── MaxTemperatureWithMultipleInputs.java
│   │   │   ├── MinimalMapReduce.java
│   │   │   ├── MinimalMapReduceWithDefaults.java
│   │   │   ├── NonSplittableTextInputFormat.java
│   │   │   ├── oldapi
│   │   │   │   ├── MaxTemperatureWithMultipleInputs.java
│   │   │   │   ├── MinimalMapReduce.java
│   │   │   │   ├── MinimalMapReduceWithDefaults.java
│   │   │   │   ├── NonSplittableTextInputFormat.java
│   │   │   │   ├── PartitionByStationUsingMultipleOutputFormat.java
│   │   │   │   ├── PartitionByStationUsingMultipleOutputs.java
│   │   │   │   ├── PartitionByStationYearUsingMultipleOutputFormat.java
│   │   │   │   ├── SmallFilesToSequenceFileConverter.java
│   │   │   │   ├── StationPartitioner.java
│   │   │   │   ├── WholeFileInputFormat.java
│   │   │   │   └── WholeFileRecordReader.java
│   │   │   ├── PartitionByStationUsingMultipleOutputs.java
│   │   │   ├── PartitionByStationYearUsingMultipleOutputs.java
│   │   │   ├── SmallFilesToSequenceFileConverter.java
│   │   │   ├── StationPartitioner.java
│   │   │   ├── WholeFileInputFormat.java
│   │   │   └── WholeFileRecordReader.java
│   │   └── sh
│   │   └── streaming.sh
│   └── test
│   └── java
│   └── TextInputFormatsTest.java
├── ch09-mr-features
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── examples
│   │   │   ├── JoinRecordWithStationName
│   │   │   │   ├── 2
│   │   │   │   │   ├── input.txt
│   │   │   │   │   └── output
│   │   │   │   │   └── part-r-00000
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-r-00000
│   │   │   ├── LookupRecordByTemperature.java.input.txt
│   │   │   ├── LookupRecordByTemperature.java.output.txt
│   │   │   ├── LookupRecordsByTemperature.java.input.txt
│   │   │   ├── LookupRecordsByTemperature.java.output.txt
│   │   │   ├── MaxTemperatureByStationNameUsingDistributedCacheFileApi.ignore
│   │   │   │   └── input.txt
│   │   │   ├── MaxTemperatureByStationNameUsingDistributedCacheFile.java.input.txt
│   │   │   ├── MaxTemperatureUsingSecondarySort
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-r-00000
│   │   │   ├── MaxTemperatureWithCounters
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   └── part-r-00000
│   │   │   ├── MaxTemperatureWithCounters.java.input.txt
│   │   │   ├── MissingTemperatureFields.java.input.txt
│   │   │   ├── SortByTemperatureToMapFile.ignore
│   │   │   │   └── input.txt
│   │   │   ├── SortByTemperatureUsingHashPartitioner.ignore
│   │   │   │   └── input.txt
│   │   │   ├── SortByTemperatureUsingHashPartitioner.java.input.txt
│   │   │   ├── SortByTemperatureUsingTotalOrderPartitioner.java.input.txt
│   │   │   ├── SortDataPreprocessor.ignore
│   │   │   │   └── input.txt
│   │   │   └── SortDataPreprocessor.java.input.txt
│   │   ├── java
│   │   │   ├── JoinRecordMapper.java
│   │   │   ├── JoinRecordWithStationName.java
│   │   │   ├── JoinReducer.java
│   │   │   ├── JoinStationMapper.java
│   │   │   ├── LookupRecordByTemperature.java
│   │   │   ├── LookupRecordsByTemperature.java
│   │   │   ├── MaxTemperatureByStationNameUsingDistributedCacheFile.java
│   │   │   ├── MaxTemperatureUsingSecondarySort.java
│   │   │   ├── MaxTemperatureWithCounters.java
│   │   │   ├── MissingTemperatureFields.java
│   │   │   ├── oldapi
│   │   │   │   ├── JoinRecordMapper.java
│   │   │   │   ├── JoinRecordWithStationName.java
│   │   │   │   ├── JoinReducer.java
│   │   │   │   ├── JoinStationMapper.java
│   │   │   │   ├── LookupRecordByTemperature.java
│   │   │   │   ├── LookupRecordsByTemperature.java
│   │   │   │   ├── MaxTemperatureByStationNameUsingDistributedCacheFileApi.java
│   │   │   │   ├── MaxTemperatureByStationNameUsingDistributedCacheFile.java
│   │   │   │   ├── MaxTemperatureUsingSecondarySort.java
│   │   │   │   ├── MaxTemperatureWithCounters.java
│   │   │   │   ├── MissingTemperatureFields.java
│   │   │   │   ├── SortByTemperatureToMapFile.java
│   │   │   │   ├── SortByTemperatureUsingHashPartitioner.java
│   │   │   │   ├── SortByTemperatureUsingTotalOrderPartitioner.java
│   │   │   │   ├── SortDataPreprocessor.java
│   │   │   │   └── TemperatureDistribution.java
│   │   │   ├── SortByTemperatureToMapFile.java
│   │   │   ├── SortByTemperatureUsingHashPartitioner.java
│   │   │   ├── SortByTemperatureUsingTotalOrderPartitioner.java
│   │   │   ├── SortDataPreprocessor.java
│   │   │   └── TemperatureDistribution.java
│   │   ├── python
│   │   │   ├── max_daily_temp_map.py
│   │   │   ├── max_daily_temp_reduce.py
│   │   │   ├── mean_max_daily_temp_map.py
│   │   │   ├── mean_max_daily_temp_reduce.py
│   │   │   ├── mean_max_daily_temp.sh
│   │   │   ├── secondary_sort_map.py
│   │   │   ├── secondary_sort_reduce.py
│   │   │   └── secondary_sort.sh
│   │   ├── r
│   │   │   ├── fixed-partitions
│   │   │   ├── output
│   │   │   ├── output_sorted
│   │   │   ├── sampled-partitions
│   │   │   ├── temperature_distribution.png
│   │   │   └── temperature_distribution.r
│   │   └── resources
│   │   ├── MaxTemperatureWithCounters_Temperature.properties
│   │   └── oldapi
│   │   └── MaxTemperatureWithCounters_Temperature.properties
│   └── test
│   └── java
│   └── KeyFieldBasedComparatorTest.java
├── ch10-setup
│   └── src
│   └── main
│   ├── conf
│   │   ├── core-site.xml
│   │   ├── hdfs-site.xml
│   │   └── yarn-site.xml
│   └── sh
│   └── trash.sh
├── ch12-avro
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── assembly
│   │   │   └── job.xml
│   │   ├── c
│   │   │   └── dump_pairs.c
│   │   ├── examples
│   │   │   ├── AvroGenericMaxTemperature
│   │   │   │   ├── input.txt
│   │   │   │   └── output
│   │   │   │   ├── part-r-00000.avro
│   │   │   │   └── _SUCCESS
│   │   │   └── AvroSort
│   │   │   ├── input.txt
│   │   │   └── output
│   │   │   ├── part-r-00000.avro
│   │   │   └── _SUCCESS
│   │   ├── java
│   │   │   ├── AvroGenericMaxTemperature.java
│   │   │   ├── AvroSort.java
│   │   │   ├── NcdcRecordParser.java
│   │   │   └── oldapi
│   │   │   ├── AvroGenericMaxTemperature.java
│   │   │   ├── AvroProjection.java
│   │   │   ├── AvroSort.java
│   │   │   ├── AvroSpecificMaxTemperature.java
│   │   │   └── NcdcRecordParser.java
│   │   ├── py
│   │   │   ├── test_avro.py
│   │   │   └── write_pairs.py
│   │   └── resources
│   │   ├── AliasedStringPair.avsc
│   │   ├── Array.avsc
│   │   ├── Enum.avsc
│   │   ├── Fixed.avsc
│   │   ├── Map.avsc
│   │   ├── NewStringPair.avsc
│   │   ├── NewStringPairWithNull.avsc
│   │   ├── ProjectedStringPair.avsc
│   │   ├── SortedStringPair.avsc
│   │   ├── StringPair.avsc
│   │   ├── SwitchedStringPair.avsc
│   │   ├── Union.avsc
│   │   └── WeatherRecord.avsc
│   └── test
│   └── java
│   └── AvroTest.java
├── ch13-parquet
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── assembly
│   │   │   └── job.xml
│   │   ├── examples
│   │   │   └── TextToParquetWithAvro
│   │   │   ├── input.txt
│   │   │   └── output
│   │   │   ├── _metadata
│   │   │   ├── part-m-00000.parquet
│   │   │   └── _SUCCESS
│   │   └── java
│   │   ├── ParquetToTextWithAvro.java
│   │   ├── ParquetToTextWithExample.java
│   │   ├── TextToParquetWithAvro.java
│   │   └── TextToParquetWithExample.java
│   └── test
│   ├── java
│   │   ├── ParquetMRWithAvroTest.java
│   │   ├── ParquetMRWithExampleTest.java
│   │   └── ParquetTest.java
│   └── resources
│   ├── fruit.txt
│   ├── NewStringPair.avsc
│   ├── ProjectedStringPair.avsc
│   └── StringPair.avsc
├── ch14-flume
│   ├── spool-to-hdfs-and-logger.properties
│   ├── spool-to-hdfs-avro.properties
│   ├── spool-to-hdfs-partitioned.properties
│   ├── spool-to-hdfs.properties
│   ├── spool-to-hdfs-tiered-load-balance.properties
│   ├── spool-to-hdfs-tiered.properties
│   └── spool-to-logger.properties
├── ch15-sqoop
│   ├── pom.xml
│   ├── src
│   │   └── main
│   │   └── java
│   │   ├── MaxWidgetIdGenericAvro.java
│   │   ├── MaxWidgetId.java
│   │   └── Widget.java
│   └── widgets
│   └── part-m-00000.avro
├── ch16-pig
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── grunt
│   │   │   ├── combine.grunt
│   │   │   ├── disambiguate.grunt
│   │   │   ├── flatten.grunt
│   │   │   ├── foreach.grunt
│   │   │   ├── group.grunt
│   │   │   ├── join.grunt
│   │   │   ├── max_temp.grunt
│   │   │   ├── missing.grunt
│   │   │   ├── multiquery.grunt
│   │   │   ├── null.grunt
│   │   │   ├── schema.grunt
│   │   │   ├── set.grunt
│   │   │   ├── sort.grunt
│   │   │   ├── store.grunt
│   │   │   ├── stream.grunt
│   │   │   ├── tuples.grunt
│   │   │   ├── types.grunt
│   │   │   └── udfs.grunt
│   │   ├── java
│   │   │   └── com
│   │   │   └── hadoopbook
│   │   │   └── pig
│   │   │   ├── CutLoadFunc.java
│   │   │   ├── IsGoodQuality.java
│   │   │   ├── Range.java
│   │   │   └── Trim.java
│   │   ├── pig
│   │   │   ├── comment_c-style.pig
│   │   │   ├── comment_single_line.pig
│   │   │   ├── max_temp_filter_stream.pig
│   │   │   ├── max_temp_filter_udf.pig
│   │   │   ├── max_temp.macro
│   │   │   ├── max_temp_macro_import.pig
│   │   │   ├── max_temp_macro.pig
│   │   │   ├── max_temp_param.param
│   │   │   ├── max_temp_param.pig
│   │   │   ├── max_temp.pig
│   │   │   ├── max_temp_station_name.pig
│   │   │   └── year_stats.pig
│   │   └── python
│   │   └── is_good_quality.py
│   └── test
│   └── java
│   └── com
│   └── hadoopbook
│   └── pig
│   ├── IsGoodQualityTest.java
│   └── RangeTest.java
├── ch17-hive
│   ├── pom.xml
│   └── src
│   └── main
│   ├── hive
│   │   ├── buckets.hive
│   │   ├── conversions.hive
│   │   ├── indexes.hive
│   │   ├── joins.hive
│   │   ├── mapreduce.hive
│   │   ├── max_temp.hive
│   │   ├── multitable_insert.hive
│   │   ├── partitions.hive
│   │   ├── regex_serde.hive
│   │   ├── set.hive
│   │   ├── sort.hive
│   │   ├── storage.hive
│   │   ├── types.hive
│   │   └── udfs.hive
│   ├── java
│   │   └── com
│   │   └── hadoopbook
│   │   └── hive
│   │   ├── Maximum.java
│   │   ├── Mean.java
│   │   └── Strip.java
│   └── python
│   ├── is_good_quality.py
│   └── max_temperature_reduce.py
├── ch18-crunch
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── assembly
│   │   │   └── hadoop-job.xml
│   │   └── java
│   │   └── crunch
│   │   ├── AvroGenericMaxTemperatureCrunch.java
│   │   ├── JoinRecordWithStationNameCrunch.java
│   │   ├── MaxTemperatureByStationNameCrunch.java
│   │   ├── MaxTemperatureCrunch.java
│   │   ├── MaxTemperatureCrunchWithShutdownHook.java
│   │   ├── MaxTemperatureUsingSecondarySortCrunch.java
│   │   ├── MaxTemperatureWithCompressionCrunch.java
│   │   ├── MaxTemperatureWithCountersCrunch.java
│   │   ├── MaxTemperatureWithMultipleInputsCrunch.java
│   │   ├── MetOfficeRecordParser.java
│   │   ├── NcdcRecordParser.java
│   │   ├── NcdcStationMetadataParser.java
│   │   ├── SortByTemperatureCrunch.java
│   │   └── SplitCrunch.java
│   └── test
│   ├── java
│   │   └── crunch
│   │   ├── CheckpointTest.java
│   │   ├── CountValuesFn.java
│   │   ├── CustomDoFn.java
│   │   ├── InversePairFn.java
│   │   ├── JoinTest.java
│   │   ├── MaterializeTest.java
│   │   ├── NonSerializableOuterClass.java
│   │   ├── ObjectReuseTest.java
│   │   ├── PageRankTest.java
│   │   ├── PCollections.java
│   │   ├── PipelineDebugTest.java
│   │   ├── PipelineExecutionTest.java
│   │   ├── PrimitiveOperationsTest.java
│   │   ├── SerializableFunctionsTest.java
│   │   ├── SortTest.java
│   │   ├── SourcesAndTargetsTest.java
│   │   ├── ToLowerFn.java
│   │   ├── TypesTest.java
│   │   └── WeatherRecord.java
│   └── resources
│   ├── A
│   ├── B
│   ├── fruit.txt
│   ├── ints.txt
│   ├── log4j.properties
│   ├── numbers.seq
│   ├── sample.txt
│   ├── set1.txt
│   ├── set2.txt
│   └── urls.txt
├── ch19-spark
│   ├── pom.xml
│   └── src
│   ├── main
│   │   ├── java
│   │   │   └── MaxTemperatureSpark.java
│   │   ├── python
│   │   │   └── MaxTemperature.py
│   │   └── scala
│   │   ├── MaxTemperature.scala
│   │   └── MaxTemperatureWithPlacement.scala
│   └── test
│   ├── avro
│   │   ├── IntWrapper.avsc
│   │   └── WeatherRecord.avsc
│   ├── java
│   │   └── SimpleTest.java
│   ├── resources
│   │   ├── fruit.txt
│   │   ├── log4j.properties
│   │   ├── numbers.seq
│   │   ├── quangle.txt
│   │   └── set2.txt
│   └── scala
│   ├── CustomKryoRegistrator.scala
│   ├── DataSerializationTest.scala
│   ├── FunctionSerializationTest.scala
│   ├── RDDCreationTest.scala
│   ├── ReflectWeatherRecord.scala
│   ├── SharedDataTest.scala
│   ├── TransformationsAndActionsTest.scala
│   └── WordCountHistogramTest.scala
├── ch20-hbase
│   ├── pom.xml
│   └── src
│   └── main
│   └── java
│   ├── ExampleClient.java
│   ├── HBaseStationImporter.java
│   ├── HBaseStationQuery.java
│   ├── HBaseTemperatureBulkImporter.java
│   ├── HBaseTemperatureDirectImporter.java
│   ├── HBaseTemperatureImporter.java
│   ├── HBaseTemperatureQuery.java
│   ├── NewExampleClient.java
│   ├── NewHBaseStationImporter.java
│   ├── NewHBaseStationQuery.java
│   ├── NewHBaseTemperatureQuery.java
│   ├── RowKeyConverter.java
│   └── SimpleRowCounter.java
├── ch21-zk
│   ├── pom.xml
│   └── src
│   └── main
│   ├── java
│   │   ├── ActiveKeyValueStore.java
│   │   ├── ConfigUpdater.java
│   │   ├── ConfigWatcher.java
│   │   ├── ConnectionWatcher.java
│   │   ├── CreateGroup.java
│   │   ├── DeleteGroup.java
│   │   ├── JoinGroup.java
│   │   ├── ListGroup.java
│   │   ├── ResilientActiveKeyValueStore.java
│   │   └── ResilientConfigUpdater.java
│   └── sh
│   └── group.sh
├── ch22-case-studies
│   ├── pom.xml
│   └── src
│   └── main
│   └── java
│   ├── fm
│   │   └── last
│   │   └── hadoop
│   │   ├── io
│   │   │   └── records
│   │   │   └── TrackStats.java
│   │   └── programs
│   │   └── labs
│   │   └── trackstats
│   │   └── TrackStatisticsProgram.java
│   └── TrackStats.jr
├── common
│   ├── pom.xml
│   └── src
│   ├── main
│   │   └── java
│   │   ├── JobBuilder.java
│   │   ├── MetOfficeRecordParser.java
│   │   ├── NcdcRecordParser.java
│   │   ├── NcdcStationMetadata.java
│   │   ├── NcdcStationMetadataParser.java
│   │   └── oldapi
│   │   ├── JobBuilder.java
│   │   ├── MetOfficeRecordParser.java
│   │   ├── NcdcRecordParser.java
│   │   ├── NcdcStationMetadata.java
│   │   └── NcdcStationMetadataParser.java
│   └── test
│   └── java
│   ├── MetOfficeRecordParserTest.java
│   ├── NcdcRecordParserTest.java
│   └── NcdcStationMetadataParserTest.java
├── conf
│   ├── hadoop
│   │   └── pseudo-distributed
│   │   ├── core-site.xml
│   │   ├── hdfs-site.xml
│   │   ├── mapred-site.xml
│   │   └── yarn-site.xml
│   ├── hadoop-cluster.template.xml
│   ├── hadoop-localhost.xml
│   ├── hadoop-local.xml
│   ├── pig
│   │   └── localhost
│   │   └── pig.properties
│   └── zookeeper
│   ├── cluster
│   │   └── zoo.cfg
│   ├── localhost
│   │   └── zoo.cfg
│   └── log4j.properties
├── hadoop-examples
│   └── pom.xml
├── hadoop-meta
│   └── pom.xml
├── input
│   ├── avro
│   │   └── pairs.avro
│   ├── badrecords
│   │   ├── a
│   │   ├── b
│   │   └── c
│   ├── docs
│   │   ├── 1400-8.txt
│   │   └── quangle.txt
│   ├── fileglob
│   │   ├── 2007
│   │   │   └── 12
│   │   │   ├── 30
│   │   │   │   ├── data-2007-12-30
│   │   │   │   └── data[2007-12-30]
│   │   │   └── 31
│   │   │   └── data-2007-12-31
│   │   └── 2008
│   │   └── 01
│   │   └── 01
│   │   └── data-2008-01-01
│   ├── fileinput
│   │   ├── a
│   │   └── dir
│   │   └── b
│   ├── hive
│   │   ├── dummy.txt
│   │   ├── joins
│   │   │   ├── sales.txt
│   │   │   └── things.txt
│   │   ├── partitions
│   │   │   ├── file1
│   │   │   ├── file2
│   │   │   ├── file3
│   │   │   ├── file4
│   │   │   ├── file5
│   │   │   └── file6
│   │   ├── README
│   │   ├── tables
│   │   │   ├── users_extended.txt
│   │   │   └── users.txt
│   │   ├── tmp.txt
│   │   ├── types
│   │   │   ├── complex.txt
│   │   │   └── nested.txt
│   │   └── udfs
│   │   ├── arrays.txt
│   │   ├── fruit.txt
│   │   ├── max1.txt
│   │   └── max2.txt
│   ├── metoffice
│   │   ├── aberporthdata.txt
│   │   ├── armaghdata.txt
│   │   ├── bradforddata.txt
│   │   ├── braemardata.txt
│   │   ├── cambridgedata.txt
│   │   ├── cardiffdata.txt
│   │   ├── durhamdata.txt
│   │   ├── eastbournedata.txt
│   │   ├── greenwichdata.txt
│   │   ├── hurndata.txt
│   │   ├── lerwickdata.txt
│   │   ├── leucharsdata.txt
│   │   ├── newtonriggdata.txt
│   │   ├── oxforddata.txt
│   │   ├── paisleydata.txt
│   │   ├── ringwaydata.txt
│   │   ├── rossonwyedata.txt
│   │   ├── shawburydata.txt
│   │   ├── sheffielddata.txt
│   │   ├── southamptondata.txt
│   │   ├── stmawgandata.txt
│   │   ├── stornowaydata.txt
│   │   ├── suttonbonningtondata.txt
│   │   ├── tireedata.txt
│   │   ├── valleydata.txt
│   │   └── yeoviltondata.txt
│   ├── ncdc
│   │   ├── all
│   │   │   ├── 1901.gz
│   │   │   └── 1902.gz
│   │   ├── metadata
│   │   │   ├── ish-history.txt
│   │   │   └── stations-fixed-width.txt
│   │   ├── micro
│   │   │   └── sample.txt
│   │   ├── micro-tab
│   │   │   ├── sample2.txt
│   │   │   ├── sample_corrupt.txt
│   │   │   └── sample.txt
│   │   ├── sample.txt
│   │   └── sample.txt.gz
│   ├── pig
│   │   ├── combine
│   │   │   ├── A
│   │   │   └── B
│   │   ├── corrupt
│   │   │   └── missing_fields
│   │   ├── foreach
│   │   │   └── A
│   │   ├── group
│   │   │   └── A
│   │   ├── join
│   │   │   ├── A
│   │   │   └── B
│   │   ├── multiquery
│   │   │   └── A
│   │   ├── nested
│   │   │   ├── A
│   │   │   └── B
│   │   ├── pairwise
│   │   │   └── postings
│   │   ├── schema
│   │   │   └── A
│   │   ├── sort
│   │   │   └── A
│   │   ├── tuples
│   │   │   └── A
│   │   ├── types
│   │   │   ├── A
│   │   │   ├── B
│   │   │   ├── C
│   │   │   └── one
│   │   └── udfs
│   │   └── A
│   ├── smallfiles
│   │   ├── a
│   │   ├── b
│   │   ├── c
│   │   ├── d
│   │   ├── e
│   │   └── f
│   └── wikipedia
│   ├── example.xml
│   └── sample.xml
├── pom.xml
├── README.md
└── snippet
├── bin
│   ├── check_expected.sh
│   ├── check_manuscript.py
│   ├── check_manuscript.sh
│   ├── generate_listings.sh
│   ├── grunter.sh
│   ├── hiver.sh
│   ├── phragmite_db.pl
│   ├── phragmite_hive.py
│   └── phragmite_pig.py
├── conf
│   ├── local
│   │   ├── capacity-scheduler.xml
│   │   ├── configuration.xsl
│   │   ├── container-executor.cfg
│   │   ├── core-site.xml
│   │   ├── hadoop-env.cmd
│   │   ├── hadoop-env.sh
│   │   ├── hadoop-metrics2.properties
│   │   ├── hadoop-metrics.properties
│   │   ├── hadoop-policy.xml
│   │   ├── hdfs-site.xml
│   │   ├── httpfs-env.sh
│   │   ├── httpfs-log4j.properties
│   │   ├── httpfs-signature.secret
│   │   ├── httpfs-site.xml
│   │   ├── log4j.properties
│   │   ├── mapred-env.cmd
│   │   ├── mapred-env.sh
│   │   ├── mapred-queues.xml.template
│   │   ├── mapred-site.xml
│   │   ├── mapred-site.xml.template
│   │   ├── slaves
│   │   ├── ssl-client.xml.example
│   │   ├── ssl-server.xml.example
│   │   ├── yarn-env.cmd
│   │   ├── yarn-env.sh
│   │   └── yarn-site.xml
│   └── pseudo
│   ├── capacity-scheduler.xml
│   ├── capacity-scheduler.xml.old
│   ├── configuration.xsl
│   ├── container-executor.cfg
│   ├── core-site.xml
│   ├── fair-scheduler.xml
│   ├── hadoop-env.cmd
│   ├── hadoop-env.sh
│   ├── hadoop-metrics2.properties
│   ├── hadoop-metrics.properties
│   ├── hadoop-policy.xml
│   ├── hdfs-site.xml
│   ├── httpfs-env.sh
│   ├── httpfs-log4j.properties
│   ├── httpfs-signature.secret
│   ├── httpfs-site.xml
│   ├── log4j.properties
│   ├── mapred-env.cmd
│   ├── mapred-env.sh
│   ├── mapred-queues.xml.template
│   ├── mapred-site.xml
│   ├── mapred-site.xml.template
│   ├── slaves
│   ├── ssl-client.xml.example
│   ├── ssl-server.xml.example
│   ├── yarn-env.cmd
│   ├── yarn-env.sh
│   └── yarn-site.xml
├── expected
│   └── ch11
│   └── grunt
│   ├── combine_schema.xml
│   ├── combine_union.xml
│   ├── foreach_generate.xml
│   ├── group_all.xml
│   ├── group_dump.xml
│   ├── group_expression.xml
│   ├── join_cogroup_flatten.xml
│   ├── join_cogroup_inner.xml
│   ├── join_cogroup_join.xml
│   ├── join_cogroup.xml
│   ├── join_dump.xml
│   ├── join_frj.xml
│   ├── join_join.xml
│   ├── max_temp_describe_records.xml
│   ├── max_temp_dump_grouped_records.xml
│   ├── max_temp_dump_records.xml
│   ├── max_temp_filter_records.xml
│   ├── max_temp_load.xml
│   ├── max_temp_max_temp.xml
│   ├── max_temp_result.xml
│   ├── missing_fields.xml
│   ├── null_corrupt.xml
│   ├── null_count.xml
│   ├── null_dump.xml
│   ├── null_split.xml
│   ├── null_undetected.xml
│   ├── schema_absent_projected.xml
│   ├── schema_absent.xml
│   ├── schema_names_only.xml
│   ├── schema_one_type_only.xml
│   ├── schema_types.xml
│   ├── set_debug_on.xml
│   ├── sort_dump.xml
│   ├── sort_limit.xml
│   ├── sort_no_order.xml
│   ├── sort_order.xml
│   ├── store_colon_delimited.xml
│   ├── stream_cut.xml
│   ├── udfs_invoke_long.xml
│   ├── udfs_invoke_short.xml
│   ├── udfs_load.xml
│   ├── udfs_register.xml
│   └── udfs_schema.xml
├── pom.xml
├── README
└── src
└── test
├── java
│   └── ExamplesIT.java
└── resources
├── copyoutput.sh
└── setup.sh

340 directories, 777 files

标签:

实例下载地址

hadoop权威指南(第四版)配套源码及气象数据集示例

不能下载?内容有错? 点击这里报错 + 投诉 + 提问

好例子网口号:伸出你的我的手 — 分享

网友评论

发表评论

(您的评论需要经过审核才能显示)

查看所有0条评论>>

小贴士

感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。

  • 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  • 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
  • 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  • 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。

关于好例子网

本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明

;
报警