Apache Pig是MapReduce的一個(gè)抽象,它是一個(gè)工具/平臺(tái),用于分析較大的數(shù)據(jù)集,并將它們表示為數(shù)據(jù)流。
Apache Pig是MapReduce的一個(gè)抽象,它是一個(gè)工具/平臺(tái),用于分析較大的數(shù)據(jù)集,并將它們表示為數(shù)據(jù)流。Pig通常與Hadoop 一起使用;我們可以使用Pig在Hadoop中執(zhí)行所有的數(shù)據(jù)處理操作。
本教程面向所有從事Hadoop的專業(yè)人員,他們希望執(zhí)行MapReduce操作,而不必在Java中鍵入復(fù)雜的代碼。
為了充分掌握本教程,你應(yīng)該充分了解Hadoop和HDFS命令的基礎(chǔ)知識(shí),而如果你善于SQL會(huì)更有幫助。