欲戴王冠必先承其重~*: Spark save(insert) to Phoenix sample code

先前學會怎麼用 Spark 取出在Phoenix的資料，現在我們來學學怎麼 save 資料(insert)至 Phoenix
，然後再學怎麼從 Table1 轉資料進入 Table2

1.首先至 $PHOENIX_HOME/bin 下執行 sqlline.py localhost(or your zookeeper address)
使用下列 DDL Command Create table
CREATE TABLE INPUT_TABLE (id BIGINT NOT NULL PRIMARY KEY, col1 VARCHAR, col2 INTEGER);
CREATE TABLE OUTPUT_TABLE (id BIGINT NOT NULL PRIMARY KEY, col1 VARCHAR, col2 INTEGER);

2.使用 Spark-shell 準備 insert 資料嘍!
import org.apache.phoenix.spark._

val dataSet = List((4L, "4", 4), (5L, "5", 5), (6L, "6", 6))

sc.parallelize(dataSet).saveToPhoenix("INPUT_TABLE",Seq("ID","COL1","COL2"),zkUrl = Some("192.168.13.61:2181"))

3.回到 Phoneix 查詢結果吧!

Nice ，儲存成功!

------------------------------------------------------------------------------------------------------------------------
現在我們試著寫一段程式將 INPUT_TABLE 資料存入 OUTPUT_TABLE 吧!

import org.apache.spark.sql._
import org.apache.phoenix.spark._

// Load INPUT_TABLE
val df = sqlContext.load("org.apache.phoenix.spark", Map("table" -> "INPUT_TABLE","zkUrl" -> "localhost"))

// Save to OUTPUT_TABLE
df.save("org.apache.phoenix.spark",SaveMode.Overwrite, Map("table" -> "OUTPUT_TABLE","zkUrl" -> "localhost"))

#注意，我這邊ZK設 localhost，是因為我 Spark-shell 此台Server同時也是 zookeeper 其中之一