SQL在Hadoop - 一種新的路線圖

A+ A-

Hadoop是在世界上最有影響力的大的數據處理工具之一。 這是非常快速和強大。 然而,它的性能甚至可以更好地在Hadoop的SQL的幫助下進行。

Hadoop的SQL是一組可通過其類似於SQL的數據庫,並結合加工簡化您的Hadoop體驗的工具。 這可以被視為大數據管理的歷史突破,因為它可以讓更多的用戶能夠通過簡單的SQL命令Hadoop的接口進行交互。

它還允許與SQL數據庫的幫助下大量數據的易加工。 使它容易對誰使用的查詢語言和誰想要像Hadoop的強大的分析框架的人。 這個工具可以從而幫助用戶節省寶貴的資金在培訓工人的Hadoop的方式。

SQL-的Hadoop

什麼是Hadoop的SQL?

Hadoop的SQL是一種應用程序集合,其中允許使用的SQL在Hadoop中進行評估和處理大數據的命令。 隨著它的到來,對Hadoop框架的大數據處理的世界已經徹底改變和處理,查詢和分析數據現在更容易。 對於SQL查詢,人們需要得到大量的工作要做,具體的map-reduce功能和HDFS(Hadoop分佈式文件系統)的功能。

蜂房數據倉庫是它是為了SQL使用Hadoop集成最早的應用之一。 HiveQL,其應用之一,是專門用來查詢語言輸入轉換成MapReduce的指令。

這類應用的一些其他的例子是Apache的鑽頭,毒刺,Hawq,黑斑羚,阿帕奇星火,熔接機,H-SQL,BigSQL,JethroData,轉眼間,Polybase,Hadapt,TEZ(蜂巢和TEZ的集成)和鯊魚(整合蜂房和星火)。

SQL Hadoop的:它是怎樣的功能?

以這種方式工作的Hadoop的SQL工具:

  • 首先,由用戶提供的SQL-type命令轉化為使用Hadoop的各種連接器的幫助下可讀的MapReduce的指令。 一些連接器是“Microsoft SQL Server的-Hadoop的連接器 '等。這使得它更可解釋的,並與Hadoop框架兼容,”Hadoop的的Oracle SQL連接器 “。
  • 成功轉換後,用戶給定一個SQL命令像處理使用Hadoop的下推系統的幫助下任何其他的MapReduce命令。
  • 查詢跨多個工作站分為更快,更準確的處理與Hadoop的HDFS功能,或Hadoop分佈式文件系統。 這個數據是根據它們的能力和它們的當前工作負載分配到不同的機器。

由用戶SQL查詢保持不變,Hadoop的翻譯查詢命令成能夠容易地解釋和處理的語言。

為什麼在Hadoop的使用SQL?

Hadoop的SQL可以被視為大數據處理領域的一次革命。 這種智能集成可以讓越來越多的用戶使用Hadoop的系統,以便更快地大數據處理。

Hadoop是在世界上最好的大數據處理的應用之一。 但隨著Hadoop的主要問題是,它有一個令人沮喪的艱難的學習曲線,所以很多資金都必須培養員工花在使用它。 此外,它與SQL和其他類似平台有限的兼容性。 因此,在Hadoop的SQL幫助解決所有這些問題用Hadoop,並且將其提供給越來越多的用戶。

Hadoop是更容易使用Hadoop的SQL中使用

與在Hadoop的SQL的到來,Hadoop的初始框架是變甚至比以前更受歡迎。 Hadoop是越來越不受限制。 此前,人們會需要有像HDFS,HBase的或MapReduce的功能Hadoop框架的各個部分廣博的知識,利用Hadoop的正確。 但是現在,隨著SQL的Hadoop的幫助下,用戶只需要有SQL的知識。 隨著在Hadoop SQL的幫助,如數據庫連接,複雜的查詢生成,性能,響應時間等諸多兼容性問題已經被淘汰。

在處理Hadoop的大數據

現在,用戶不需要了解所有的Hadoop框架,以使用它,需要在SQL領域的知識只是幾股,使其工作。 即使用於存儲數據的簡單的SQL被轉換為一個強大的數據處理器。 Hadoop的只是將在自己的可讀格式的SQL查詢和正常處理它。 此外,這是很難正常運轉的許多組件都集成了SQL,操作更簡單。 一個例子是這樣的組件是HDFS,這實際上需要適當的操作專家數據科學家。 然而,現在已經變得更容易和更快。

SQL的Hadoop的缺點

雖然這是SQL在Hadoop可以解決很多問題,很多人還認為它會造成更多的問題。 SQL是由多而沒有強大到足以用Hadoop集成認為太簡單。 這主要是因為當大量數據被放置在其上的SQL執行速度非常緩慢。 有些人認為這種整合作為時間和金錢的浪費。 他們認為,Hadoop的,必須像基於Java和Python工具的大數據處理工具,面向集成。

結論

還有超過SQL和Hadoop之間的整合的話題很多爭論。 然而,很明顯,Hadoop的具有非常有限的查詢功能,它需要的東西,以提高這個方面。 因此,大多數企業選擇在Hadoop上的SQL,因為它是最接近的一種,可以實現這個。

Ads

分享

最近

最好的Ubuntu的替代尋找,如果你是一個Linux愛好者

首先,讓我們越來越熟悉的東西; 基本的,但有點偏離軌道! 你有沒有得到使用Linux和Ubuntu方面困惑? 你任何機...

如何在Gmail收件箱中添加簽名 - 添加在Gmail谷歌的簽名

收件箱由谷歌為谷歌的在過去幾年推出的最好的事情之一。 它帶入一個統一的收件箱幾乎所有我們想要的一切。 我們必須說,設計...

每週科技新聞:諾基亞,谷歌和任天堂

大家好,這是星期五,3月3日,只是像往常一樣,我們又回到我們的每週新聞綜述。 本週的新聞有很多有趣的報導。 從諾基亞的...

樹莓派項目入門 - 你可以用樹莓派做些什麼

樹莓Pi為一系列低功耗,由莓裨基金會創建單板計算機。 最初創建教孩子們計算機科學和編程的基礎知識在發展中國家中,樹莓派...

Android的2017年最佳VPN - 如何使用VPN在安卓

一去不復返的VPN只為高科技,savvies和黑客的天! 而且,承認這一點,我們已經受夠了易怒的演講有關這些服務的。 ...

註釋