沒錯(cuò),Hadoop已經(jīng)被作為一種數(shù)據(jù)分析工具來被人們使用,這種使用應(yīng)歸功于Hive和Pig等姊妹項(xiàng)目;但Hadoop是一個(gè)“批處理”工具,這意味著數(shù)據(jù)請(qǐng)求需要相當(dāng)長(zhǎng)的一段時(shí)間才能完成。而與此相比,Drill的設(shè)計(jì)目的則是效法Dremel,對(duì)海量數(shù)據(jù)進(jìn)行幾乎實(shí)時(shí)的分析。據(jù)谷歌基礎(chǔ)設(shè)施專家烏爾斯·霍澤爾稱,Dremel能在大約三秒鐘時(shí)間里處理1拍字節(jié)的數(shù)據(jù)。
“你擁有一種類似于SQL的語言,能讓制定專設(shè)的查詢請(qǐng)求變得非常簡(jiǎn)單——而且,你不需要做任何編程工作,只需將查詢請(qǐng)求輸入到命令行里即可!被魸蔂栐谏蟼(gè)月向我們說到,他所指的SQL是Structured Query Language,這是傳統(tǒng)數(shù)據(jù)庫(kù)用來處理數(shù)量少得多的數(shù)據(jù)的一種語言。
希蘭表示,Drill的設(shè)計(jì)目的是為Hadoop提供補(bǔ)充,而并非取代后者。他指出,就轉(zhuǎn)換一個(gè)龐大的數(shù)據(jù)集而言,Hadoop是一種最好用的工具。舉例來說,你可以通過海量的網(wǎng)頁(yè)集合來建設(shè)一個(gè)搜索索引;但Drill則允許你從同一個(gè)數(shù)據(jù)集中非常迅速地抽取一小部分信息。
“能對(duì)一拍字節(jié)的數(shù)據(jù)進(jìn)行運(yùn)算,將其變成新的數(shù)據(jù)!毕Lm說道。“通過Dremel或是Drill,你能對(duì)一拍字節(jié)的數(shù)據(jù)進(jìn)行分析,然后得出一拍字節(jié)或少于一拍字節(jié)的數(shù)據(jù)。”他表示,MapR的一些用戶已在將該公司專有版本的Hadoop平臺(tái)與谷歌在線服務(wù)BigQuery配合使用,后一種服務(wù)能讓谷歌以外的公司使用Dremel。
希蘭稱,Drill這個(gè)名稱是由一名谷歌員工提議的,MapR曾與這名員工合作開發(fā)BigQuer。MapR的聯(lián)合創(chuàng)始人斯萊瓦斯也曾在谷歌供職,當(dāng)時(shí)他曾是谷歌搜索基礎(chǔ)設(shè)施建設(shè)團(tuán)隊(duì)的成員之一。就谷歌官方而言,這家公司并未正式參與Drill項(xiàng)目。通過這些龐大的基礎(chǔ)設(shè)施平臺(tái),谷歌傾向于去做自己的事情。
MapR也一直都以做自己的事情而著稱,但這一次則并非如此。
推薦閱讀
做個(gè)網(wǎng)站賣點(diǎn)廣告就算創(chuàng)業(yè)了?
做個(gè)小網(wǎng)站,賣點(diǎn)顯示廣告,就算創(chuàng)業(yè)?圖樣,圖森破(too young,too simple) 2007年,我創(chuàng)辦了一個(gè)免費(fèi)的Blogspot網(wǎng)站,專攻游戲領(lǐng)域。不到6個(gè)月,我通過谷歌Adsense和其他一些渠道就能每月賺3800美元。 一年后,網(wǎng)站>>>詳細(xì)閱讀
本文標(biāo)題:谷歌大數(shù)據(jù)工具衍生新開源平臺(tái)Drill
地址:http://www.brh9h.cn/a/22/20120822/82295.html