硅谷創(chuàng)業(yè)公司MapR已經(jīng)發(fā)布了一個(gè)名為Drill的開(kāi)源項(xiàng)目
北京時(shí)間8月22日消息,《連線》雜志編輯凱德·梅茨近日在這份雜志的網(wǎng)絡(luò)版上撰文稱,谷歌的大數(shù)據(jù)工具Hadoop已經(jīng)衍生出了兩個(gè)開(kāi)源平臺(tái),這兩個(gè)平臺(tái)分別是由硅谷創(chuàng)業(yè)公司Cloudera和MapR所構(gòu)建的。其中,MapR已經(jīng)發(fā)布了一個(gè)名為Drill的開(kāi)源項(xiàng)目,尋求模仿谷歌的數(shù)據(jù)分析工具。
以下是這篇文章的全文:
在硅谷邱吉爾俱樂(lè)部最近召開(kāi)的一次會(huì)議上,邁克·奧爾森和約翰·施羅德共用了一個(gè)講臺(tái),但這兩人的觀點(diǎn)并不完全一致。
奧爾森是一家名為Cloudera的硅谷創(chuàng)業(yè)公司的首席執(zhí)行官,施羅德則是MapR的首席執(zhí)行官,這家公司很明顯是Cloudera的競(jìng)爭(zhēng)對(duì)手。兩家公司都在開(kāi)源云計(jì)算軟件平臺(tái)Hadoop上經(jīng)營(yíng)自身業(yè)務(wù),這個(gè)平臺(tái)以數(shù)據(jù)中心技術(shù)為基礎(chǔ),這種技術(shù)為谷歌占據(jù)互聯(lián)網(wǎng)市場(chǎng)主導(dǎo)地位的搜索引擎提供支持。但在構(gòu)建各自業(yè)務(wù)的問(wèn)題上,這兩家創(chuàng)業(yè)公司是從兩個(gè)十分不同的方向靠近這個(gè)平臺(tái)的。
Cloudera與開(kāi)源Hadoop項(xiàng)目密切合作,目的是增強(qiáng)這個(gè)平臺(tái)免費(fèi)向全世界提供的軟件代碼;而與此相比, MapR則決定從頭開(kāi)始重新建設(shè)這個(gè)平臺(tái),而當(dāng)這項(xiàng)工作完成以后,這家公司會(huì)將新的代碼作為專有軟件出售。在上個(gè)月專為Hadoop召開(kāi)的一次專題討論會(huì)上,奧爾森和施羅德登上講臺(tái),就哪家公司的方法最有意義進(jìn)行了面對(duì)面的辯論。正如開(kāi)源項(xiàng)目成為討論主題的許多時(shí)刻那樣,他們兩人之間的爭(zhēng)論也引發(fā)了聽(tīng)眾們的熱議。
施羅德表示,MapR不一定非要反對(duì)開(kāi)放式的開(kāi)發(fā)。他解釋稱,這家公司之所以保密其所開(kāi)發(fā)的代碼,至少有部分原因在于那些推動(dòng)這個(gè)開(kāi)源項(xiàng)目的人不愿迅速地作出MapR希望作出的改變。“在開(kāi)源社區(qū)中有很多政治性的問(wèn)題需要考慮。”他說(shuō)道。“情況會(huì)因你所處的狀況而有所不同。”
似乎是為了證明他的這一觀點(diǎn),MapR已經(jīng)推出了另一個(gè)開(kāi)源項(xiàng)目,旨在將其作為Hadoop平臺(tái)的重大補(bǔ)充。MapR最近向阿帕奇軟件基金會(huì)——負(fù)責(zé)管理Hadoop的非盈利開(kāi)源組織——提出了一個(gè)項(xiàng)目,其目標(biāo)是模仿Dremel,這是一種由谷歌開(kāi)發(fā)和使用的十分有效的數(shù)據(jù)分析工具。這個(gè)項(xiàng)目名為Drill,管理該項(xiàng)目的MapR負(fù)責(zé)人托莫·希蘭表示,該項(xiàng)目適合完全開(kāi)放式的開(kāi)發(fā),這是該公司最初的Hadoop項(xiàng)目所不具備的特點(diǎn)。通過(guò)Hadoop平臺(tái),MapR以往的作法是與一個(gè)根深蒂固的開(kāi)發(fā)者社區(qū)就一個(gè)現(xiàn)有的項(xiàng)目展開(kāi)合作。而在有了Drill以后,這家公司正在開(kāi)創(chuàng)某種新的東西。
希蘭表示,MapR之所以將Drill的開(kāi)發(fā)對(duì)外開(kāi)放,其原因在于該公司希望將這個(gè)平臺(tái)變成能迅速分析在Hadoop上所存數(shù)據(jù)的業(yè)界標(biāo)準(zhǔn)。這家公司希望能促進(jìn)Drill的應(yīng)用程序接口的使用,允許用戶將其他工具嵌入這個(gè)平臺(tái)。
“這是一套新的應(yīng)用程序接口,這是一個(gè)新的系統(tǒng)。”希蘭說(shuō)道,他此前曾供職于惠普和IBM旗下的研究部門(mén)。“如果這些新的應(yīng)用程序接口是開(kāi)放的,那么肯定會(huì)有助于提高使用量。”
通過(guò)建設(shè)開(kāi)放式的Drill項(xiàng)目,這家公司可能還希望贏得全球開(kāi)發(fā)者和IT經(jīng)理的某種認(rèn)同;在構(gòu)建自己專有版本的Hadoop平臺(tái)時(shí),該公司失去了這種認(rèn)同。希蘭對(duì)此作出了否認(rèn),但開(kāi)源社區(qū)中的政治性問(wèn)題會(huì)在許多不同的地方出現(xiàn)——正如上個(gè)月在邱吉爾俱樂(lè)部召開(kāi)的主題討論會(huì)所明確表明的那樣。當(dāng)時(shí),施耐德表示MapR對(duì)開(kāi)源“意識(shí)形態(tài)”問(wèn)題并不感到擔(dān)心,因此招來(lái)了激烈的質(zhì)問(wèn)。開(kāi)源軟件代碼的理由幾乎從來(lái)都不明確,但很明顯的一個(gè)問(wèn)題是,在當(dāng)今的軟件市場(chǎng)上,保持代碼的開(kāi)源性正日益成為從事相關(guān)業(yè)務(wù)的重要組成部分。
這不僅有助于擴(kuò)大軟件代碼的使用度,同時(shí)還能有助于傳播商譽(yù)——而商譽(yù)對(duì)于一家公司來(lái)說(shuō)也是非常重要的。
當(dāng)MapR從2009年開(kāi)始致力于在Hadoop平臺(tái)上進(jìn)行開(kāi)發(fā)工作時(shí),這個(gè)平臺(tái)已經(jīng)在整個(gè)互聯(lián)網(wǎng)范圍內(nèi)被廣泛使用。基于描述了MapReduce和谷歌文件系統(tǒng)——這是兩個(gè)意義深遠(yuǎn)的軟件平臺(tái),它們重新創(chuàng)造了谷歌構(gòu)建自身搜索索引的方式——的研究報(bào)告,Hadoop被雅虎、Facebook及其他公司作為使用數(shù)以千計(jì)的廉價(jià)服務(wù)器來(lái)運(yùn)算海量數(shù)據(jù)的工具。作為這種工具來(lái)說(shuō),Hadoop是非常有效的——一名Facebook工程師曾將其比作我們所呼吸的空氣——但從某種程度上來(lái)說(shuō),象雅虎和Facebook這樣缺乏工程專業(yè)知識(shí)的公司并不太適合使用這種工具。
MapR解決了許多缺陷——其中包括曾困擾谷歌文件系統(tǒng)的一個(gè)顯而易見(jiàn)的缺陷等——但據(jù)施耐德和公司聯(lián)合創(chuàng)始人斯萊瓦斯M.C. Srivas稱,那些推動(dòng)開(kāi)源項(xiàng)目的人不愿象MapR所希望的那樣迅速地作出這些改變。因此,MapR自己對(duì)文件系統(tǒng)進(jìn)行了重新構(gòu)建,并在2011年發(fā)布了自己專有版本的Hadoop,決心為其所做的工程工作謀求財(cái)務(wù)利益。
正如奧爾森所指出的那樣,開(kāi)源Hadoop項(xiàng)目已經(jīng)解決了許多同樣的問(wèn)題;而且他相信,從長(zhǎng)期來(lái)看保持這個(gè)平臺(tái)的核心代碼的開(kāi)放性是一種好得多的解決方案。“最重要的一個(gè)問(wèn)題在于,你想要開(kāi)源軟件,因?yàn)檫@種軟件能突破廠商的封鎖。”他在上個(gè)月召開(kāi)的主題討論會(huì)上說(shuō)道。“你可以把廠商踢出去,而且我們無(wú)法關(guān)閉數(shù)據(jù)的可獲得性,無(wú)法關(guān)閉分析信息的可獲得性,也無(wú)法關(guān)閉數(shù)據(jù)庫(kù)的可獲得性。”
但施耐德則極力主張,奧爾森和Cloudera同樣也提供專有軟件——以Hadoop管理工具的方式——而且他還指出,所有軟件公司都必須找到某種方法來(lái)利用自己的代碼賺錢(qián)。有許多方法能做到這一點(diǎn),而在推出Drill項(xiàng)目以后,MapR也已經(jīng)證明,這家公司同樣也看重開(kāi)放式開(kāi)發(fā)的價(jià)值。
希蘭指出,第三方開(kāi)發(fā)者已經(jīng)表現(xiàn)出自己對(duì)這個(gè)項(xiàng)目的興趣。在MapR向阿帕奇軟件基金會(huì)提交的Drill計(jì)劃中,兩名第三方開(kāi)發(fā)者——分別是一家名為Concurrent的公司的創(chuàng)始人兼首席執(zhí)行官克里斯·溫瑟爾和Drawn to Scale的工程副總裁賴安·羅森——被列為這個(gè)項(xiàng)目的核心開(kāi)發(fā)者。
雖然希蘭指出MapR已經(jīng)對(duì)Hadoop平臺(tái)及其各個(gè)姊妹項(xiàng)目作出了開(kāi)源貢獻(xiàn),但Drill則有所不同,原因是這家公司計(jì)劃開(kāi)放式地構(gòu)建整個(gè)平臺(tái)。按希蘭所說(shuō),這樣做是有必要的。雖然谷歌在2010年發(fā)布了一份描述Dremel的研究報(bào)告,但Hadoop社區(qū)仍有待復(fù)制其相當(dāng)驚人的數(shù)據(jù)分析技術(shù),而MapR則希望確保能以“正確的方法”做到這一點(diǎn)。希蘭表示,這是MapR無(wú)法通過(guò)Hadoop做到的事情。
推薦閱讀
做個(gè)網(wǎng)站賣(mài)點(diǎn)廣告就算創(chuàng)業(yè)了?
做個(gè)小網(wǎng)站,賣(mài)點(diǎn)顯示廣告,就算創(chuàng)業(yè)?圖樣,圖森破(too young,too simple) 2007年,我創(chuàng)辦了一個(gè)免費(fèi)的Blogspot網(wǎng)站,專攻游戲領(lǐng)域。不到6個(gè)月,我通過(guò)谷歌Adsense和其他一些渠道就能每月賺3800美元。 一年后,網(wǎng)站>>>詳細(xì)閱讀
本文標(biāo)題:谷歌大數(shù)據(jù)工具衍生新開(kāi)源平臺(tái)Drill
地址:http://www.brh9h.cn/a/22/20120822/82295.html