賴能和先生是中國石油東方地球物理研究所的總工程師。記者在研討會后采訪了他,首先了解了國內石油勘探的發展現狀。
在介紹現在國內石油勘探的現狀之前,有必要介紹一下高性能計算在石油勘探中的作用。大家對勘探的認知還停留在傳統的打井驗證——野外勘探人員背著各種專用設備,通過一系列地質勘探的方法來偵測,甚至是預估所探測地區的地層中是否存在石油,而后在這個區域內打上幾口試驗性的油井,以驗證其預估是否準確。
這種方式早已過時,因為石油的分布并不是一個典型的“盆地”形狀,而是由一個個彼此隔離的“葡萄串”組成的,因此在不夠精準的勘測結果面前,人們只能多鉆井進行嘗試,而且只有將油井鉆到一個儲有石油的“葡萄”頂部,才算成功——然而打井做實驗的成本非常高昂。為提高石油勘探的能力和效率并降低其成本,石油企業很快就開始在勘探中采用了更為先進的地球物理方法,尤其是地震波法。
所謂地震波法,簡而言之就是用炸藥在地面激起人工地震波,這種地震波可傳入地下深處,并在碰到不同形態的地質構成時形成不同的反射波,這些反射波經地面的檢波器收集、轉變成電子信號后可存儲為數據,通過對這些數據進行計算處理,人們就能清晰地摸擬還原出勘測區域的地下地質構造,并找到那些存有石油或天然氣的巖層的精確位置。
那么目前中石油的高性能計算勘探應用發展到什么程度了呢?
目前與地震波法石油勘探相關的高性能計算應用軟件,按計算性質可分為地震資料處理(seismic processing)和油藏模擬(reservoir simulation)兩大類
利用高性能計算摸擬油藏分布圖
從應用的特點上來看,地震資料處理是典型的浮點計算密集型應用,以求解數據密集的波動方程為主要計算模式,因此對浮點計算能力要求較高,對內存帶寬的占用中等,對大量炮集的處理需要良好的多核擴展性。不同于在算法上以頻譜計算為核心的地震資料處理軟件,油藏模擬對計算平臺的要求是需要支持稀疏矩陣方程的迭代求解,對內存帶寬的要求非常高,并需要大緩存支持,因此這類軟件可歸為對內存帶寬高度敏感的計算密集應用。
賴能和先生首先介紹了中國石油東方地球物理公司研究院處理中心的基本情況。他談到,最近一年以來東方地球物理公司研究院的變化非常大,目前數據中心中共有處理器23000多個,核心數量達到了75000個以上,理論峰值為695千萬億次。而就處理中心的的情況來說,擁有GPU數量為936個,約為45萬個核心,可以實現576千萬億次。
賴能和先生對筆者表示,當今的高性能計算遇到了諸多的問題,如多處理器協同工作,CPU+GPU模式的能耗管理,但是最重要的還在于大數據應用中遇到的存儲瓶頸和數據安全問題。
他表示,大數據的環境下,高性能計算動輒幾十TB甚至上百TB的數據,如何保存及備份都遇到了非常棘手的問題。賴總認為——計算機時代實際上已經進入了存儲的時代。以往,存儲設備還只是作為服務器的輔助產品、輔助設備而出現的,比如服務器本身會有存儲的磁盤,而外接存儲只是用來存儲數據。但是今天,存儲設備的投資占了IT投資的一半以上。
就中國石油東方地球物理公司研究院來說,每天增加的數據量都需要以TB級別來衡量。海量的存儲、海量的數據怎么管理?這其中關鍵的有兩個問題:一是性能能不能提高上去,二是怎么管理。他表示,東方地球物理研究院正在逐步使用并行系統,從DAS這樣的傳統存儲架構進化到NAS,以及自行搭建的SAN系統,通過數字化管理、監控等手段逐步提升存儲系統的性能和效率。
這方面賴總采用的是自行GPFS文件系統架構,而對于目前較火熱的Hadoop架構,賴總表示了興趣,并稱未來會在這方面做相關的測試。
另外,雖然目前已經看到了大數據應用的趨勢,但是大數據還并不是非常普遍,幾十TB的數據在一年內可能只有2-3次會應用到,因此更多的時候還是需要分布式架構來解決。比如中國石油東方地球物理公司研究院正在專門搭建一套高密度、海量數據的數據處理系統。這套系統完全采用當前最先進的至強E5-2600系列處理器,搭載128GB或者256Gb的內存及超大容量的存儲系統(5TB左右),網絡方面會采用萬兆網絡,以提供強大的性能和良好的穩定性。
去年的問題跟蹤(之前采訪賴總時的問題跟蹤):
1、 之前東方地球物理研究所采用了不少單路服務器,現在呢?
答:現在主要是雙路,四路和八路也有。因為以前由于SMP架構下,應用的內存分配限制,因此用四路會導致內存不足。而在地震解釋方面,就會使用單路、雙路、四路以及八路服務器。賴能和總工表示,現在的八路服務器已經完全能使用。
2、之前4月份的時候您在HP Gen8服務器發布會上登臺宣講說是在測試SL250 Gen8產品,現在怎么樣了?
答:當時沒過多久我們就下單采購了,SL250 Gen8系列產品是它們HP的高可擴展服務器,現在主要用來做GPU加速運算,主要用于逆時運算等復雜的并行計算。
2、 針對大數據這一塊您說會投入5000萬左右,主要將采用什么系統呢?
答:會主要采購雙路的服務器產品,用來打造高密度海量計算系統,內存大概在128GB,5TB存儲,網絡方面在考慮用Infiniband或萬兆以太網產品。
推薦閱讀
志在打造“亞洲鋰都”的江西宜春,最近陷入了“泡沫工業”之爭。 《每日經濟新聞》此前報道,宜春提出,要把鋰電新能源產業作為全市經濟建設的“一號工程”、建設“幸福宜春”的第一產業,通過打造完整的鋰電新能源產>>>詳細閱讀
本文標題:石油物探面臨大數據 HPC挑戰更大
地址:http://www.brh9h.cn/a/22/20120809/80489.html