9月6日下午消息,針對有媒體報道稱一淘在電商價格戰中公布的數據失實一事,一淘今天對外公布了一淘數據抓取的過程。
據一淘網工程師黑俠介紹,一淘搜索引擎的工作原理與通用搜索類似,都需要經過抓取、抽取、入數據庫、建索引、以及頁面展示等流程。對于購物搜索來說,搜索引擎蜘蛛就等于是一淘派出的“價格情報員”。一淘通過搜索蜘蛛自動瀏覽購物網站的商品頁面,收集所有購物網站的商品信息,抽取出商品標題、商品價格、商品圖片等重要信息存入數據庫,并建成索倒排引,在用戶搜索以后,來自于不同商家的,符合用戶搜索關鍵詞的商品信息就會一一展示出來了。
黑俠稱,在8.15價格戰期間,“價格擂臺”頁面大家電及3C數碼等品類商品的價格數據更新頻率高達到了15分鐘一次。一淘蜘蛛對于參與價格戰的大家電、3C數碼產品價格的抓取頻率高達5分鐘一次。
一淘方面稱,一淘從去年開始就保持著對重要商品、熱門商品價格變化情況的記錄。即使是兩年以前的價格信息,一淘都可以追查出來。
推薦閱讀
9月6日消息, 網易 今日正式將原網易返現更名為惠惠網,并啟用新域名,惠惠網功能包括搜搜比價、返現及導購文章等。 據官方介紹,惠惠網是網易旗下綜合性購物網站,是為消費者代言的導購平臺。惠惠網集合原有道購物搜>>>詳細閱讀
本文標題:一淘回應價格戰數據失實質疑
地址:http://www.brh9h.cn/a/b2b/20120906/83887.html