人工智能應用落地如火如荼,科技巨頭間的技術競爭也在風起云涌。3月29日,在國際頂級賽事Pascal VOC挑戰賽目標檢測Competition 3子任務中,搜狗人工智能圖像團隊所提交的FPNSSD深度模型,獲得了77.0的高分,一舉刷新了該項任務的世界最好成績。(成績查詢網址:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=3)。

PASCAL VOC挑戰賽是計算機視覺目標檢測的經典權威賽事,其數據集標注質量高、場景復雜、目標多樣、檢測難度大,是快速檢驗算法有效性的首選。在計算視覺領域,Pascal VOC挑戰賽與ImageNet同為世界頂級的比賽,是國內外AI公司競相展開激烈競爭的主賽場。
PASCAL VOC的數據集包括20個類別:人類,動物(鳥、貓、牛、狗、馬、羊),交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車),室內物體(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。其中,搜狗圖像團隊參加的Competition 3子任務,以官方提供的數據集為訓練集,不能添加其他額外標注數據,更能體現參賽團隊的模型設計和技術功底。
搜狗圖像團隊研發的FPNSSD檢測算法,借鑒了RetinaNet的架構設計思想并優化經典的SSD檢測算法,設計出基于ResNet152的Feature Pyramid Network(FPN)網絡結構,同時融合淺層與深層的多尺度特征信息,這種在模型上的選擇和優化策略大大增強了對小目標物體的檢測能力。在此次挑戰賽中,搜狗圖像團隊的FPNSSD檢測算法在20個子類別中獲得10個單項第一,其中在鳥、貓、狗等小物體類別上勝出優勢明顯,充分驗證了FPNSSD檢測算法在模型結構設計上的先進性。
此外,FPNSSD檢測算法采用SoftmaxLoss + Hard Negative Mining的訓練方式,在FPNSSD框架中相對當前業內常用的基于FocalLoss的訓練方式,能取得更高精度。
搜狗圖像團隊成員大多來自清華、北大、中科院、浙大等高校,曾先后取得幾十項相關技術專利。團隊長期專注于場景文字檢測識別、人臉識別、圖像細粒度分類、敏感圖像檢測、圖像理解等前沿領域研究,相關成果已廣泛應用于搜狗旅行翻譯寶、搜狗翻譯APP、搜狗輸入法、搜狗汪仔答題助手、搜狗識圖等產品,在眾多垂直領域及具體場景中滿足著廣大用戶日益多樣化、個性化的應用需求。
不僅如此,搜狗人工智能圖像團隊的前沿成果,還通過搜狗AI開放平臺,正在為金融、保險、醫療等行業客戶提供優質的AI服務和解決方案。作為人工智能帶路黨的搜狗,未來還將基于圖像識別技術在更多場景實現進一步突破創新,帶來更豐富便捷的AI體驗。
推薦閱讀
Wacom影拓動漫裝觸控數位板在性能方面相當棒,16毫米感應高度60°傾斜角度,133點/秒讀取速率,加上十指觸控設計,重新設計的ExpressKey™4快捷鍵,讓漫畫創意工作事半功倍。更關鍵的是,該產品搭載了繪制漫畫所>>>詳細閱讀
本文標題:搜狗挑戰計算機視覺國際頂級賽事 Pascal VOC 刷新世界最好成績
地址:http://www.brh9h.cn/a/05/305701.html