ACT Talk丨閱面科技趙京雷:人工智能的本質是「人性」復制的過程括细,視覺模塊標準化是未來
ACT Talk丨哈工大何震宇博士:高校與企業(yè)之間互幫互助哥倔,才能更好的促進科研成果產業(yè)化
企業(yè)與高校應該是優(yōu)勢互補秸架、相互推動的關系,兩者如果能夠相互幫助咆蒿,則能夠碰撞出火花东抹。
在 ACT Talk 第二期活動中沃测,來自哈爾濱工業(yè)大學深圳研究院的何震宇博士帶來了機器視覺技術相關的主題分享缭黔,為大家講解了機器視覺技術從算法研究到應用領域的實踐,并探討了高校成果如何產業(yè)化這個問題蒂破。何震宇博士多年來從事人工智能馏谨、機器學習、圖像處理附迷、計算機視覺等領域的研究工作惧互,擁有 10 余項發(fā)明專利及軟件著作權,主持國家喇伯、省市級科研項目10 余項喊儡。
機器視覺的核心問題與視覺發(fā)展的歷程
機器視覺的核心問題是如何描述圖像,每次機器視覺的重大變革都發(fā)生在描述圖像的基礎上:2000 年前后稻据,出現(xiàn)了局部特征描述的算法艾猜,用以判斷兩幅圖之間是否匹配;2000-2005 年捻悯,出現(xiàn)視覺詞袋模型匆赃;2005-2012 年,出現(xiàn)了對象模板 HOG秋度,DPM炸庞,隨后因為深度學習的出現(xiàn),機器視覺發(fā)生了重大變革荚斯。

機器視覺發(fā)展的過程分為三個階段:
第一個階段:低層次的像素(圖像處理)埠居,對應研究的對象是矩陣的像素點查牌、邊緣、角等低層次的圖像信息滥壕。
第二個階段:中層次的目標(圖像分析)纸颜,能夠描述物體局部的特性,比如人臉绎橘、眼胁孙、耳朵等的結構。
第三個階段:高層次的符號(圖像理解)称鳞,是對低層次和中層次信息的融合涮较,例如描述一個人的行為。這一層與深度學習較為契合冈止。

深度學習雖然火熱狂票,但科研還是得踏踏實實
深度學習的神經網絡已有 60 多年的發(fā)展歷程,近兩年得到快速發(fā)展并引起業(yè)界的高度關注熙暴。何震宇認為闺属,從學術界角度來說,不能因為深度學習的火熱而急功近利周霉,而應在理論上有所拓展掂器,踏實的做好相關工作。
目前俱箱,何震宇博士所在的哈工大團隊在深度學習的研究上已有不少成果国瓮,比如基于連通子圖分析的多目標追蹤(用以多人跟蹤的圖像識別技術)、基于多視角學習的單目跟蹤匠楚、基于深度學習的單目跟蹤巍膘、人臉檢測等厂财,并已經發(fā)表了大量的學習論文芋簿,積累了一定數(shù)量的專利。

·基于多視角學習的單目跟蹤

· 基于深度學習的單目跟蹤
高校成果產業(yè)化的過程中璃饱,企業(yè)與高校應互幫互助
何震宇表示与斤,高校成果如何實現(xiàn)產業(yè)化,是多數(shù)學者無法避免的問題荚恶,高校因主要將精力花費在研究成果的不斷出新撩穿、優(yōu)化上,沒有足夠的物質條件谒撼、時間和精力考慮產業(yè)化食寡,而企業(yè)因盈利需要會有相關的思路。兩者看似能夠互補但實際上存在分歧:兩者不是坐在同一條板凳上廓潜,企業(yè)注重成果的及時落地抵皱、變現(xiàn)善榛,另一方的高校則更多的考慮,技術應經過不斷的實踐與優(yōu)化呻畸,才能最終轉換成能夠落地的產品移盆。
何震宇博士認為,做產品涉及到技術伤为、資金咒循、市場等各個方面,產品失敗十分的容易绞愚,成功則萬般的難叙甸,只要某個環(huán)節(jié)出現(xiàn)一點問題就會導致失敗。
何震宇博士說道位衩,一個好的產品涵蓋以下四個部分:一是核心技術蚁署;二是強大、有效率的工程團隊蚂四;三是商業(yè)化光戈,即產品能否抓住痛點,讓客戶為之買單遂赠;四是資本久妆。要注意的是,資本不應急功近利跷睦,而是應該將這四者有機的結合起來筷弦,各方面做到位,才能將拼圖拼好抑诸。
何震宇博士總結道烂琴,企業(yè)與高校應該是優(yōu)勢互補、相互推動的關系蜕乡,高校有相應的技術奸绷、人才優(yōu)勢,企業(yè)有商業(yè)嗅覺层玲、資金号醉、企業(yè)工程等優(yōu)勢,兩者如果能夠相互幫助辛块,則能夠碰撞出火花畔派。