News and information
2024.01.10來源: 安防小能手編輯:
?在科技日新月異的時代,各種引人入勝的視界變化盡收眼底。然而,在安防領域,我們始終回歸到對圖像的追求和打磨,這種本初的精神是我們形成現今以智能視頻為核心的安防應用大生態的關鍵。
圖像識別的發展歷程
圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。
圖像識別是人工智能的一個重要領域。為了編制模擬人類圖像識別活動的計算機程序,人們提出了不同的圖像識別模型。例如模板匹配模型,這種模型認為,識別某個圖像,必須在過去的經驗中有這個圖像的記憶模式,又叫模板。當前的刺激如果能與大腦中的模板相匹配,這個圖像也就被識別了。但是,人能識別的圖像是大量的,不可能做到所識別的每一個圖像在腦中都有一個相應的模板。于是,格式塔心理學家又提出了一個原型匹配模型,這種模型認為,在長時記憶中存儲的并不是所要識別的無數個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識別的圖像。這種模型從神經上和記憶探尋的過程上來看,都比模板匹配模型更適宜,但是,這種模型沒有說明人是怎樣對相似的刺激進行辨別和加工的,也難以在計算機程序中得到實現。因此又有人提出了一個更復雜的模型,即“泛魔”識別模型。
圖像識別的發展經歷了三個階段:文字識別、數字圖像處理與識別、物體識別。
文字識別的研究是從 1950年開始的,一般是識別字母、數字和符號,從印刷文字識別到手寫文字識別, 應用非常廣泛。
數字圖像處理和識別的研究開始于1965年。數字圖像與模擬圖像相比具有存儲、傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優勢,這些都為圖像識別技術的發展提供了強大的動力。
物體的識別主要指的是對三維世界的客體及環境的感知和認識,屬于高級的計算機視覺范疇。它是以數字圖像處理與識別為基礎的結合人工智能、系統學等學科的研究方向,其研究成果被廣泛應用在各種工業及探測機器人上?,F代圖像識別技術的一個不足就是自適應性能差,一旦目標圖像被較強的噪聲污染或是目標圖像有較大殘缺往往就得不出理想的結果。
一個圖像識別過程通常主要需要分為四步:
一是信息數據獲取,圖像識別的前提是信息數據的獲取,將特殊信號通過各類傳感器轉化為電信號,從而獲取到所需的信息,存儲在數據庫中。
二是信息數據預處理,這部分主要是對圖像進行去噪、平滑及變換等處理,凸顯圖像中重要的信息及特征。
三是特征選擇與提取,這是圖像識別技術的關鍵內容,特別是在識別模式中,其實際操作要求更高,這也直接決定了圖像是否能夠被成功識別,能否儲存所提取的特征。
四是分類器設計及決策分類,可根據某種規律識別圖像,而并非在識別中處于比較盲目和混亂的狀態,基于此對規律進行識別以突顯出相似的特征種類,使圖像識別過程具有更高的辨識率,再通過識別特殊特征,實現評價和確認圖像的目標。
機器視覺的“技術雛形”
既然回首過去,對于圖像,行業最開始做法是不斷為圖像做加法,一堆的后處理技術進行科研突破,最為明顯體現在視頻圖像處理技術,簡而言之就是用計算機對視頻數字圖像進行處理,其本質是一種信號處理過程,而且是離散信號處理。
這其實就是機器視覺的最初技術形態,雖功能有限,但底子還在??磮D像處理技術應用價值,有幾個方面:
其一,提高圖像的視感質量,如進行圖像的亮度、彩色變換,增強、抑制某些成分,對圖像進行幾何變換等,以改善視頻圖像的質量。
其二,提取視頻圖像中所包含的某些特征或特殊信息,這些被提取的特征或信息往往為計算機分析圖像提供便利。
其三,視頻圖像增強與復原。圖像增強的目的是將圖像轉換為更適合人和機器的分析的形式。
其四,圖像的分析。從圖像中抽取某些有用的度量、數據和信息,以的到某種數值結果。
其五,能使圖像再現性。圖像在數字化時準確地表現了原稿,則數字圖像處理過程始終能保持圖像的再現。
其六,靈活多變的處理功能。把監控畫面分割為任意大小的二維數組,這意味著圖像的數字化精度可以達到滿足任一應用需求。
其七,適用面寬。不論是來自哪個行業的信息源的圖像只要被變換為數字編碼形式后,均是用二維數組表示的灰度圖像組合而成。
其八,靈活性高。即凡是可以用數學公式或邏輯關系來表達的一切運算均可用數字圖像處理實現。
依據八大特性,圖像處理研究內容就分三大板塊:圖像壓縮;增強和復原;匹配、描述和識別。
機器讀懂視界的行業邏輯
時代在變革,技術在演進,與之相悖的,終將漸趨式微,這同樣適用于圖像處理技術。如樓宇對講到智能家居,防盜報警到AIOT一樣,圖像處理到機器視覺,也只是時代產物,底色未變。
過去圖像處理在“后側”,而機器視覺更多“向前”。
在當下,智能攝像機本身作為前端產品,芯片、鏡頭、焦距、補光、外殼等一系列硬件工程是基礎。能將智能算法跟場景關聯后,根據算法需求界定一個范圍,盡量做到場景變化,但硬件減少變化,用軟件來做調節。
全天候的多維融合全域感知,這是智能攝像機對于圖像追求的另一個技術維度,視頻、音頻、氣味、生物特征等技術的發展和成熟,全面掌控防控場景和目標的完整信息成為可能,在安防應用中越來越多的部署更多類別的感知設備,用于從更多維度采集目標信息,包括目標的各種要素、活動軌跡以及關聯信息等,從而形成一個動態感知體系,實現防控工作的“無所不在、無所不知”目標。這一點從最近幾年的聲光劃界攝像機、光譜水質攝像機、雷視合一攝像機、氣象觀測攝像機、環保攝像機等一些列場景定義類產品,無一不在說明,圖像處理的多面與多角度,來適配多場景的深度。
當然,攝像機一個單品,不可能一肩挑起這時代與這視界,形成成熟與高價值的解決方案閉環,是必然。
在追求極致更好圖像的行業進程中,圖像的廣度在縮小,更多的是在深度的追求。通用型、一招鮮吃遍天的攝像機已經不復存在,這還是源于用戶需求驅動。
在2023深圳安博會參觀走訪期間,記者了解到很多底層用戶或中間生態位集成商大多表示,現有智能視頻方案過于通用,不夠適配行業具體場景。為此,此屆安博會最大不同之一就是硬件展示減少,方案展示居多的原因。
機器視覺解決方案需要與行業自身長期運轉而沉淀下來的商業邏輯與行業經驗相融合。除了成熟的技術能力外,該解決方案對行業具體場景的全方位適配必不可少。同樣,機器視覺解決方案應用門檻高,企業IT架構/基礎設施適配難度高。對于很多企業來說,算法訓練相對容易實現,但如何與實時推理結合起來部署到實際應用場景,卻是一個難題。為此,大模型的出現,或者類似算法商城、算法工廠、AI自動工具等,就開辟了另一個戰場,另一個對圖像追求無休止的行業邏輯。
圖像的未來之愿
對于圖像創新,行業心之所向。沉于過去,不能打破現狀,之于圖像的未來,本當歸于平靜,來看未來之愿與應用模樣。
其一,大視界時代,未來數據圖像技術強調高清晰度、高速傳輸、實時圖像處理、三維成像或多維成像、智能化、自動化等方向發展。
其二,智能化方面,力爭使計算機識別和理解能夠按照人的認識和思維方式工作,能夠考慮到主觀概率和非邏輯思維。這里有一點需要指出,AI在智能化方面可以做圖像數據與內容的提取與分析,但是并不能在視頻圖像處理方面做文章。
其三,未來圖像技術強調操作、運用的方便性,圖像處理功能的集中化趨勢是必然會存在的。所以,最近幾年硬件芯片廠家不斷將諸多AI功能固化在芯片上,形成一個SOC級的獨立小系統。
有偏差的視界,在以智能路為路徑,盡可能形成你是我的眼,你見如我見;不止所見,還能關聯其他,以圖像為圓點,來畫視界。
文章來源:CPS中安網,電子發燒友,活在信息時代