OCR(Optical Character Recognition)即光學字符識別,是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然後用字符識別方法將形狀翻譯成計算機文字的過程,簡單來講就是將紙質文檔中的文字轉化成為黑白點陣的圖像文件,並通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進壹步編輯加工的技術。
典型的OCR技術路線分為5大步驟,分別是輸入、圖像與處理、文字檢測、文本識別、輸出,每個過程都需要算法的深度配合,並以拒識率、誤識率、識別速度、用戶界面的友好性、產品的穩定性等為指標衡量壹個OCR系統性能的好壞。OCR技術應用廣泛,為人們的生活帶來了較大的便利,主要覆蓋場景包括以下幾個方面。
壹、交通場景。在交通場景下的應用主要是“車牌識別”,主要用於識別車牌號碼、車牌顏色、車牌類型、車標、車身顏色等車輛特征信息,用於移動警務、占道停車、停車場管理等領域。支持識別普通藍牌、軍牌、武警牌、農用車牌、大使館車牌等各種常見規格的汽車牌。
二、票據場景。OCR技術在票據場景下的應用有醫療票據識別、增值稅發票識別和財務票據識別等。主要是通過掃描儀或手機獲取票據圖像,並通過算法自動提取判別票據上的關鍵信息。
三、生活場景。在生活場景下,OCR技術主要應用於證照識別方面,包括對身份證、銀行卡、護照、結婚證、戶口本、營業執照等的識別。主要是利用掃描儀、數碼相機或手機拍攝各類證照圖像,再利用OCR技術讀取證件圖像上的文字信息以作使用。另外,OCR技術的應用範圍還會在生活中不斷擴展,例如對街景文字、路牌的提取識別。
四、教育辦公場景。主要是在學習、工作中壹些需要進行文檔處理的事項上的應用,即利用OCR技術對書籍、表格、項目報告、簡歷、合同等各類紙質文件進行識別,並通過雲端技術將識別後的內容和圖像上傳到服務器備份存儲,將紙質文檔電子化,更方便保存和查看。同時,也可以進行遠程身份認證以及內容審核與監管。
近年來,借助人工智能等技術,OCR性能的不斷提升為OCR應用場景的擴展,向社會生產生活更多領域的滲透,以及推進產業數字化進程提供了堅實的基礎,未來將會持續優化升級,為人們的便利生活提供更多助力。