多媒體

        初識多媒體
        怎樣與多媒體打交道
        繽紛世界的背后
        來來往往多媒體
        多媒體時代的通行證
        如何把精彩留給自己
        新的世紀從多媒體開始

      移動通信

      計算機網絡

      智能網

      光通信

      微波通信

      衛星通信

      交換網

      接入網

      電信管理網

       

          
        電信博物館 > 多媒體 > 怎樣與多媒體打交道 > 低眉信手續續彈

       


      脫機手寫漢字識別

        一、漢字識別概述

        漢字已有數千年的歷史,也是世界上使用人數最多的文字,對于中華民族燦爛文化的形成和發展有著不可磨滅的貢獻,并將繼續發揮重要的、其它文字形式難以取代的作用。然而,漢字是非字母化、非拼音化的文字,在當今高度信息化的社會里,如何快速高效地將漢字輸入計算機,已成為影響人—機交流信息效率的一個重要瓶頸,也關系到計算機能否真正在我國得到普及應用。

        圍繞這一問題,人們提出了各種解決方案。目前,漢字輸入主要分為人工鍵盤輸入和機器自動識別輸入兩種。

        自動識別輸入分為語音識別和字符識別兩種。漢字識別是模式識別的一個重要分支,也是文字識別領域最為困難的問題,它涉及模式識別、圖象處理、數字信號處理、自然語言理解、人工智能、模糊數學、信息論、計算機、中文信息處理等學科,是一門綜合性技術,在中文信息處理、辦公室自動化、機器翻譯、人工智能等高技術領域,都有著重要的實用價值和理論意義。

        漢字識別技術可分為印刷體漢字識別和手寫體漢字識別兩大類,后者又可分為聯機手寫漢字識別和脫機手寫漢字識別。

        從識別的角度來看,手寫體識別難于印刷體識別,而脫機手寫識別又難于聯機手寫體識別?上驳氖,經過科研人員的努力,我國已有印刷體漢字識別和聯機手寫漢字識別的商品出售,目前已形成百家爭鳴、百花齊放的局面,但是脫機手寫漢字識別還處于實驗室研究階段。在脫機手寫漢字識別領域,非特定人脫機手寫漢字識別又難于特定人手寫漢字識別。

        二、 手寫漢字識別中存在的問題及困難

        手寫漢字識別是一種重要的、適用于把手寫文稿隨時輸入計算機的方法,也是機器字符識別最為困難的一個課題,這些困難和問題表現在:

        1、漢字類別多。僅《康熙字典》中就包含了49000多個漢字,而常用的漢字就有4000多個,因而漢字識別問題屬于大類別(或者稱為超多類)模式識別問題,在模式識別理論和方法研究方面有重大意義。 

        2、漢字字形結構復雜。 漢字集合中相似字較多,有些漢字的差別僅為一點或一個筆畫,由于手寫變形的存在,使得手寫體中相似字的區分比印刷體要困難得多。因不同人書寫風格的差異造成手寫漢字的變形很大,具體表現在以下幾個方面: 

       。1)基本筆畫變化。橫不平,豎不直,直筆變彎,折筆的拐角變成圓弧等。
        (2)筆畫模糊,不規范,該連的不連,不該連的卻相連。
       。3)筆畫與筆畫之間、部件與部件之間的位置發生變化。
       。4)筆畫的傾斜角、筆畫的長短、部件的大小發生變化。
       。5)對于脫機手寫漢字,不同人使用不同的書寫筆可能造成筆畫的粗細變化。

        其中,手寫漢字字形的變化是最難以解決的問題。

        一般認為,聯機手寫漢字識別比脫機手寫漢字識別相對容易些。聯機手寫漢字識別是一種人工實時地把漢字輸入計算機的方法,它利用書寫板把筆畫變為一維電信號,輸入計算機的是以坐標點序列表示的筆尖移動軌跡,因而被處理的是一維的線條(筆畫)串,這些線條串含有筆畫數目、筆畫走向、筆順和書寫速度等信息,而脫機手寫漢字識別處理的僅是二維的漢字點陣圖象,是漢字識別領域中最后一個十分困難的問題,目前仍然處于實驗室研究階段。

        由此可見,對非特定人脫機手寫漢字識別而言,如果對手寫漢字的書寫不加任何限制(即為自由手寫體漢字),則識別難度相當大?茖W研究中人們總是遵循從易到難的規律,從簡單的問題入手來尋求突破口。由于自由手寫漢字識別太難,人們提出了手寫印刷體漢字識別,這已成為目前脫機手寫漢字識別的主要研究對象。所謂手寫印刷體是指書寫工整的楷書手寫體,要求書寫者工整書寫,盡量少連筆。

        三、展望

        我們研究非特定人脫機手寫漢字識別的目的就是使識別系統能夠實用化。由清華大學電子工程系圖象教研組 OCR(光學字符識別)實驗室研制的THOCR-97綜合集成漢字識別系統于1997年3月22日通過了由國家教委組織的鑒定并獲得了高度評價,其中的非特定人脫機手寫漢字文本識別子系統,對于書寫較為工整的手寫漢字文本,正確識別率達95.8%,為該子系統走向實用化奠定了良好的基礎?梢詷酚^地預言,在今后的5年內,非特定人脫機手寫印刷體漢字識別文本系統將會有產品走向市場。然而,對于自由手寫體漢字識別而言,任重道遠,仍需要科研人員不懈的努力,但是我們不應該就此悲觀,隨著計算機技術的突飛猛進和人腦功能的進一步揭示,可望在不遠的將來發現人腦的識字機理,建立在此基礎上的手寫漢字識別的理論和方法將會有質的飛躍。

      [上一頁] [下一頁]

       

       
      青娱乐国产精品视频| 久久免费国产精品| 亚洲国产精品成人一区| 四虎影视永久在线精品免费| 99re久久精品国产首页2020| 国产成人精品日本亚洲专| 国产精品亚洲高清一区二区| 亚洲第一天堂无码专区| 国产精品免费AV片在线观看| 欧美久久精品一级c片片| 久久精品国产99久久丝袜| 亚洲精品午夜无码专区| 国产日韩欧美精品| 国产精品高清一区二区三区 | 久久久国产精品亚洲一区| 亚洲精品视频在线看| 四虎国产精品永久在线| 日本一区二区精品| 国产伦精品免编号公布| 国产成人精品一区二三区在线观看 | 久久久精品免费国产四虎| 久久久久亚洲精品天堂久久久久久 | 久热这里只有精品视频6| 国产精品人成在线观看| 综合人妻久久一区二区精品| 亚洲综合精品一二三区在线| 伊人影院蕉久影院在线免费观看| 亚洲日韩中文在线精品第一| 精品国产v无码大片在线观看| 国产亚洲精品无码拍拍拍色欲| 嫩草伊人久久精品少妇AV| 国产精品视频全国免费观看| 亚洲国产精品无码久久98| 国产成人精品视频2021| 热re99久久6国产精品免费| 精品国产免费一区二区三区| 国产精品看高国产精品不卡| 香蕉99久久国产综合精品宅男自| 国产亚洲精品xxx| 国产资源在线观看| 国产精品自在在线午夜福利 |