速錄技術(shù)與語音識別系統(tǒng)的區(qū)別
電腦速記技術(shù)是傳統(tǒng)手寫速記和計算機相結(jié)合的產(chǎn)物,它可以使語音信息即時轉(zhuǎn)化為電子文本,可以做到“會議畢,文稿出”。語音識別技術(shù)是讓機器通過識別和理解語音信號而轉(zhuǎn)化為相應文本或命令的高技術(shù)。由于語音信息具有連續(xù)性、多變性、動態(tài)性、瞬時性的特點,造成了語音識別的難度遠遠不像人們想像的那樣簡單--對著電腦的麥克風一說,字馬上就會出來了。它的識別難度它在于和不同的說話人、不同的說話速度、不同的說話內(nèi)容以及不同的環(huán)境條件有關。
作為中文信息處理的工具,語音識別技術(shù)和電腦速記技術(shù)都是把稍縱即逝的語音信息轉(zhuǎn)化成文字,但二者的關系除了速記與錄音機的不同點相似外,還有以下幾點:
1、同音字、詞處理的問題
現(xiàn)代漢語中的大量同音字、詞一直是中文信息處理電腦化的瓶頸。電腦速記、語音識別在記錄語音信息時都會遇到這個難題,關鍵是記錄的準確率。如``以同等 xueli考研``是這個``學歷``還是這個``學力``;``秘書人員要正確領會領導shouyi``是這個``授意``還是這個``受意``等,即使是語音識別能夠完全記錄下語音信息,而且能夠達到百分之百的準確率,其功能仍然和錄音機一樣(二者的關系見上文),同樣需要人們的后期加工整理,這樣花費的時間要比人在當時記錄的時候要多得多。因為人在講話時,往往是口語,從口語到書面語的轉(zhuǎn)化,并不單純是落成了文字。
2、人們在理解語言時,可以根據(jù)語音之間的停頓、語調(diào)、語氣等,把聲音信息變成轉(zhuǎn)化文字,并實時添加相應的標點符號。語音識別在理解語言時,需要說出標點符號的具體名稱,因為機器在理解語言時,需要*斷句來理解的:``王處長冒號您從哪兒來問號另起一自然段空兩格今天的政治學習內(nèi)容是前書名號鄧小平理論后書名號``,事實上人說話時是不說出標點符號的具體名稱的,這樣會很別扭。
語音識別在理解語言時會遇到字符正確串切分和對句子結(jié)構(gòu)的理解問題。如``美國會考慮戰(zhàn)略導彈防御系統(tǒng)``是``美國/會/考慮/戰(zhàn)略導彈防御系統(tǒng)``還是``美/國會/考慮/戰(zhàn)略導彈防御系統(tǒng)``呢?``他yihuier/jiulai``本來是``他一會兒就來``往往會理解成``他一揮而就來``;``要及時把握……``語音識別就很可能會切分成``藥劑師把握……``。電腦速記是由人腦對語言信息進行切分,加入標點符號、分段的。
3、語音識別軟件對語料內(nèi)容要求嚴格,需要人們說標準的漢語普通話,如果有方言、口音、土語等識別起來相當難,而且要事先進行發(fā)言人口音適應。盡管如此,文秘速記人員如果能夠聽得懂,一般都能夠記錄下來,也要求文秘速記人員必須具有廣闊的知識面,聽得多了,記錄的信息也就準確得多了,這也是文秘速記人員往往會比一般人辨別、采集語音信息能力強的原因。如果方言特別重的人講話,人都聽不懂,機器也就更難聽懂了。
4、語音識別只能識別單一的漢語語音信息,對于其他有聲信息都會被其認為是噪音而影響其識別的準確率。例如,在正在播放有背景音樂的朗誦詞里提取男女對話的漢語信息,轉(zhuǎn)化成文字,麥克風根本無法識別。
語音識別無法理解和識別交互式有聲信息,比如座談、討論、會談等多人發(fā)言時,麥克風無法辨識是哪位發(fā)言的信息,也不能只記錄這位發(fā)言人的信息,而把別的發(fā)言人的聲音信息阻隔在外。電腦速記技術(shù)由于是由人來把握,不但可以記錄下每個人的發(fā)言內(nèi)容,還可以記錄下當時的場景,這樣的信息就會很豐富、生動。
5、新生事物的出現(xiàn)而產(chǎn)生的新詞語以及人名、地名等專業(yè)詞語,人們可以根據(jù)對語音信息的理解,選定具體是哪個字或詞。速記技術(shù)在記錄語言時,可以對同音字(詞)進行實時處理,以保證一次性在準確率95%以上,這也是為什么電腦速記的出現(xiàn),能夠得到社會認可的原因,也是速記技術(shù)高效率的具體體現(xiàn)。由于漢語詞匯的豐富無限性和可擴展性特點,為了提高語音識別的準確率,必須對人名、地名、新詞語等專業(yè)詞語事先限定,把詞匯做入電腦語料庫里,但是實際操作起來不現(xiàn)實。例如用語音識別記錄即將召開的黨的十六大代表發(fā)言、討論內(nèi)容,往往不可能讓所有的代表都來事先對麥克風把發(fā)言內(nèi)容說一遍,適應一下口音,把相關詞語事先錄入進去,這樣的話,就變成了現(xiàn)在是開會了。
6、信息化現(xiàn)代化、信息國際化的社會發(fā)展進程出現(xiàn)了一種新的語言表達方式--中英文語音信息混合表達的現(xiàn)象,而且正在成為一種發(fā)展趨勢。比如``上海 APEC會議``、``WINDOWS98/XP系統(tǒng)````請王秘書把客戶的合同草案fai ke si(FAX)或E(E-mail)過來``,文秘速記人員在記錄時,只要能夠聽得懂英文單詞,就可以把它即時翻譯記錄成``請王秘書把客戶的合同草案傳真或電郵過來``;另外,當些外來詞語傳入我國時,因為是前沿話題,一時半時人們還找不到一個合適的中文詞語和造出一個新詞詞來代替,同樣會出現(xiàn)中文信息和外文信息混雜的情況,讓語音識別軟件去識別成全中文信息呢還是中外文混合信息呢?準確率能夠達到多少?這也有速記文秘人員提出了新的挑戰(zhàn),成長為一名優(yōu)秀的文秘速記人員僅僅具備很高的記錄速度是遠遠不夠的。
7、電腦速記技術(shù)是語文現(xiàn)代化和中文信息處理的一個組成部分,漢語語音信息國際互聯(lián)網(wǎng)上同步字幕直播的高效率成為現(xiàn)實。無論是手寫速記還是電腦速記,都是以漢語拼音方案為基礎的,是深深植根于漢民族語言的技術(shù),隨著漢語的發(fā)展而發(fā)展,只要說漢語就有用速記存在的地方,而說別的語言又會變成別的語種的速記了。信息社會越發(fā)展,越需要處理信息的高效率,中文電腦速記技術(shù)正是這樣一個記錄、處理語言信息的高效率手段,它的出現(xiàn)與被應用,正是信息社會發(fā)展的必然產(chǎn)物和人們處理信息高效率的必然趨勢。
總之,語音識別技術(shù)和電腦速記技術(shù)工作方式方法具有本質(zhì)的不同,一個是機芯在工作,一個是人腦在工作,是人腦對語音信息的再創(chuàng)造。語音識別無論怎樣智能,也無法取代人腦的智力
編輯推薦:
更多關注:秘書資格考試報名時間 秘書資格報考條件 秘書資格考試科目
(責任編輯:中大編輯)