(2)邏輯數(shù)據(jù)邏輯數(shù)據(jù)是指計(jì)算機(jī)不帶符號位的一位二進(jìn)制數(shù)。邏輯數(shù)據(jù)在計(jì)算機(jī)中雖然也是“0”或“1”的形式,但是與數(shù)值有很大區(qū)別:①邏輯數(shù)據(jù)的取值只有“0”和“1”兩個(gè)值,不可能再有其他值,而數(shù)值數(shù)據(jù)與1的不同組合可以反映很多不同數(shù)值。
、谶壿嫈(shù)據(jù)的“0”和“1”代表兩種成對出現(xiàn)的邏輯概念,與一般數(shù)學(xué)中代表“0”和“1”的數(shù)值概念截然不同。
、圻壿嫈(shù)據(jù)和邏輯數(shù)據(jù)運(yùn)算可以表達(dá)事物內(nèi)部的邏輯關(guān)系,而數(shù)值數(shù)據(jù)表達(dá)的是事物的數(shù)量關(guān)系。漢字:
1)漢字字音編碼(
2)漢字字形編碼
(3)漢字音形編碼
(4)電報(bào)碼
(5)整字編碼為了能在不同的漢字系統(tǒng)之間交換信息、高效率高質(zhì)量共享漢字信息,近年來國家推出了一系列有關(guān)中文信息處理的標(biāo)準(zhǔn)。比如1981年我國制定推行的GB2312-80國家標(biāo)準(zhǔn)信息交換用流字編碼字符集(基本集)——簡稱國標(biāo)碼,以及若干輔助集。國標(biāo)碼收集、制定的基本圖形字符有7千余個(gè),其中常用漢字3755個(gè),次常用漢字3008個(gè),共6763個(gè)漢字,還有俄文字母、日語假名、拉丁字母、希臘字母、漢語拼音,每字節(jié)內(nèi)占用7 bit信息,最高位補(bǔ)0,例如漢字“啊”的國際碼,前一字節(jié)是01100000,后一字節(jié)是00100001,編碼為3021H。漢字內(nèi)部碼是漢字在計(jì)算機(jī)內(nèi)部存儲、運(yùn)算的信息代碼,內(nèi)部碼的設(shè)計(jì)要求與西文信息處理有較好的兼容性,當(dāng)一個(gè)漢字以某種漢字輸入方案送入計(jì)算機(jī)后,管理模塊立刻將它轉(zhuǎn)換成兩字節(jié)長的GB2312-80國標(biāo)碼,如果給國標(biāo)碼的每字節(jié)最高位加“1”,作為漢字標(biāo)識符,就成為一種機(jī)器內(nèi)部表示漢字的代碼——漢字內(nèi)部碼。漢字內(nèi)部碼的特點(diǎn)十分明顯:
①漢字內(nèi)部碼結(jié)構(gòu)簡短,一個(gè)漢字內(nèi)部碼只占兩個(gè)字節(jié),兩字節(jié)足以表達(dá)數(shù)千個(gè)漢字和各種符號圖形,且又節(jié)省計(jì)算機(jī)存儲空間。
、诒阌诤臀魑淖址嫒。西文字符的ASCII碼占一個(gè)字節(jié),兩字節(jié)的漢字內(nèi)碼可以看成是它擴(kuò)展的字符代碼,在同一個(gè)計(jì)算機(jī)系統(tǒng)中,只要從最高位標(biāo)識符就能區(qū)分這兩種代碼。標(biāo)識符是“0”,即是ASCII碼;標(biāo)識符是“1”,則是漢字內(nèi)部碼。
7.語音識別及語言表示原理語音產(chǎn)生機(jī)理的研究表明,每一種語言的語音都有自己特定的音素特征,語音是不同頻率振動的結(jié)果。分析語音的音素特點(diǎn),找出音素的基頻和高次頻率優(yōu)分,就能在計(jì)算機(jī)中建立發(fā)音系統(tǒng)的模型,在實(shí)施中對語音采樣,通過濾波器分解提取頻率信息,由模/數(shù)轉(zhuǎn)換設(shè)備轉(zhuǎn)換成數(shù)字輸入計(jì)算機(jī),與機(jī)內(nèi)的語言模型比較,由此達(dá)到識別語音的目的。與此相反,如果選擇已知音素的參數(shù),應(yīng)用語音系統(tǒng)模型,就能得到指定的音素,進(jìn)一步按照一定的規(guī)則合成語言。
相關(guān)推薦:北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |