社會(huì )語(yǔ)言學(xué)(sociolinguistics)是一門(mén)語(yǔ)言學(xué)的分支學(xué)科,研究社會(huì )的各層面對語(yǔ)言運用的影響,包含文化準則、社會(huì )規范或情境.
有人亦把后設語(yǔ)言學(xué)(metalinguistics,亦作“元語(yǔ)言學(xué)”)歸類(lèi)為社會(huì )語(yǔ)言學(xué)的一部分.
研究范圍社會(huì )語(yǔ)言學(xué)研究的是語(yǔ)言的社會(huì )本質(zhì)和差別,以及他們的社會(huì )因素.在傳統的語(yǔ)言地理學(xué)中也有相同的研究,但是自社會(huì )語(yǔ)言學(xué)出現以后,這些內容都算做社會(huì )語(yǔ)言學(xué)的范疇了.
對社會(huì )本質(zhì)的研究包括:
* 語(yǔ)言的社會(huì )本質(zhì)的特點(diǎn)及其規律
* 語(yǔ)言、意識、社會(huì )在起源上的相互關(guān)系
* 民族語(yǔ)言和民族形成的關(guān)系
* 民族共同語(yǔ)的形成與社會(huì )發(fā)展的關(guān)系
* 語(yǔ)言演變與社會(huì )演變的關(guān)系
對語(yǔ)言差異的研究包括:
* 標準語(yǔ)與方言、行話(huà)的差異o 發(fā)音差異o 用詞差異o 地位差異* 同一語(yǔ)言在不同國家、地區以及社會(huì )所產(chǎn)生的差異
o 例如:英語(yǔ)在不同國家或地區的傳播中產(chǎn)生了變異,出現了美式英語(yǔ)、港式英語(yǔ)、新加坡式英語(yǔ)等
* 同一國家或社會(huì )中通行幾種語(yǔ)言所造成的差異
o 例如:有兩種或兩種以上官方語(yǔ)言的國家或地區,如加拿大(英語(yǔ)、法語(yǔ))、新加坡(英語(yǔ)、中文、馬來(lái)語(yǔ))
* 不同的語(yǔ)言使用者在語(yǔ)言運用上的差異
o 例如:性別差異導致男女使用有差異的語(yǔ)言.
* 社會(huì )場(chǎng)所不同所使用的語(yǔ)言的差異
o 例如:一般中國人在家庭環(huán)境中使用家鄉方言,在工作學(xué)習時(shí)用普通話(huà).
研究方法調查研究法對各地區、各行業(yè)、各階層等人的語(yǔ)言運用進(jìn)行考察.數學(xué)分析法對口語(yǔ)材料和文獻資料進(jìn)行數學(xué)統計和數理分析.對比研究法分析社會(huì )因素、研究語(yǔ)言差異.實(shí)驗分析法用語(yǔ)音或心理實(shí)驗儀器對語(yǔ)言差異進(jìn)行實(shí)驗分析,并作出定量和定性的描述.
語(yǔ)音識別技術(shù),也被稱(chēng)為自動(dòng)語(yǔ)音識別Automatic Speech Recognition,(ASR),其目標是將人類(lèi)的語(yǔ)音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。
與說(shuō)話(huà)人識別及說(shuō)話(huà)人確認不同,后者嘗試識別或確認發(fā)出語(yǔ)音的說(shuō)話(huà)人而非其中所包含的詞匯內容。 語(yǔ)音識別技術(shù)的應用包括語(yǔ)音撥號、語(yǔ)音導航、室內設備控制、語(yǔ)音文檔檢索、簡(jiǎn)單的聽(tīng)寫(xiě)數據錄入等。
語(yǔ)音識別技術(shù)與其他自然語(yǔ)言處理技術(shù)如機器翻譯及語(yǔ)音合成技術(shù)相結合,可以構建出更加復雜的應用,例如語(yǔ)音到語(yǔ)音的翻譯。 語(yǔ)音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽(tīng)覺(jué)機理、人工智能等等。
特定人語(yǔ)音識別的方法 目前,常用的說(shuō)話(huà)人識別方法有模板匹配法、統計建模法、聯(lián)接主義法(即人工神經(jīng)網(wǎng)絡(luò )實(shí)現)。考慮到數據量、實(shí)時(shí)性以及識別率的問(wèn)題,筆者采用基于矢量量化和隱馬爾可夫模型(HMM)相結合的方法。
說(shuō)話(huà)人識別的系統主要由語(yǔ)音特征矢量提取單元(前端處理)、訓練單元、識別單元和后處理單元組成,其系統構成如圖1所示。 由上圖也可以看出,每個(gè)司機在購買(mǎi)車(chē)后必須將自己的語(yǔ)音輸入系統,也就是訓練過(guò)程,當然最好是在安靜、次數達到一定的數目。
從此在以后駕駛過(guò)程中就可以利用這個(gè)系統了。 所謂預處理是指對語(yǔ)音信號的特殊處理:預加重,分幀處理。
預加重的目的是提升高頻部分,使信號的頻譜變得平坦,以便于進(jìn)行頻譜分析或聲道參數分析。用具有 6dB/倍頻程的提升高頻特性的預加重數字濾波器實(shí)現。
雖然語(yǔ)音信號是非平穩時(shí)變的,但是可以認為是局部短時(shí)平穩。故語(yǔ)音信號分析常分段或分幀來(lái)處理。
歷史 早在計算機發(fā)明之前,自動(dòng)語(yǔ)音識別的設想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語(yǔ)音識別及合成的雛形。而1920年代生產(chǎn)的"Radio Rex"玩具狗可能是最早的語(yǔ)音識別器,當這只狗的名字被呼喚的時(shí)候,它能夠從底座上彈出來(lái)。
最早的基于電子計算機的語(yǔ)音識別系統是由AT&T貝爾實(shí)驗室開(kāi)發(fā)的Audrey語(yǔ)音識別系統,它能夠識別10個(gè)英文數字。其識別方法是跟蹤語(yǔ)音中的共振峰。
該系統得到了98%的正確率。到1950年代末,倫敦學(xué)院(Colledge of London)的Denes已經(jīng)將語(yǔ)法概率加入語(yǔ)音識別中。
1960年代,人工神經(jīng)網(wǎng)絡(luò )被引入了語(yǔ)音識別。這一時(shí)代的兩大突破是線(xiàn)性預測編碼Linear Predictive Coding (LPC), 及動(dòng)態(tài)時(shí)間彎折Dynamic Time Warp技術(shù)。
語(yǔ)音識別技術(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應用。從Baum提出相關(guān)數學(xué)推理,經(jīng)過(guò)Labiner等人的研究,卡內基梅隆大學(xué)的李開(kāi)復最終實(shí)現了第一個(gè)基于隱馬爾科夫模型的大詞匯量語(yǔ)音識別系統Sphinx。
[3]。此后嚴格來(lái)說(shuō)語(yǔ)音識別技術(shù)并沒(méi)有脫離HMM框架。
盡管多年來(lái)研究人員一直嘗試將“聽(tīng)寫(xiě)機”推廣,語(yǔ)音識別技術(shù)在目前還無(wú)法支持無(wú)限領(lǐng)域,無(wú)限說(shuō)話(huà)人的聽(tīng)寫(xiě)機應用。 模型 目前,主流的大詞匯量語(yǔ)音識別系統多采用統計模式識別技術(shù)。
典型的基于統計模式識別方法的 語(yǔ)音識別系統由以下幾個(gè)基本模塊所構成 信號處理及特征提取模塊。該模塊的主要任務(wù)是從輸入信號中提取特征,供聲學(xué)模型處理。
同時(shí),它一般也包括了一些信號處理技術(shù),以盡可能降低環(huán)境噪聲、信道、說(shuō)話(huà)人等因素對特征造成的影響。 統計聲學(xué)模型。
典型系統多采用基于一階隱馬爾科夫模型進(jìn)行建模。 發(fā)音詞典。
發(fā)音詞典包含系統所能處理的詞匯集及其發(fā)音。發(fā)音詞典實(shí)際提供了聲學(xué)模型建模單元與語(yǔ)言模型建模單元間的映射。
語(yǔ)言模型。語(yǔ)言模型對系統所針對的語(yǔ)言進(jìn)行建模。
理論上,包括正則語(yǔ)言,上下文無(wú)關(guān)文法在內的各種語(yǔ)言模型都可以作為語(yǔ)言模型,但目前各種系統普遍采用的還是基于統計的N元文法及其變體。 解碼器。
解碼器是語(yǔ)音識別系統的核心之一,其任務(wù)是對輸入的信號,根據聲學(xué)、語(yǔ)言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。 從數學(xué)角度可以更加清楚的了解上述模塊之間的關(guān)系。
首先,統計語(yǔ)音識別的最基本問(wèn)題是,給定輸入信號或特征序列,符號集(詞典),求解符號串使得: W = argmaxP(W | O) 通過(guò)貝葉斯公式,上式可以改寫(xiě)為 由于對于確定的輸入串O,P(O)是確定的,因此省略它并不會(huì )影響上式的最終結果,因此,一般來(lái)說(shuō)語(yǔ)音識別所討論的問(wèn)題可以用下面的公式來(lái)表示,可以將它稱(chēng)為語(yǔ)音識別的基本公式。 W = argmaxP(O | W)P(W) 從這個(gè)角度來(lái)看,信號處理模塊提供了對輸入信號的預處理,也就是說(shuō),提供了從采集的語(yǔ)音信號(記為S)到 特征序列O的映射。
而聲學(xué)模型本身定義了一些更具推廣性的聲學(xué)建模單元,并且提供了在給定輸入特征下,估計P(O | uk)的方法。 為了將聲學(xué)模型建模單元串映射到符號集,就需要發(fā)音詞典發(fā)揮作用。
它實(shí)際上定義了映射的映射。為了表示方便,也可以定義一個(gè)由到U的全集的笛卡爾積,而發(fā)音詞典則是這個(gè)笛卡爾積的一個(gè)子集。
并且有: 最后,語(yǔ)言模型則提供了P(W)。這樣,基本公式就可以更加具體的寫(xiě)成: 對于解碼器來(lái)所,就是要在由,,ui以及時(shí)間標度t張成的搜索空間中,找到上式所指明的W。
語(yǔ)音識別是一門(mén)交叉學(xué)科,。
歷史比較語(yǔ)言學(xué)在西方具有悠久的歷史,在現代語(yǔ)言學(xué)確立之前,語(yǔ)言研究主要是歷史比較語(yǔ)言學(xué)方面的研究,其研究?jì)热菀惨哉Z(yǔ)音研究為主。目前,漢語(yǔ)的語(yǔ)音史研究也逐漸開(kāi)始使用歷史比較語(yǔ)言學(xué)的研究方法,同時(shí)還要考慮語(yǔ)言接觸的問(wèn)題。
你在提問(wèn)中指出“根據方言的差異來(lái)考察語(yǔ)音的歷史演變”,既然是方言差異,就不可能“以一種方言為例”,所以,“以一種方言為例,說(shuō)明如何根據方言的差異來(lái)考察語(yǔ)音的歷史演變”是無(wú)法實(shí)現的。現在學(xué)界的研究方法,不但要比較多種方言的語(yǔ)音,還要參考日語(yǔ)、朝鮮語(yǔ)、越南語(yǔ)中漢語(yǔ)借詞的發(fā)音,在研究上古音的時(shí)候,還要分析漢字中的形聲字的讀音。也就是說(shuō),單純地比較方言語(yǔ)音并不能有效地考察語(yǔ)音的歷史演變。
就具體的操作方法來(lái)說(shuō),主要是考察方言間語(yǔ)音的對應關(guān)系,而不是語(yǔ)音的相似性。利用語(yǔ)音對應關(guān)系、語(yǔ)音發(fā)音的生理特點(diǎn)以及其他語(yǔ)言中的相類(lèi)似的語(yǔ)音現象,可以挖掘出語(yǔ)音演變的脈絡(luò )。
你指的是TCL C10的方言識別技術(shù)吧!這款電視的語(yǔ)音助手小T目前支持普通話(huà)、四川話(huà)、廣東話(huà)、東北話(huà)、河南話(huà)、陜西話(huà)6種方言的識別,并且識別能力還挺精準的,拾音效果也不錯。我也是看準了這點(diǎn),才給我爸媽買(mǎi)的,這樣他們就不用說(shuō)著(zhù)別扭的塑料普通話(huà)來(lái)語(yǔ)音控制了,直接可以說(shuō)廣東話(huà)。話(huà)說(shuō),我爸平常動(dòng)不動(dòng)就喜歡調戲小T,估計真的是猴鐘意小T啊。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:2.733秒