如何構(gòu)建一個(gè)識(shí)別英語的程序

2020-08-19 10:47 更新

現(xiàn)在我們不討論你如何學(xué)英語,而是讓你構(gòu)建一個(gè)可以識(shí)別、交流英語的程序,你會(huì)如何設(shè)計(jì)?

簡單的需求分析

以中文為例,當(dāng)你聽到一個(gè)女人對(duì)一個(gè)男人說:“你是一個(gè)男人嗎?”時(shí),你會(huì)收集到哪些信息?你需要哪些信息來明確這個(gè)女人想表達(dá)的確切意思?

首先是聽力輸入,你需要確保麥克風(fēng)錄入了音頻,然后拿到的聲波內(nèi)容是 U#@&!&&。之后我們需要將聲波內(nèi)容輸入到一大堆分析器中進(jìn)行分析,并得到比較精準(zhǔn)的意圖。

第一個(gè)可能是性別分析器,通過一定的規(guī)則識(shí)別出這是一個(gè)男性的聲音還是女性的聲音。因?yàn)檫@句話是男的說出來還是女的說出來表達(dá)的意思是不一樣的。

第二個(gè)就是內(nèi)容識(shí)別器,先是加載粵語匹配引擎和粵語語料庫發(fā)現(xiàn)聲波無法匹配解析,那么換成普通話引擎和語料庫。此時(shí)如果你的語料庫里有 “你”、“是”、“一個(gè)”、“男人”、“嗎” 這些聲音素材,那么就可以匹配解析出這句話:“你是一個(gè)男人嗎?”。換言之,如果你沒有粵語語料庫和解析引擎,即便是給你一段粵語錄音你也聽不懂。如果這句話有一個(gè)生僻單詞你語料庫里沒有,那么也是無法識(shí)別出來。

之后還有更多識(shí)別器,比如年齡、情緒識(shí)別器、重音和疑問語氣識(shí)別句等,這些因素共同決定了這句話究竟想要傳達(dá)什么意思。如果是一個(gè)女性的激動(dòng)的感嘆語氣“你是一個(gè)男人嗎!”,那么可以推測(cè)出這個(gè)女的跟男的有一定的關(guān)系,這個(gè)男的做出了一些傷天害理的事情導(dǎo)致這個(gè)女性在質(zhì)問。如果是一個(gè)輕聲細(xì)語的疑問句“你是一個(gè)男人嗎?”,可能是一名女性想確認(rèn)對(duì)方的性別。當(dāng)然更準(zhǔn)確表達(dá)這個(gè)意圖的句子應(yīng)該是“你是男性嗎?”或者“男的女的?”。

比較基礎(chǔ)的方案設(shè)計(jì)

上面需求分析只是簡單的介紹了 聲音 -> 聽力識(shí)別器 -> 意圖 的過程,實(shí)際上語言交流是聽說讀寫,其中包含兩個(gè)識(shí)別器(聽力識(shí)別器和視力識(shí)別器),一個(gè)核心理解器,兩個(gè)表達(dá)器(口語表達(dá)器和書寫表達(dá)器)。通過對(duì)應(yīng)的實(shí)際場(chǎng)景,我們可以簡單的梳理出對(duì)應(yīng)需要的功能。

聽力識(shí)別器

  • 聽力能力
    • 說明:要求可以輸入聲音并轉(zhuǎn)換成一種可分析的信號(hào)。
    • 訓(xùn)練:買個(gè)好麥克風(fēng),對(duì)應(yīng)人類是保護(hù)好耳朵和聽力。
  • 口音識(shí)別器
    • 說明:各類方言比如粵語,各種口音比如東北口音、廣東口音、英式發(fā)音和美式發(fā)音。
  • 語言特性識(shí)別器
    • 說明:語言之間會(huì)有不同特性,比如中文沒有略讀,都是一個(gè)一個(gè)字念出來,而英文會(huì)為了說話省勁而略讀或者連讀,比如 “drink it” 并不是單個(gè)蹦的 “準(zhǔn)克一特”,而是類似 “準(zhǔn)kei特”。中文的 “喝它” 就是 “喝它”,不會(huì)有類似 “赫特” 之類的變化。
    • 訓(xùn)練:擴(kuò)充特殊語言引擎的匹配規(guī)則,擴(kuò)充語料庫,當(dāng)聽到 “準(zhǔn)kei特” 可以識(shí)別出是 “drink it”。
  • 音量調(diào)節(jié)和雜音處理器
    • 說明:可以通過算法過濾無用雜音,并將小音量調(diào)大使其清晰。人類天然進(jìn)化出這種能力,無需特殊訓(xùn)練。
  • 語氣、性別、身份、語速識(shí)別器
    • 說明:人類天然進(jìn)化出這種能力,無需特殊訓(xùn)練。
  • 上下文緩存器
    • 說明:交流過程要有上下文內(nèi)容緩存,結(jié)合輸入理解器。

視力識(shí)別器

  • 視力能力
  • 圖形識(shí)別器
    • 說明:不同字體、變形(英文大小寫、中文繁簡體等)都可以識(shí)別出來具體字符,同時(shí)需要識(shí)別標(biāo)點(diǎn)符號(hào)等輸入理解器。
    • 訓(xùn)練:識(shí)別能力、精準(zhǔn)度和速度。比如一眼看出 messagemassage 是不一樣的。
  • 上下文緩存器

理解器

理解器可以說是最重要的部分了,也是最難的部分

  • 語料庫
    • 說明:字母、單詞、發(fā)音、多重語境含義、歷史文化背景、不同形態(tài),同義詞反義詞相近詞。
    • 訓(xùn)練:需要長期積累和擴(kuò)充,需要大量訓(xùn)練。
  • 識(shí)別引擎
    • 說明:單詞拼裝起來的句型句式、語法、時(shí)態(tài)含義和規(guī)則、標(biāo)點(diǎn)符號(hào)、單復(fù)數(shù)、慣用表達(dá)。
    • 訓(xùn)練:單點(diǎn)突破,專項(xiàng)訓(xùn)練,逐步體系化積累。
  • 思考和思維能力
    • 說明:針對(duì)意圖結(jié)合之前的記憶以及經(jīng)驗(yàn)得出自己想要表達(dá)的意圖。
    • 訓(xùn)練:結(jié)構(gòu)性表達(dá),思維能力鍛煉,思考和總結(jié)能力。這個(gè)與語言無關(guān)。
  • 上下文緩存器

口語表達(dá)器

當(dāng)理解器思考運(yùn)算并得到想要表達(dá)的意圖之后,就需要開始表達(dá)傳遞出去。

  • 意圖語料組裝器
    • 說明:將意圖結(jié)合語料中的單詞、句型句式、慣用表達(dá)進(jìn)行匹配組合,挑選出最符合你意圖的語句。
  • 發(fā)音器
    • 說明:根據(jù)組裝出來的內(nèi)容,結(jié)合特殊的連讀、略讀等語言特性,轉(zhuǎn)換成發(fā)聲信號(hào)。對(duì)應(yīng)人類的話是控制舌頭、聲帶和呼吸系統(tǒng)的肌肉使其變成對(duì)應(yīng)形狀,讓氣流通過聲帶發(fā)出對(duì)應(yīng)聲音。

書寫表達(dá)器

  • 意圖語料組裝器
  • 書寫表達(dá)器
    • 說明:將語料組裝結(jié)果以視覺的方式表達(dá),對(duì)于人類是控制手部肌肉書寫出對(duì)應(yīng)形狀。

從上面可以看出,口語聽力相對(duì)于閱讀寫作更加困難,主要因?yàn)閷?shí)時(shí)性的要求。你必須迅速反饋不經(jīng)過思考,這要求你要無意識(shí)的去用英語表達(dá),所以語言學(xué)習(xí)沒有技巧,只有大量訓(xùn)練。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)