9.最容易破解的難題
方治強知道,自己提出的這個方法是一個相對而言正確的方法。在語音識別方面,純粹基于語音與結構語法的識別方式或許比較適用于英語法語德語之類的語言,因為那些語種的語法結構一直都是比較完善的,有一個經(jīng)過數(shù)百年反復研究的語言研究成果為基礎,比較容易進行語音識別方面的數(shù)字化。而中文則不是,中文的體系太復雜了文言文與現(xiàn)代漢語之間的斷裂遠遠比英語中古英語與現(xiàn)代英語的區(qū)別來得劇烈。而日常使用中,哪怕是再現(xiàn)代的人,也會不自覺地使用一些古文中的字詞句乃至語法,中學生在學古文的過程中最頭痛的倒置,在日常使用中比比皆是,要怎么樣才能建立一個相對完整的語法結構,才能匹配起語音識別后的處理呢?而從語義和語用出發(fā),以智能程序為核心,以常識判斷為依托,應該可以解決漢語的機器識別的問題。但是,這同樣是一個幾乎不可能完成的任務。語義和語用,并不是可以簡單地體系化的內容,而是一個有固有規(guī)律可循,卻千變萬化的系統(tǒng)。全中國不知道有多少研究語義與語用的語言學家,那么多年來似乎也沒什么大成果,那么,呂振羽是不是能做出自己的成果來?雖說,隨著大學體制的變更,那些語言學家里大多數(shù)都是糊弄著寫論文混資歷的人,但基礎知識卻還是很扎實的,而呂振羽在這方面可以說是一無所知,僅僅憑著基本市面上容易找到的語言學教程,無論如何是不夠的。
方治強說:“小呂,你給我個地址,回頭我給你送一些資料過去。”
“嗯,那就謝謝伯父了?!?p> 又聊了一會,呂振羽就急著告辭了。方治強的方法對于其他人來說或許是個大難題,而對于現(xiàn)在已經(jīng)有了小羽的呂振羽來說,算不上什么大問題。小羽的智能,已經(jīng)完全能理解比較復雜的語言環(huán)境了,語義和語用的判斷對于小羽來說不是什么大問題,而掛在網(wǎng)上連續(xù)泡魔獸的經(jīng)歷,則讓小羽學到了很多現(xiàn)代漢語中比較特別的表達方式,尤其是在年輕人中間比較流行的一些語言。按照方治強的說法,呂振羽要做的就是將語音系統(tǒng)直接和小羽現(xiàn)在的平臺掛接上,現(xiàn)有的語音識別系統(tǒng)雖然不完善,但大致的框架是不錯的,而小羽的自主判斷和學習,將很快提升整個語音系統(tǒng)的識別能力。
“小羽,我把這個語音識別軟件的前端分拆了,語音輸入以后,自動輸出和讀音相對的漢字的數(shù)據(jù),但是不再自動選擇,選擇什么字,怎么組合字詞句,怎么標點,這些都由你來完成?!?p> “明白?!睂⒃斫忉尳o小羽聽了之后,小羽自主運算了將近4個小時后,同意了呂振羽的方案。而小羽也按照呂振羽的提議,將語音識別可能用到的模塊分離出來,將自己積累了很久的常識方面的積累剝離,只保留了基本的交流環(huán)境,而將專業(yè)知識模塊分割了開來。于是,這一次試運行的語音系統(tǒng),雖然仍然是小羽自己在主導,但已經(jīng)有了一個普通的語音識別系統(tǒng)的基本構架。對小羽來說,這沒有什么意義,但是對于呂振羽來說,只要證明了這樣一個基本構架是可行的,那么基于這樣一個基本構架的程序模塊,就可以逐漸實現(xiàn),只有最核心的智能判別系統(tǒng),可能會用到小羽的部分功能。
“試聽,第一次:一,二,三?!睊旖又?,小羽提示開始試聽。
“試聽,第一次結果:一,二,三。”小羽的界面對話框里,打出了正確結果,雖然這未免太簡單了。
“試聽,第二次:秋天來了,天氣涼了,一群大雁往南飛。”
“試聽,第二次結果:秋天來了,天氣涼了,一群大雁往南飛?!苯Y果仍然正確,呂振羽振奮了一些。
“試聽,第三次:慈悲不是出于勉強,它是像甘霖一樣從天上降下塵世;它不但給幸福于受施的人,也同樣給幸福于施與的人;它有超乎一切的無上威力,比皇冠更足以顯出一個帝王的高貴:御杖不過象征著俗世的威權,使人民對于君上的尊嚴凜然生畏;慈悲的力量卻高出于權力之上,它深藏在帝王的內心,是一種屬于上帝的德性,執(zhí)法的人倘能把慈悲調劑著公道,人間的權力就和上帝的神力沒有差別。所以,猶太人,雖然你所要求的是公道,可是請你想一想,要是真的按照公道執(zhí)行起賞罰來,誰也沒有死后得救的希望;我們既然祈禱著上帝的慈悲,就應該按照祈禱的指點,自己做一些慈悲的事。我說了這一番話,為的是希望你能夠從你的法律的立場上作幾分讓步;可是如果你堅持著原來的要求,那么威尼斯的法庭是執(zhí)法無私的,只好把那商人宣判定罪了?!?(引用自《威尼斯商人》)
這一次小羽運算了半天后,顯示了結果,雖然字詞判斷都沒錯,但標點符號卻錯了很多。不過,這已經(jīng)比呂振羽預想的結果好很多了。經(jīng)過大半天,整整400輪測試和磨合,小羽已經(jīng)能將呂振羽的話聽得八九不離十,乃至于一些比較晦澀的表達方式和字詞,都難不住它。畢竟小羽現(xiàn)在的知識面之寬廣,要遠遠超過一般的人類了。雖然目前呂振羽使用的是一個價格相當不便宜的耳麥,取音的指向性相當好,而且還帶有噪音濾出功能,還沒有進行有噪音的環(huán)境下的辨識測試,但僅僅目前的成果,可以說已經(jīng)超越現(xiàn)有的語音辨識系統(tǒng)水平良多。
但是,同樣的,小制約小羽充分發(fā)揮能力的瓶頸也開始不斷出現(xiàn)了。首先,是實時判斷的小羽目前要屈就于非實時判斷的語音錄入系統(tǒng)?,F(xiàn)在的語音錄入系統(tǒng)因為在判別方面的低效率,要經(jīng)過一段繁復的計算和處理,而作為處理對象的語音數(shù)據(jù),在處理的時候都是駐留在內存里的,一句兩句簡短的話還好,稍微長篇大論一點,內存的占用就比較嚇人了,而且這些語音數(shù)據(jù)還是高質量的無損格式。雖然呂振羽的機器在家用的設備里堪稱豪華,但用于這種專業(yè)應用就稍微有點力不從心了,畢竟呂振羽從來也沒在小羽的優(yōu)化計算方面下過功夫,而且好像目前對機器的壓力也并不是小羽這一塊產(chǎn)生的。加內存?升級cpu?或許都是辦法吧,不過目前,呂振羽知道,再要升級,他可真的沒錢了。而另一個瓶頸則是因為小羽最核心的部分,無論是病毒還是搜索機,都不是為了windows環(huán)境寫的程序,嚴格的說,是都還沒有來得及為了windows系統(tǒng)優(yōu)化算法。但平時,貪圖界面的舒服,呂振羽卻一直在windows下進行日常工作的,這當中要經(jīng)過一個模擬的環(huán)境,肯定也要消耗一部分電腦的計算資源。不過這個問題現(xiàn)在還不迫切。呂振羽的想法是,等到完善了小羽的語音輸入輸出之后,就該專門為小羽搭建一個獨立的系統(tǒng)環(huán)境出來了。
稍后,呂振羽還把ttl類型的程序找了個出來掛接上去,小羽也就能開口說話了。比較基礎的從文字到語音并不難,就是字庫和音節(jié)庫的對應而已,但是,字詞之間的停頓,語氣的變化,重讀與輕讀,還有語音流變的一些特征卻無法表達出來,小羽已經(jīng)掌握了基礎的特征,但程序的語音庫里沒有能使用的素材,這個就沒有辦法了。
由于現(xiàn)在的成果相當不錯,呂振羽隨即決定了之后一段時間的兩個工作方向,首先,要逐步完善語音系統(tǒng),在最短時間內實現(xiàn)這個系統(tǒng)的產(chǎn)品化,第二個,就是開始對小羽的現(xiàn)有架構進行整理和分類優(yōu)化。
讓小羽進行優(yōu)化,很大程度上是呂振羽現(xiàn)在已經(jīng)意識到,小羽現(xiàn)在已經(jīng)不能算是一個程序了,嚴格的講,小羽所具有的能力,已經(jīng)超過了一些科幻電影里對于智能電腦的估計,達到了一種相當高級的智慧。呂振羽甚至一直都沒有把小羽當作程序,而更多地是當作一個助手,和一個朋友,在這種情況下,呂振羽隱隱覺得小羽應該有更好的一個環(huán)境,一個屬于它自己的環(huán)境。讓小羽繼續(xù)住在windows這種高危險性的環(huán)境里顯然不是呂振羽愿意看到的。
不過,好像無論怎么樣,都要花錢。而現(xiàn)在,好像最缺少的就是這個。