中國著名學(xué)者周海中先生曾經(jīng)指出:“語言智能是人工智能皇冠上的明珠,它對于發(fā)展人類的表達(dá)能力、思維能力、理解能力等具有十分重要的意義。”近年來,由于人工智能的快速發(fā)展,語言智能越來越受到學(xué)術(shù)界,尤其是語言學(xué)界的高度重視和深入研究;在這方面,學(xué)術(shù)界已經(jīng)取得了不少可喜的成果。
語言智能(英文language intelligence)是語言信息智能化的過程,也是運(yùn)用信息技術(shù)模仿人類的智能,分析和處理人類語言的過程,更是人工智能的重要組成部分及人機(jī)交互認(rèn)知的重要基礎(chǔ)和手段。另外,語言智能還有力促進(jìn)語言教學(xué)、語言學(xué)習(xí)的智能化,拓展語言學(xué)研究的新領(lǐng)域,在未來教育發(fā)展中將發(fā)揮越來越重要的作用。
語言智能是信息技術(shù)創(chuàng)新發(fā)展的時代產(chǎn)物。發(fā)展語言智能必須增強(qiáng)科學(xué)意識,只有深刻認(rèn)識語言智能的科學(xué)原理,才能深入研究語言智能這個前沿領(lǐng)域。語言智能基于人腦生理屬性、言語認(rèn)知路徑、語義生成規(guī)律,利用大數(shù)據(jù)與人工智能技術(shù),對語言信息進(jìn)行標(biāo)注、抽取、加工、存儲和特征分析,構(gòu)擬人機(jī)語義同構(gòu)關(guān)系,讓機(jī)器實(shí)施類人言語行為。
語言智能具有文化傳承的服務(wù)優(yōu)勢;語言是文化載體,語言精神反映民族精神。從浩瀚的古典文獻(xiàn)中精選優(yōu)秀傳統(tǒng)文化素材,從當(dāng)下日新月異的語言信息洪流中洗練文化精華,傳遞給當(dāng)代國人,需要語言智能獨(dú)特的算力。從既有的語言文字?jǐn)?shù)據(jù)中分析發(fā)現(xiàn)文化素養(yǎng)和家國情懷,精準(zhǔn)實(shí)施優(yōu)秀文化教育,可以成為語言智能的常態(tài)服務(wù)。
上世紀(jì)80年代,美國著名學(xué)者霍華德•加德納先生認(rèn)為,語言智能就是人們運(yùn)用語言的能力。這種能力是人的認(rèn)知力、思維力、邏輯力、創(chuàng)造力和表達(dá)力的綜合體現(xiàn);而提高語言能力是對語言智能提出的挑戰(zhàn)性問題。這需要采集相應(yīng)數(shù)據(jù),科學(xué)分析個人的知識基礎(chǔ)、思維類型、能力潛質(zhì)等,分析經(jīng)驗(yàn)積累和知識攝取狀況,并通過智能技術(shù)手段來推薦個性化知識學(xué)習(xí)內(nèi)容。
語言理解是語言智能的主要任務(wù),涉及到語言理解的目標(biāo)、途徑和主要模型。機(jī)器對語言的理解就是確定了概念與語言單元的映射,以及知道承載概念單元的語言屬性,和知曉不同語言單元之間的關(guān)系。而語義理解是語言理解的核心,它包括對自然語言知識和常識的學(xué)習(xí);語義理解可以通過一系列的人工智能算法以及多場景智能語義分析,將文本解析為結(jié)構(gòu)化的、機(jī)器可讀的意圖與詞槽信息。
目前語言智能在多個領(lǐng)域都有應(yīng)用,主要是四種類型:分類、生成、抽取和校對。分類問題就是給語言對象打標(biāo)簽,語言對象可以是句子、篇章等;生成問題主要是給原文本生成另一種文本表達(dá),典型的應(yīng)用是機(jī)器翻譯以及人機(jī)對話、自動寫作等;抽取問題就是從研究對象提取想要的答案,讓文本信息處理更加方便;校對問題主要是讓機(jī)器對給定的處理對象,回答對應(yīng)信息是否齊全、是否一致、是否準(zhǔn)確的問題。
近期由美國人工智能公司OpenAI開發(fā)的軟件ChatGPT-4帶來了比ChatGPT背后GPT-3.5更強(qiáng)的推理、計算、邏輯能力,也引發(fā)了全民使用的熱潮。在技術(shù)發(fā)展方面,GPT-4的訓(xùn)練數(shù)據(jù)涵蓋了互聯(lián)網(wǎng)上的大量網(wǎng)頁、書籍、新聞報道等,數(shù)據(jù)量達(dá)到了45TB,模型規(guī)模也更大,擁有1750億個參數(shù)。我們期待看到更多的語言模型應(yīng)用在實(shí)際場景中,為語言智能帶來突破性進(jìn)展,也為人類社會帶來更多的便利和創(chuàng)新。
由上可知,語言智能在人工智能研究中扮演著非常重要的角色。其實(shí),人類對語言的學(xué)習(xí)與理解并不是完全通過文本本身來完成的,語言只是其背后具體概念與含義的抽象載體。所以,也許通過多模態(tài)的建模才能讓機(jī)器更好地去理解語言的含義。如何讓機(jī)器學(xué)習(xí)與語言學(xué)結(jié)合得更加緊密,比如對語言的語義信息、語用信息構(gòu)建合適的任務(wù)形式、模型結(jié)構(gòu)、數(shù)據(jù)采集與存儲等也是未來值得關(guān)注的研究方向。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報告》(以下簡稱“報告”),該報告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…