第302章 自然語言處理

企劃書很厚,兩三百頁,內容寫得很詳細。

肖遠在翻看的時候,並沒有去逐字逐句的讀,實際上也沒有那個必要,他只需要通過企劃書,把握其中的脈絡和關鍵,對唐新宇和顧狼的想法有所瞭解就行了,好在企劃書雖然厚,但是條理很清楚,所以肖遠讀起來也不費事。

在肖遠把企劃書讀到一半的時候,楊靜宸在外邊喊他吃飯,於是他暫停了閱讀,起身出門吃飯去了。

吃過飯後,他跟隨老媽去了書房,想要問她一些事情。

“怎麼,還要媽幫你做什麼?”書房裡,楊靜宸問道,很顯然,她以爲肖遠還要說開源社區的事情。

“不是,我想問問,您對中文自然語言處理知道多少,實驗室有沒有誰在研究這個?”肖遠問道。

“爲什麼想起問這個了?”楊靜宸問道。

“玄涅公司準備做一個全文搜索引擎,目的是想讓用戶通過在搜索框輸入日常用的語言,搜索引擎應該能夠自動對他們的語言進行分析理解,然後從網絡上海量的網頁中搜索到他們想要的信息,這裡面需要用到自然語言處理。”肖遠說道。

“全文搜索引擎?”楊靜宸眼前一亮,由衷道,“這個想法好啊,如果能做成,比玄涅現在主要經營的玄涅防火牆,更有前景,更容易做成大產業。”

“是的,我們也是看到了這一點兒,但是這其中有一些既需要理論支持,又需要大量基礎工作的東西,自然語言處理也在其中,而且很重要,您不是人工智能專家嗎,所以我纔想到問問您。”肖遠說道。

“自然語言處理嚴格來說,應該是一個以人工智能爲核心的跨學科研究方向,它牽涉到的,不僅僅是計算機和人工智能,還牽涉到語言學,心理學等其他社會學分科,雖然這個學科在西方起源挺早,四十年代就有了,但是自然語言系統太過複雜,所以,直到現在,全世界範圍內,也沒有什麼突破性進展。”

楊靜宸顯然對這個領域很熟悉,給肖遠介紹了一下當前國際上關於這方面的研究情況,然後又說了國內的研究情況:“咱們國內對這方面的研究,相比國外,還處於一個水平更低的基礎信息積累階段,一方面是因爲國內的起步比西方晚,二來,是因爲,中文和西方拉丁語系的那些語言有很大不同,拉丁語系是拼音語系,而且句式本身就是結構化的,所以計算機處理起來也相對容易,但是中文卻是一種古老的象形文字,句式靈活隨意,充滿了各種虛詞助詞,想將這樣的語言轉化成計算機可以分析處理的形式,本身就是一個很大的難題。”

“嗯,這倒是事實,那麼咱們國家現在的研究狀況究竟是什麼樣子的?”聽了老媽的話,肖遠稍稍有些失望,前世他也只是稍稍關注過這方面的理論,具體的細節瞭解也不是太多,於是就想更深入的瞭解一些。

“現在國內進行這方面研究的,主要是幾個大學,其中京華大學的研究比較前沿,國內其他大學在這方面的研究,也大都在配合京華大學的研究,做一些基礎詞庫整理工作,媽的實驗室也有人在做這方面的研究,主要承擔的是H到P的詞彙整理建庫工作,目前完成度已經到百分之八十了。”楊靜宸說道。

聽了楊靜宸的介紹,肖遠說道:“基礎詞庫大概什麼時候能夠建好?”

“這個很難估計。”楊靜宸說道,說完看到肖遠眉頭皺了起來,又說道,“你要真的想在搜索引擎中使用自然語言處理算法,媽倒是能給你一些建議。”

肖遠用詢問的目光看着老媽,等着她繼續。

“人們要利用你說的搜索引擎在網上檢索信息的話,我想他們用的最多的,肯定不會是完整的句子,而是一些關鍵詞,或者一些短句,僅僅分析關鍵詞和短句的話,難度就沒有那麼大了,而且你也沒必要一下子就把產品做的那麼完美,人們以前從來沒有接觸過這樣的產品,所以,只需要一些簡單的智能性,就足以對用戶產生足夠的吸引力了。”楊靜宸說道。

肖遠點了點頭,說道:“這個我自然是知道的,不過咱們國內的研究狀況讓我有些失望罷了,第一版肯定不能一下子往裡面放太多的東西,只需要做出一個基本的東西,然後根據用戶的反饋和新技術的成熟,再擴充,讓它越來越完善,這好像是軟件工程上有名的XP編程。”

“你知道XP編程?”

楊靜宸卻是因爲肖遠提到XP編程(此處的XP指的是eXtremeProgramming的簡寫,極限編程的意思,而WindowsXP中的XP指的是experience的簡寫,意思是體驗,而且99年還沒有WindowsXP之說。)感到很驚訝,大概是想不到肖遠還會去看軟件工程方面的書吧,更何況XP開發方法還是近幾年纔有人提出來的一種很新的方法。

“瞭解一些。”肖遠卻是沒有想到自己隨口的一句話,都能讓老媽感到驚訝,於是就把話題又拉回了正題,說道,“媽,我倒有個想法。”

“什麼想法?”楊靜宸問道。

“我想讓玄涅搜索和你的人工智能實驗室進行深度合作,一方面,你們能夠從玄涅得到一定的資金支持,而且你們還可以利用玄涅搜索所採集的海量網絡信息資源,另一方面,玄涅也能夠第一時間將你們的研究成果應用到自己的產品中,提升公司的技術含量,我認爲這是一件雙贏的事情。”肖遠說道。

“學校科研和企業合作,儘快轉化成生產力,是咱們國家一直提倡的,人工智能實驗室這些年,也一直在尋求與企業合作,聯合研發,所以,如果玄涅想要合作的話,實驗室當然歡迎了。”楊靜宸說道。

“那好,等時機成熟後,我讓唐新宇和你們談,具體過程我就不參與了。”肖遠說道。

…………

和老媽又聊了一會兒,肖遠再次回到了自己的房裡,把企劃書看完,思索片刻,他拿出紙筆,開始構思玄涅搜索引擎的技術架構了。

PS:這幾章需要講一些技術方面的知識,爲了保證不出現什麼紕漏,綠茶需要思考很多東西,查很多資料,寫的很慢,很費腦。

今天仍然三更,第二更送到。

第364章 我媽要見你第555章 戴呂冒的愛情第562章 你若負她,吾必誅你第637章 爭分奪秒第913章 兩個肖遠第499章 太意外了第617章 陰謀陽說第603章 重入blackskull第732章 淵源第199章 他有精神分裂症第255章 風暴前夕第180章 偉大的黑客第750章 又有客人來第167章 blackskull第134章 同聚食來香第202章 三件禮物第179章 陷阱破第854章 材料分析第771章 附加任務第486章 漁翁之利第434章 十成把握第666章 與路萱草的交鋒第485章 移花接木第836章 紈絝第568章 小姑娘面相好特殊啊第531章 劉雯雯要自殺第79章 母子談心第205章 老爸要離開第108章 顧狼的選擇第895章 鱷魚崽子第771章 附加任務第615章 吃紅果的嚴重後果第887章 夏娃失聯第683章 被困警局第835章 絕望的顧曉東第39章 迎戰前的準備第264章 風暴來臨第763章 又碎了一個第263章 病毒變異第147章 送上門來的獎勵第407章 比死亡更可怕的等待死亡第124章 晚宴上的偶遇第417章 林平在這裡第80章 天價智能防火牆第306章 狀元風波第461章 死局第539章 颯姐,是你嗎第826章 使命第855章 兩個目標第816章 因果律第439章 淋浴好啊第718章 災難(二)第79章 母子談心第917章 寧蘭,玄涅第319章 想做狼,先當狗第796章 興奮的胖子第606章 卡爾第17章 夏母有請第640章 演戲第906章 文明進化第80章 天價智能防火牆第428章 突破口第664章 SB001第249章 墜江第335章 你女朋友真的很聰明第613章 詭異的龍太傑第406章 傑西卡的身份第121章 提前通過第49章 池翔的邀請第117章 熟人,又見熟人第452章 文森特的選擇第583章 勸說第223章 惡之初現第232章 不速之客第555章 戴呂冒的愛情第245章 關於星銳與天龍的消息第257章 圍捕CIH第733章 腦波異常第719章 文件帶到第466章 MSTE的分析報告第900章 人腦計算單元第290章 指腹爲婚第831章 無心插柳第449章 意外的救兵第735章 假眠第513章 終於抓到了第254章 被強吻了第274章 平衡第867章 智能禁區第578章 通靈在線第177章 託,都是託第789章 壞寧蘭出現第753章 更大膽的推測第58章 坑爹啊第667章 莫名的憂傷第609章 究竟是什麼果子第819章 一去十三年第742章 遊戲第654章 禮物第899章 中心繫統異變
第364章 我媽要見你第555章 戴呂冒的愛情第562章 你若負她,吾必誅你第637章 爭分奪秒第913章 兩個肖遠第499章 太意外了第617章 陰謀陽說第603章 重入blackskull第732章 淵源第199章 他有精神分裂症第255章 風暴前夕第180章 偉大的黑客第750章 又有客人來第167章 blackskull第134章 同聚食來香第202章 三件禮物第179章 陷阱破第854章 材料分析第771章 附加任務第486章 漁翁之利第434章 十成把握第666章 與路萱草的交鋒第485章 移花接木第836章 紈絝第568章 小姑娘面相好特殊啊第531章 劉雯雯要自殺第79章 母子談心第205章 老爸要離開第108章 顧狼的選擇第895章 鱷魚崽子第771章 附加任務第615章 吃紅果的嚴重後果第887章 夏娃失聯第683章 被困警局第835章 絕望的顧曉東第39章 迎戰前的準備第264章 風暴來臨第763章 又碎了一個第263章 病毒變異第147章 送上門來的獎勵第407章 比死亡更可怕的等待死亡第124章 晚宴上的偶遇第417章 林平在這裡第80章 天價智能防火牆第306章 狀元風波第461章 死局第539章 颯姐,是你嗎第826章 使命第855章 兩個目標第816章 因果律第439章 淋浴好啊第718章 災難(二)第79章 母子談心第917章 寧蘭,玄涅第319章 想做狼,先當狗第796章 興奮的胖子第606章 卡爾第17章 夏母有請第640章 演戲第906章 文明進化第80章 天價智能防火牆第428章 突破口第664章 SB001第249章 墜江第335章 你女朋友真的很聰明第613章 詭異的龍太傑第406章 傑西卡的身份第121章 提前通過第49章 池翔的邀請第117章 熟人,又見熟人第452章 文森特的選擇第583章 勸說第223章 惡之初現第232章 不速之客第555章 戴呂冒的愛情第245章 關於星銳與天龍的消息第257章 圍捕CIH第733章 腦波異常第719章 文件帶到第466章 MSTE的分析報告第900章 人腦計算單元第290章 指腹爲婚第831章 無心插柳第449章 意外的救兵第735章 假眠第513章 終於抓到了第254章 被強吻了第274章 平衡第867章 智能禁區第578章 通靈在線第177章 託,都是託第789章 壞寧蘭出現第753章 更大膽的推測第58章 坑爹啊第667章 莫名的憂傷第609章 究竟是什麼果子第819章 一去十三年第742章 遊戲第654章 禮物第899章 中心繫統異變