語料清洗,其實就跟保護孩子教育的成長環境是差不過的概念。
教育孩子,必須保護他的成長環境——越是小的時候,就越不能讓他接觸亂七八糟的東西。
一旦從小長歪了、學壞了,後期再怎麼教育、再怎麼修理,也很難完全糾正回來。
人工智能模型也一樣如此,如果早期的“言心”模型出了問題,那意味着“言心”模型現在所有的備份都會出現同樣的問題。
機器學習很難,各種模型各種算法,都是經歷數年甚至十數年的演進和發展才逐步完善的。
訓練的過程中,更是消耗大量的CPU、GPU算力資源,耗費大量的金錢,可能還不能完全達到預期想要的效果。
但是,機器學習一旦學到了,想要讓它“忘掉”——那更是不可能的事情。
在無數個神經網絡節點上,機器學習到的東西可以說是無處不在,誰也不知道這些語料的成果會在哪些個節點上有所體現。
現在的技術手段根本沒有辦法通過遞歸或遍歷確定這些節點——因爲就連訓練者們自己其實也不清楚AI模型究竟是如何掌握這些能力的。
動不動幾十甚至上百個TB的數據,也確實不是人力檢測所能企及的——更不用說去指定清除特定的內容和能力了,這根本不可能做得到。
類比人的記憶,其實也差不多,你告訴一個人一個秘密,然後後悔了,想讓他忘掉?
那能怎麼辦?沒有任何辦法!
就算你對着他的腦袋給一榔頭,最終也不一定會是個什麼結果——相比單獨忘掉這件事兒,讓他完全失憶倒是更簡單一些。
機器學習的“遺忘”也是如此,但從技術層面來講,消除特定數據點影響的傳統方法,就是重開——也就是從某個備份開始重建系統。
如果所有備份都有問題的話,那就真的只能從零開始了。
而從零開始,那意味着海量的培養成本——幾十上百億的投資啊,直接就打了水漂了。
這樣的損失,別說是千尋科技,換成其他任何企業也無法輕易接受。
“也不是完全沒有辦法。”程旭微微思索了一番,隨後慎重的點了點頭,微笑着說道。
如果真的是人,除了讓他完全失憶,程旭也沒有任何辦法。
也不知道當今醫學界有沒有能讓人忘掉一些事兒的方法,想來應該是沒有的,人腦是最精密最複雜的器官,科學對之的認識還很侷限。
但機器說到底並不是人,神經節點網絡雖然龐大且複雜,但也並不是真的神經細胞,跟複雜的人類大腦相比,它還差了些。
結合自己曾經的經驗,程旭略微以推斷,就想到了藉助“荷泵”芯片的某些特性和優勢,嘗試解決這個問題是可行的。
“你有辦法?”潘正教授臉色一喜,不過卻沒有問得更多,而是說道:
“那回頭我聯繫千尋,你們應該有很大的合作空間。千尋科技着急上火好一段時間了,如果你能解決這個問題,不管是對你,還是對千尋來說,都是一件大好事兒!”
程旭原本還在計劃着怎麼切入人工智能這個領域——雖然“荷泵”優勢明顯,強勢插入也不是不行,但人工智能發展了這麼多年,有一個好的切入點,絕對是事半功倍的。
聽潘正教授這麼說,程旭表示同意:“我需要先看看具體情況,老師有內測系統的權限吧?加我一個,回去我先研究一下。
”
“嗯……”
……
“行了,別聊了,過來吃飯吧。”
倆人越說越投機,不知不覺,天色都已經很晚了,方雅蓉特意親自準備了飯菜,表現出了十足的重視。
她早就看出,老公對程旭這個學生的態度已經超出了一般的師生關係,而且,這年輕人也是真的有點兒意思,她也挺喜歡的。
“小旭,今天陪我喝點兒?”
潘正也是興致大起,彷彿回到了年輕時候一樣,渾身充滿了勁兒,也沒給程旭推脫的機會。
程旭一般不喝酒,但酒量還行——他曾經想試試自己能喝多少來着,但沒試出來,五十三度搞了一瓶,最後算是有點兒暈乎吧,想來酒量應該不差。
今天也就是小酌一杯,沒有任何問題。
他是沒問題,不過潘正教授看起來酒量可真的不太行,一杯酒下肚,話就開始多了起來:“小旭啊,跟你說句交心的話,你今天莽撞了。”
“啊?”程旭有點懵。
潘正其實沒喝多,他說的什麼他自己清楚的很,他就是故意的——在某些方面,他的確有他的擔心——因爲他想起了曾經的自己。
方雅蓉也早早的就離席了,這是她的習慣——她習慣在需要的時候給老公留空間。
“不用多問,你就記住,你今天沒去過學校實驗室,也沒用過學校實驗室的任何設備。”
潘正突然嚴肅起來,而且說得那麼謹慎,程旭好似想到了什麼,神色也變得有些凝重:
“學校的設備?這有什麼關係嗎?無非是做了一個驗證實驗而已,不至於出什麼幺蛾子吧?”
“理論上是不會,但是你這個成果,說實話,太大了。儘可能的別跟更多的人扯上關係,稍微有一點兒, 未來都是麻煩。
“不是我小人之心,但防人之心真的不可無。你今天做的就不好,跟我說得太多了。你知道最後的結果出來的時候我想什麼了嗎?
“我在想啊,如果這東西是我的,我增選院士都夠資格了。你知道,這種誘惑有多大嗎?你這種行爲真的很莽撞……”
……
就這樣,在酒桌上,潘正教授給程旭上了第一課:要永遠保持謹慎,尤其是對於革命性的成果,再大的謹慎都是不爲過的。
原本的程旭,包括前世在內,對潘正教授的瞭解認知都限他是極爲正直,正直到沒朋友的那種人,但卻鮮有人知道原因。
不過現在程旭知道了——潘正教授在拿他曾經的血一般的教訓來告誡程旭——謹慎,還是謹慎。
說起曾經的往事,潘正教授內心已經非常平靜,但藏在心裡的委屈程旭看得出來。
“其實那次確實是整個團隊的成果,誰功勞大一些、小一些都是小問題,縱然主要工作是我做的,但不都是報效祖國嗎,有什麼可爭的呢?
“但萬萬沒想到,竟然有人拿着這個成果申請了技術移民,而成果,也就這樣,跟着丟了。
“那個時候,我才明白,報效祖國不是報效領導,不是誰都能代表祖國的,這個時候,你心裡要有桿秤!”
程旭微微有些動容,潘正教授的這種委屈,不是因爲成果被搶,而是成果流失了——本屬於我們自己的東西,最終卻流向了國外,成爲了攻擊我們自己的武器!
這怎麼能不讓人痛心疾首?