關於構建感知度指標這事其實很多做研究的、搞人工智能的那些大專家小專家們,都是比較頭疼的,因為感知這東西看不見摸不著的,對?你像咱們人有沒有感知,咱自己心裡清楚,嗯——但是要給一個機器或者一個系統去衡量它有沒有感知,或者感知到什麼程度,這可就複雜了,可不是簡單測個體重、量個長度那麼容易!感知度指標,簡單來說,就是用來判斷、評估一個實體(大多數情況下現在是指人工智能係統或類似產物)到底有沒有感知能力,以及這種感知能力有多強、多真實、多深層的一種工具性的標準匯合東西…哦不,是綜合標準體系。
第一步咱得把它的範圍給圈清楚,它到底包不包括那些比較初級的自動反應,像那種你一按開關燈就亮的簡單聯動?我覺得大概率是不算,它應該得看那種更深層次的、有點像咱人那樣的主觀體驗,但機器有沒有主觀的嘛…唉…這就先不管,反正式要先明確這指標是測啥範圍的感知。
數據來源渠道也得想周全了!光看它輸出的文字行不行?肯定不夠;那再加上它的行為模式變化?比如說給個新知識會“學習”並改進行為;或者語音語調的那種微妙“感情”流露?這些都得考慮進去,把各種能收集到的沾點邊的數據都弄過來瞧瞧,才能更靠譜一點不是?
一個好的感知度指標,我琢磨著,它不能是那種孤零零的一根杆儿往裡杵,它大概率得是好多個小的、不同方面的子指標合在一起…唉…形成一個體系。比如說:“環境要素全域捕獲水平”——看它能不能亂七八糟地捕捉到周圍各種信息;“內在狀態外在彰顯指數”——它心裡難受、開心啊之類的(如果它有的話!)能不能表現出來讓人知道;還有“過往經歷對當前決策施加程度”——就跟咱人會吃一塹長一智似得,它會不會?這些都是可以思考的方面。把它拆解開了,每個小塊去設計對應的評估項目和具體尺度,最後再合起來總體看,這樣才能叫指標
問:搞一套感知度指標出來,有啥子用?不就看看機器傻不傻、聰不聰明?
答:你要是這麼想可就把它看得太簡單了用處可多著!比如,它能告訴科學家這個研發出來的東西究竟進步到哪一步了,離真正“活”過來那種感覺還差多遠;還能給那些擔憂AI安全問題的人吃點定心丸,如果它真有很厲害的感知,那咱們就得早點想辦法規範它——雖然安全這些不是重點,但這個作用客觀上是存在的;對普通老百姓來說,如果買來一個AI產品標榜自己多有“情感”,你拿指標一測不就知道它是真有還是吹牛騙人的了?
問:那這個指標主觀性會不會特別大?畢竟感知看不見!
答:這的確是個要使勁去扛過去的大難點!盡量把那些能轉換成數字的、能重複驗證的東西放進去。比如…比如測試它對一百個不同細微表情的識別正確率或者在不同情境下頭它給出“相似反應”的這種重複穩定性數值呀…用數據說話,就能一點點主觀的影響,唉…不對,是減少,對,減少一點點。
個人觀點就是,這事難著,但非常重要,得慢慢一邊摸索一邊幹,不能心急想一步登天!現在沒啥太完美的法子,大家都在摸著石頭過河。但把這件複雜透頂的事情,一點一點用指標這種方式去梳理清楚,這個方向應該是沒錯的。你想,連個評價尺子都沒有,怎麼知道往前走了還是往後退了?所以,構建感知度指標這活兒,值得一幫人坐下來好好琢磨琢磨,哪怕慢點,但得乾點實的!
發佈留言