[大衛選讀] 使用者體驗研究先驅 Jakob Nielsen 剛發表文章表示:最新的易用性研究發現,AI 可提升員工生產力達 66%
Jakob Nielsen 是在使用者體驗設計 (User Experience Design) 和易用性 (Usability) 領域中極具影響力的專家。他被認為是網頁易用性概念的教父,同時是專業諮詢公司 Nielsen Norman Group 的共同創辦人。
很少看到 Jakob Nielsen 用如此興奮的口氣發表文章。看著UX領域的大師級人物,對於 AI 提昇工作效能的實證研究成果,有這樣熱切 (手舞足蹈?) 的反應,真是非常新奇。
簡單講,AI 讓生產力瞬間增加了66%,這是很驚人的進步。AI 不只增加了效率,也同時增進了品質。AI 不會取代人類,往後最好的工作結果,將來自 AI 和人類的共同協作。AI 縮小了技能差距,同時也減低了人們在工作記憶上的負載,這將會大量釋放創新突破的可能性。
我盡量在翻譯上保留 Jakob Nielsen 的原意語調了,有興趣感受一下興奮感的,記得閱讀一下原文 🙂
重點摘要整理如下,全文連結:https://www.nngroup.com/articles/ai-tools-productivity-gains/
▋AI Improves Employee Productivity by 66%
易用性研究發現,AI 可提升員工生產力達 66%
我們終於得到了關於像 ChatGPT 這種生成式 AI系統在實際商業任務中的易用性研究數據。三個最新的研究針對不同領域中非常不同類型的工作者進行了測試,都得出了相同的結論:使用 AI 後的生產力明顯提高 (productivity increased significantly),技能最低的工作者獲得了最大的收益 (biggest gains for the least-skilled users)。其中一些研究還發現,不只是效能,工作的質量也有所提高。
近幾個月以來,對 AI 無止盡的討論一直在進行,但幾乎所有的結論都是推測性的,充滿了作者的個人觀點。大部分內容都可以看做是胡說八道。
基於特定觀點的猜測經常是錯誤的,並且當公司砸了大筆資源,卻推出了無效的產品時,這將會導致大量的浪費虧損。這就是為什麼這些從用戶實地使用中所蒐集來的實證資料 (empirical data from hands-on use),會如此地有價值。
▎生產力研究結果 (Productivity Findings)
最近有三個獨立研究,分別測試了企業軟體公司的客服人員解決客戶查詢、經驗豐富的商業人士撰寫常規商業文件,以及程式設計師編寫一個小型軟體。
研究中最引人注目的結果是: AI 確實適用於真實的商業使用。與沒有 AI 工具相比,用戶在 AI 協助下去執行工作要有效率得多。
• 研究1:使用 AI 的客服人員,每小時能多處理 13.8% 的客戶查詢。
• 研究2:使用 AI 的商業人士,每小時能多撰寫 59% 的商業文件。
• 研究3:使用 AI 的程式設計師每週能多編寫 126% 的程式碼。
從圖表中可以清楚地看到,任務生產力的變化在三個研究的領域中非常不同。似乎越需要認知的任務 (例如:寫代碼 vs. 回答客戶查詢),越能受益於 AI 的協助。
▎AI 導致的生產力提升真的有那麼重要嗎? (Is the AI-Caused Productivity Lift a Big Deal?)
平均而言,在這三項研究中,生成式 AI 工具在執行實際任務時讓企業用戶的生產力增加了66%。我們應該如何評價這個數字?
單純數字本身是沒有意義的。只有當我們將其與其他數字進行比較時,才能得出結論。
作為比較,根據美國勞工統計局的數據,美國的平均勞動生產力增長在 COVID-19 大流行前的 12 年 (2007-2019年) 中,為每年增加 1.4%。根據 Eurostat 的數據,歐盟在同一時期的平均勞動生產力增長為每年 0.8%。
現在我們有了可以比較的東西。AI 帶來的 66% 生產力增長,如果是用自然方式增長,在美國得花上 47 年,在歐洲得花上 88 年。從這點看來,確實,AI 是一件大事!
▎UX專業人士的生產力 (Productivity of UX Professionals)
我們目前只有很少量的數據,是關於 AI 被 UX 專業人士使用的潛在好處。一項研究表明,ChatGPT 可以幫助更快地進行問卷填答結果的主題分析。
對於UX工作,我們可以期待多大的改善呢?一般來說,複雜性越高的任務,可以導致越大的 AI 增效。UX 設計雖然並不像程式編碼在認知上要求那麼高 (編碼工作的效能提昇為 126%),但它的複雜性也相當高。因此,我猜測 AI 支援的 UX 工作,可能會提昇近 100% 的生產力。
但並非所有的 UX 工作都將同樣受益於 AI 工具。例如,在探索式研究 (discovery studies) 或易用性測試 (usability testing) 中,觀察式的用戶研究仍然需要由人類進行。
AI 目前無法猜測用戶會做什麼,除非它們能觀看人們執行實際的任務,並真正理解當中的情境。這種「觀看, watching」可能最終會被自動化,但我懷疑對於許多重要的研究,人類 UX 專家仍然需要和用戶並肩坐在一起做互動觀察。
不幸的是,進行一個小時的客戶訪談,就需要耗費一個小時,因此沒能增加生產力。 但是,AI 可能可以加快每次訪談記錄的總結和比較。
我在這個階段的初步猜測是,UX 工作的一半將受益於 AI 工具。如果我們有一半的工作可以提高 100% 的產出,那麼 UX 工作總體來說只會提高 33% 的生產力。
但這仍然是好事,雖然並不那麼具有革命性。因為我們的工作的本質,是以人為本 (human-focused nature of our work)。
▎AI 導致的品質改進 (Quality Improvements from the Use of AI)
提昇效率是好的,但如果 AI 的使用造成了大量低品質的產出,那對我們就沒有任何好處。
幸運的是,兩份研究都指出,使用 AI 輔助產出的品質,優於不使用 AI 產生的輸出。
根據參與者的自我回饋,品質的提升可能來自於投入後續的編輯:使用 AI 的商業人士在產生文件初稿 (由 ChatGPT 生成) 上節省了不少時間,而在編輯上花費了較多的時間,從而生產出更加精緻的交付成果。
▎人機共生 (Human-Computer Symbiosis)
1960年時,電腦先驅 J.C.R. Licklider 寫了一篇具有影響力的論文,題為「人機共生, Man-Computer Symbiosis」。Licklider 預見了一個未來,人和電腦將在可預期的合作互動發展 (an expected development in cooperative interaction) 中彼此互補。
根據手上這三篇早期的 AI 易用性研究,這一天似乎已經來臨。優秀的工作成果展現在數量跟品質上,這都來自這類的人機共生。
AI 不會取代人類。最好的工作結果,將來自 AI 和人類的共同協作。
▎縮小技能差距 (Narrowing Skill Gaps)
研究還有第三個令人振奮的發現,生成式 AI 可以縮小最有才華 & 最無才華的員工之間的差距。
當然,個體差異將永遠存在,而且一定有一些人的表現會優於其他人。但是,這些差異將可以通過 AI 來減少。
在客服服務的研究中,表現最差的20%的客服,透過 AI 增加了35%的任務處理量;相比之下,表現最好的20%的客服只提高了幾個百分點。
在撰寫商業文件的研究中,沒有使用 AI 時,好與壞作家之間的差異約為 2-3 點 (在七級量表上);使用 ChatGPT 時,這個差異縮小到大約 1 點而已。
在程式撰寫的研究中,同樣是經驗較少的程式設計師從 AI 工具中受益更多。三個獨立研究的結論都相同:使用 AI 縮小了最差 & 最好表現者之間的差距。
▎AI 縮小了技能差距,但最大的生產力提升,產生在認知要求高的任務當中 (Narrowing Skills Gap, but Biggest Productivity Gains in Cognitively Demanding Tasks)
起初,我以為表現最差的人在特定領域中會最需要 AI 的幫助;但研究結果卻也顯示,在各種不同的領域中,最大的收益是那些更需要認知理解的任務 (cognitively demanding tasks)。
這是一種矛盾。
換句話說,在一種分析中,AI 幫助在低端,而在另一種分析中,AI 則是在幫助高端。這怎麼可能呢?
我一直想看到更多的研究,含括更多的領域,和更廣泛的目標使用者。但是,透過手頭的這三個案例研究,我對這兩種看似相反的結果,有一個暫定的解釋。
我的假設是:在處理大量數據過程中,生成式 AI 接手了相當一部分的繁重工作。也就是說,它減低了人們在工作記憶上的負載 (working-memory load)。
與領域中的專家相比,低技能工作者或新手將傾向於使用更多的工作記憶來完成任務,因為對任務還不完全熟悉,他們必須記住如何去做。
透過承擔一部分繁重的工作記憶負擔,AI 工具讓使用者能釋放出獨特的人類創新力,就像針對商業文件做後續編輯一樣。
創新在複雜任務中,比常規任務來得更加重要 (Creativity matters more in complex tasks than routine tasks),這也是AI在高階領域中更有幫助的另一個原因。
沒有 AI,不夠熟練的使用者將會需要把大部分的工作記憶用於數據處理,因此他們的創新能力會受到壓制。但是有了 AI,他們的大腦就會有更多的空間來創新。
因此,技能較差和較好的工作者,中間的差距就縮小了。
▎最後,更快的學習 (Faster Learning)
最後的發現,來自於第一個客服研究。研究中客服專員被持續追蹤記錄了好幾個月;結果顯示,當有了 AI 的支持,客服專員達到專業水平的速度,會遠比沒有 AI 支援的更快。
平均來說,新進的客服專員每小時可以完成 2 個客戶查詢;一個有經驗的客服專員則可以完成 2.5 個查詢。這種生產力水平的提升,通常需要工作 8 個月才能達到。
相比之下,剛開始就使用 AI 工具的客服專員則只需要 2 個月就能達到這種效能水平。換句話說,AI 的使用提昇了四倍學習的速度。
這三項研究非常不同,但都得出了相同的結果。這大大增加了我對結論的信心。這三項研究的主要作者分別來自史丹福大學,麻省理工學院和微軟研究院。
儘管研究的目標對象跟任務性質都不同,但這三項研究仍然都得出了大致相同的結論。這確實令人印象深刻!