我們不會經常想到自己語言的複雜性。這是一種直覺式行為,用於透過字詞、符號或影像等語義提示來傳達資訊和涵義。有人說,語言更容易學習,而且在青春期會更自然而然出現,因為這是一種經過訓練而可重複的行為,就像走路一般。語言並沒有遵循一套嚴格的規則,有很多例外,例如「I 在 E 之前,除了在 C 之後」。
然而,對於人類而言自然而然的事情,對擁有大量非結構化資料、缺乏正式規則而且沒有實際的背景資訊或意圖的電腦而言,卻是極其困難。這就是機器學習和人工智慧 (AI) 為什麼愈來愈引起關注和動力的原因,而且人類愈來愈依賴計算系統來進行通訊和執行任務。隨著 AI 變得愈來愈複雜,自然語言處理 (NLP) 也將隨之發展。雖然 AI 和 NLP 可能會讓人聯想到未來派機器人的景象,不過在我們的日常生活中已經有 NLP 的基本範例正在發揮作用。這裡有一些顯著的範例。
電子郵件篩選器
電子郵件篩選器是 NLP 線上最基本和最初始的應用程式之一。一開始是垃圾郵件篩選器,這會尋找某些表示垃圾郵件的單字或片語。不過篩選已升級,就像 NLP 的早期改版一般。
在 Gmail 的電子郵件分類中,可以找到 NLP 較流行的新版應用程式之一。系統會根據電子郵件內容識別電子郵件是否屬於三個類別 (主要、社交或促銷) 之一。對於所有 Gmail 使用者,這將使得您的收件匣大小保持在可管理的範圍內,其中包含您希望檢視並快速回覆的重要相關電子郵件。
智慧助理
Apple 的 Siri 和 Amazon 的 Alexa 之類的智慧助理藉由語音識別功能來識別語音模式,然後推斷涵義並提供適用的回應。我們已經習慣如此的事實,我們會說「嘿 Siri」,並提出問題,Siri 就會瞭解我們說的話,並根據並背景資訊提供相關的答案。我們透過恆溫器、電燈開關、汽車等物品與 Siri 或 Alexa 進行對話時,我們已經習慣於看見 Siri 或 Alexa 在我們的整個家庭和日常生活中突然出現。
現在,我們希望像 Alexa 和 Siri 之類的助理在改善我們的生活並簡化某些活動 (例如訂購商品) 時瞭解脈絡線索,甚至期望這些助理幽默地回答或答覆有關本身的問題。隨著這些助理愈來愈瞭解我們,我們的互動將變得更加個人化。「紐約時報」的專文「為什麼我們很快就會生活在 Alexa 的世界中」解釋:「還有更重大的事情即將發生。Alexa 有望成為這十年的第三大消費者運算平台。」
搜尋結果
搜尋引擎使用 NLP 根據類似的搜尋行為或使用者意圖顯示相關結果,因此一般人不需要搜尋字詞精靈即可找到所需的內容。
例如,您開始輸入文字時,Google 不僅會預測哪些熱門搜尋會套用於您的查詢,而且會檢視整個圖片並識別您要說的內容,而不是確切的搜尋字詞。有人可以在 Google 上輸入航班編號並取得航班狀態、輸入股票代碼並接收股票資訊,或者在輸入數學方程式時可能會出現計算機。這些是您在完成搜尋時可能看見的一些變體,因為搜尋中的 NLP 將模糊查詢與相對實體相關聯並提供實用的結果。
預測文字
自動更正、自動完成和預測性文字之類的內容在我們的智慧手機上相當普遍,因此我們會感覺習以為常。自動填入和預測性文字與搜尋引擎相似,這些會根據您輸入的內容、要修飾的單字或建議相關內容來預測要說的內容。而且自動更正有時甚至會變更單字,使得整個訊息更有意義。
這些功能也向您學習。預測性文字會隨著您使用時間延長而對於您的個人語言偏好進行自訂。這使得一般人可以進行有趣的實驗,一般人可以在手機上共享完全由聯想文字組成的整個語句。結果相當個人化且具有啟發性;這些功能甚至獲得多家媒體重點報導。
語言翻譯
做西班牙作業時作弊的明顯跡象之一是,在語法上毫無規則可言。許多語言不允許直接翻譯,而且語句結構的順序不同,不過翻譯服務通常會忽略這些順序。然而,這些服務已經歷經很長的過程。
使用 NLP,線上翻譯人員可以更準確翻譯語言並顯示語法正確的結果。嘗試與操持另一種語言的人交流時,這相當實用。不僅如此,現在,將另一種語言翻譯成您操持的語言時,工具也可以根據輸入的文字識別該語言並進行翻譯。
數位通話
我們所有人都聽過「可能基於訓練目的而錄製此次通話」,不過我們很少懷疑這表示什麼。事實證明,如果客戶感覺不滿,則可以將這些記錄用於訓練目的,不過大多數時候,這些會進入資料庫供 NLP 系統學習並在未來進行改進。自動化系統將客戶來電轉接到服務代表或線上聊天機器人,線上聊天機器人會以實用的資訊回應客戶的要求。這是許多公司 (包括大型電信服務供應商) 使用的一種 NLP 做法。
NLP 也可以使得電腦產生的語言接近人類的聲音。這段視訊顯示 Google 助理預約理髮,因此可以自動撥打電話預約換油或剪髮等等。
資料分析
隨著愈來愈多的 BI 供應商為資料視覺化提供自然語言介面,自然語言功能已整合到資料分析工作流程中。其中一個範例是更智慧的視覺編碼,這基於資料的語義為正確的任務提供最佳的視覺化效果。這使得使用者更有機會使用自然語言陳述或由幾個可以解釋並賦予其涵義的關鍵字組成的問題片段來探索資料。
使用語言來調查資料不僅可以提高可存取性的程度,而且可以降低整個組織進行分析的障礙,遠超出分析師和軟體開發人員的預期社群。
若要深入瞭解有關自然語言如何協助您更確實視覺化和瀏覽資料,請觀看此網路研討會。
文字分析
文字分析使用不同的語言、統計和機器學習技術,將非結構化文字資料轉換為有意義的資料,藉以進行分析。
儘管情感分析對於品牌而言聽起來令人生畏,尤其是在擁有龐大客群的情況下,不過使用 NLP 的工具通常會搜尋與客戶的互動,例如社交媒體評論或回顧,甚至搜尋品牌名稱提及的情況來檢視所說的內容。這些相互作用的分析有助於品牌在決定如何回應或增強服務以達到更好的客戶體驗之前,確定行銷活動的執行情況或監視趨勢客戶問題。
NLP 協助進行文字分析的其他方法包括關鍵字擷取以及在非結構化文字資料中尋找結構或模式。
NLP 在數位世界中有廣泛的應用,而且隨著企業和產業運用並發現其價值,應用範圍將不斷擴大。雖然人性化對於更複雜的通訊問題很重要,不過 NLP 會先管理和自動化較小的任務,再透過技術創新促使複雜的任務自動化來改善我們的生活。