白皮書

Tableau 商業科學隆重登場

Tableau 為商業人士提供強大的資料科學功能

Tableau 技術長 Andrew Beers

執行摘要

這份白皮書介紹 Tableau 商業科學。Tableau 商業科學是一種採用 AI 的全新等級分析技術,能為業務領域專家提供資料科學功能。

使用 AI、機器學習和其他統計方法來解決業務問題,這件事在過去幾乎都是由資料科學家執行。許多組織都有小型資料科學團隊,這些團隊專注於處理規模可高度擴展的特定任務關鍵問題。不過,有許多業務決策不只需要資料,也需仰賴經驗與知識。

透過商業科學,瞭解資料情境背景的分析師及商業使用者能訓練及部署可解釋的機器學習模型,運用這些模型來解決小型專精資料科學團隊沒有時間或資源可優先處理的問題。

在 Tableau,分析總是離不開讓使用者提出下一個問題、探究下一個假設、檢驗下一個構想。現在,我們進一步發展,藉由實用、符合道德規範的 AI 協助更多人提升人員判斷力,以便對現今的業務問題進行預測。這不僅能助組織一臂之力,讓組織在各業務範疇中更快、更有信心地做出決策,也能擴增分析技術的使用案例,並加深自己對自家資料的瞭解。

運用 AI 做出更明智決策時面臨的阻礙

隨著組織收集的資料集越來越多樣,將資料轉為寶貴見解的分析使用案例數量,也以同樣的速度快速成長。目前有多種工具及專精的團隊專門尋找可做為決策資訊來源的資料見解,不過組織還沒有能力在高度技術的資料專家與擁有經驗及深厚領域專業知識的業務團隊之間取得平衡。並非每家公司都有資料科學團隊或人工智慧 (AI) 解決方案,而具有這類團隊及解決方案的公司,通常有一個規模小但技能水平高的團隊,而且這個團隊有堆積如山的專案要處理。

我們常看到的情形是,具有領域知識且近距離接觸業務資料的商業使用者及分析師沒有相關的工具或技術技能,無法進行進階的統計分析,或自行管理機器學習 (ML) 專案。他們經常需要仰賴資料科學家和 ML 從業人員,透過反覆收集各種需求的程序,才能建立及部署自訂模型。這種程序缺乏靈活性,而且無法快速反覆執行。週期結束時,用於訓練模型的資料通常已過時,因此必須從頭重新執行程序。此外,商業專業人員在日常業務中,需負責做出重要的決策,但這些決策的優先程度,尚未達到中央資料科學團隊會接手處理的等級。

我們許多客戶都瞭解在更多業務問題上應用資料科學、AI 及 ML 技術能帶來的價值,但在資源及程序方面感到心有餘而力不足。不同產業及領域的組織向我們表達各種需求,其中最常見的需求包含希望:

  • 減少資料探索與準備工作
  • 讓分析專家能以更低的成本提供資料科學所產生的內容,特別是預測
  • 讓資料科學家能夠心無旁騖專心處理任務關鍵問題的複雜資料工程作業,在這類作業中,精準度是最重要的考量
  • 提高領域專家建立成功之模型的可能性,進一步探索各種使用案例
  • 為事業群及領域專家提供、加快分析技術,並將分析技術自動化
  • 減少花費在部署與整合模型的時間與費用
  • 讓資訊更加公開透明,推動負責任地使用資料與 AI 技術,並取得如何盡可能減少及處理偏見的指引

在 Tableau,我們發現有很大的機會可協助組織,讓組織在更多業務問題上應用資料科學功能,並在「非常精準且高度控管」及「快速取得見解,並在見解仍有效時採取行動」之間,盡量減少各種權衡取捨。我們在 Tableau 中導入 Salesforce Einstein Discovery 的核心 AI 技術,藉此推出採用 AI 的全新等級分析技術,期能讓資料科學技術大眾化,並讓使用者能更快、更有信心地做出決策。此外,我們也認為這是市場應持續進行創新的重要領域。

Tableau 將視覺分析技術大眾化,我們現在也要將自助式 AI 技術大眾化。透過商業科學,每天處理資料的眾多專業人員將能發揮龐大的潛力。這些熟悉商業智慧的人士可從描述性分析進展到使用進階分析、預測與建議,在更多使用案例中,以更快、合作更加緊密的方式應用更豐富的分析功能。

Tableau 商業科學隆重登場

什麼是 Tableau 商業科學?

商業科學是一種全新且採用 AI 技術的分析類別,可以讓擁有領域專業知識的人士更自信且快速地制定更明智的決策。商業科學認清一件事:並非所有的問題在講求精確的精度時都必須犧牲速度與業務背景資訊。商業科學解決方案也相當嚴格和準確,不過決策者能夠因此藉由控制和彈性來確定本身的使用案例所需的條件。使用者進行控制的一些方法包括選擇與形塑輸入資料、選擇變數,以及設定閾值。業務專家能夠啟用完全自動化的體驗,也可以選擇在模型建立過程中進行引導式變更。藉由為更多人提供受控管且不需撰寫程式碼的 AI(例如預測、假設情境規劃、引導式模型建立功能),業務團隊自己就可以執行更多的分析作業,並建立更多適用且可實際使用的模型。

商業科學促使資料科學功能普及化,並協助領域專家瞭解模型的關鍵驅動因素,在過程中完全不需要學習傳統的資料科學工具。藉由領域專家掌握的引導式 AI 體驗,團隊可以運用進階分析處理更多業務問題,藉以更迅速、更確實制定重要決策,同時仍然可以運用自身的判斷力。這與微調超精確模型無關,而是要引導與問題最相關的人朝正確的方向前進。

 

Tableau 商業科學適合哪些人?

商業的本質相當複雜而且難以預測,因此瞭解領域動態的人員,其擁有的領域相關經驗和知識極為重要。歷史資料這項輸入內容雖然有幫助,但不一定足以解答「瞬息萬變的市場狀況會對您的組織產生哪些影響」這個問題。瞭解領域情境背景,且能快速調整與回應的人,是成功應對變化萬千之市場環境的關鍵要素。業務專業人員和資料分析師完全不需要學習 Python、統計資料或如何調整演算法的參數,即可運用 ML 模型中的預測和見解,開始發展資料驅動的專家所組成的團隊。

商業科學就是將領域專業知識及理解,與歷史資料與分析見解加以結合。一般來說,知道正確的問題,以及要如何應用解答,比選擇演算法等細節還要重要。這些問題通常比簡單的核准/拒絕決策還要複雜。資源配置、優先順序、人力安排及物流方面的問題,經常需要使用商業科學,才能做出資料導向的最佳決策。

我們已經觀察到在許多情況中,商業科學是正確的做法,能為企業帶來最佳結果。這些情況包含:

  • 行銷與銷售人員能將商業科學應用在潛在客戶評分、商機評分、預測成交所需時間,以及其他資料科學團隊無法優先處理,但極有價值的許多 CRM 相關使用案例。
  • 商業科學可在供應鏈配銷與最佳化、預測消費者需求,以及探索新增產品到產品陣容中的情境等應用上,為製造商與零售商帶來效益。
  • 人資部門可能會使用商業科學來分析歷史模式,並將招募者如何根據應徵者價值調整薪資、配股及福利等項目的知識列入考量,藉此評估某位應徵者接受錄取待遇的可能性。
  • 企業的房地產團隊可能會運用商業科學來規劃要在哪裡購置辦公空間,並探討將員工從一個建築物或辦公室地點轉移到另一個的成本。在這種情況中,人員的判斷力有助於兼顧合適的預算考量及任何「辦公室政治」(即移動特定個人或團隊可能造成的影響)。

為何要選用 Tableau 商業科學?

資料和領域專業知識是 AI 專案成功的必要要素

雖然有些人會誤以為 AI 將會取代人類並因此對 AI 感到害怕,實際上仍有太多的業務問題,即使是交由最聰明的機器處理,也不比利用人員判斷力處理。舉例來說,負責銷售的組織可能會使用預測建模技術來判斷哪些追加/交叉銷售的商機獲利能力最高。演算法可預測客戶會購買的可能性,但沒有管理業務關係的人士所具備的重要知識。業務經理會知道客戶的目標,以及哪些產品可能可協助客戶達成這些目標,或是因過去的經驗,知道某個解決方案不太可能達成購買共識。

這些細微之處都需要運用人員判斷力,超出單單使用演算法可達成的境界。人員的專業知識、判斷力和情境背景意識,再加上機器產生之見解所能提供的嚴謹程度、自動化能力和可擴展性,將能促成更好的業務成果。讓我們再舉另一個例子,零售商可能想要瞭解商店要新增哪些產品,才能增加某個地區的利潤。業務專業人員會瞭解供應商關係、區域趨勢和其他有效應的質性影響等因素如何影響決策,這些是機器可能永遠無法瞭解或成功應用的細節。

即使使用自動化技術,相關人員也應該要能理解與解釋結果。多數採用 AI 技術的自動化功能,都是使用數學演算法來進行建模與預測,而應由人工持續測試建議。

組織投入許多心力招募具有資料科學與領域專業知識的「獨角獸」,但符合此描述的人非常稀少。在許多任務關鍵問題中,資料科學技術為最重要的考量,但商業科學讓更多人能夠使用這些技術,使他們不必具備進階的技術學位,也能在分析中使用預測。

商業科學就是將適合的方法和專家與問題配對。資料科學團隊為企業進行新的專案時,常因缺乏情境背景及領域相關知識而遇到困難。因不瞭解正確的情境背景,資料科學團隊耗費許多時間嘗試找出適合用於處理問題的資料,接著還要整理、清理資料,並為資料進行分析的準備作業。由於 AI 和 ML 都非常仰賴資料,這從根本上來看是一個資料問題,因此能針對要解決的問題,找出合適且形態正確的資料,是非常重要的一件事。

領域專家近距離接觸組織面臨的獨特問題,且具備自己業務範疇資料的特有知識,因此在開發、驗證及部署預測模型上,具有較符合時間效益、有效率且更有影響力的優勢。

 

反覆執行、修改後再重新部署的做法不僅能節省時間與成本,也能讓獨特的技能進一步獲得發揮

傳統的資料科學與 ML 週期可能相當漫長,而且「最後一哩路」在時間、心力及成本方面,經常是最具挑戰性、且資源需求最高的部分。部署與整合傳統自訂模型的作業相當複雜,需要由統計學家與資料科學家將解決方案變得可供最終使用者使用及執行。上市所需時間為主要考量時,如果能讓使用者在幾天或幾週內建立及反覆執行預測模型,不需要幾個月才能完成,資源將可獲得最大的運用,而且有助於提升投資報酬率。

許多組織難以將 AI 原型及測試計畫擴大為實際採用及更廣泛使用,且經常低估了部署 AI 並將 AI 與其他系統整合時,需面對的挑戰。根據 Gartner 2020 年的組織 AI 調查,所有的原型中只有 53% 最後會進行部署。

業務專家需要利用資料及預測做為決策的資訊來源,因此能夠控制建模程序的各個面向,並根據每個使用案例,對資料有適當程度的信心,這些對業務專家來說非常有價值。建模方式為反覆進行,且注重持續改善預測精確性時,這項功能尤其值得。這樣的做法可協助使用者,讓他們在資料仍有效時採取行動。有時候,甚至連嘗試建立模型,都能使團隊持續證明資料,直到從中獲得價值後才會停止。

商業科學的目標是改變 KPI,而不是持續改善模型,直到模型達到最精準的狀態為止。相較於傳統的資料科學週期,商業科學有助於進行反覆性較高、採用「修訂後再重新部署」做法的程序,能夠為瞭解業務情境背景的使用者消除障礙,讓他們能夠快速建立模型並應用預測。這樣一來,就能讓更多使用者更快從這些進階分析技術中獲得價值,也能在需要的時間與位置,做出更明智的決策,甚至可能為特定使用案例省下大幅成本,或是創造可觀的利潤。

讓我們思考一下銷售額的指派方式:指派的地理區域和目標隨時都在改變。某一年用於指派配額的模型,無法用於指派下一年度的配額,因為輸入到模型的內容會持續變化。如果區域銷售主管有目標在所屬地理區域中達成更高的銷售量,並因此否決建議的模型,那要怎麼辦?在這種情況中,如果能夠快速轉換或反覆執行模型,就非常可貴,而且可能可以在這些銷售領域中,創造更多產生收益的全新商機。

商業科學讓分析師及商業使用者都能以安全、自助式的方式使用機器學習技術,讓更多人的獨特技能與領域專業知識進一步獲得發揮。這也讓資料科學團隊有空專心處理大規模的任務關鍵專案,進而強化資料科學團隊扮演的必要角色。這種等級的 AI 技術解決方案,也能為分析師及進階商業使用者創造一個實驗性環境,供他們探索非資料科學團隊優先處理的新使用案例。隨著檢驗大量使用案例及分析可能結果之驅動因素的人數增加,提供成功之模型的可能性也跟著提高。領域專家完全不必編寫程式碼,就能根據需求建立採用 ML 技術的模型,並產生出不需要達到資料專業人員探討之深度的良好、特定業務專用分析功能。

另請務必留意,雖然商業科學解決方案有助於消弭分析師和資料科學家之間的技能差距,但無法取代這些人員。資料科學專業人員會繼續提供自訂模型、統計分析等,不過我們會更常看到他們與業務專家合作,攜手驗證採用 ML 技術之模型中所使用的資料。因此,跨團隊合作會更加密切,而這樣的合作仍是解決方案成功並發揮成效的關鍵。

 

要負責任地將資料科學大眾化,需有識別與減少偏見與不道德使用的指引

讓更多人使用採用 AI 的分析技術有許多好處,但也有一些潛在的危險。資料與技術在本質上就具有偏見,而且除非加以緩解,偏見將會延續到預測及建議中,甚至造成傷害。人臉辨識技術是匯集了許多失敗環節的知名範例,在這個範例中,有偏見的訓練資料、技術及預測產生出傷害有色族群的結果(這是我們  不允許使用 人臉辨識技術的原因之一,詳細規定請參閱我們的  使用政策)。

一般的商業專業人員在分析時,不一定會思考到這些事情。您可以先提供完善的模型說明文件,這樣的說明文件可讓模型與建議背後的技術更加公開透明,也更方便進行追蹤。瞭解預測是由哪些因素所產生、資料中有哪些資料欄,還有驅動因素在何處,都有助於找出資料集與模型中的偏見。

沒有自動化或一體適用的解決方案可確保資料與 AI 的使用都符合道德規範,您必須透徹地瞭解資料。不過在技術上設置保護措施,以便指出可能有害的情形,是我們應為客戶盡到的責任,也就是協助客戶,讓資料中的偏見不會延續到預測中,再套用到新輸入的實際資料上。

進一步的指引可能會是內建偏見偵測及模型監控的功能,以及為影響預測的變數提供自然語言的解說,協助使用者建立更符合道德規範的模型。透過 Einstein Discovery,我們的產品會請使用者選取可能會包含偏見的變數和敏感欄位,例如種族、年齡、婚姻狀態及居住位置。產品也會利用 Proxy 偵測,在資料集中尋找如未一併移除便可能產生偏見的相關聯欄位。另一個重要的指標是差別影響:舉例來說,這可能是查看不同的性別或郵遞區號,其模型結果是否會有差異。許多受管制的產業都會使用這個指標來對機器學習模型究責。

將 AI 與 ML 技術大眾化牽涉到一些重要的考量與責任

這是一個新興領域,因人們會發現各種新技術與使用案例,道德標準與規範也會日趨普及,我們無法清楚知道環境會如何改變。歐盟主管機關即將推出的新法規,將會進一步形塑 AI 技術的樣貌。美國有越來越多州與聯邦政府實施新的人工智慧控管措施。由於環境瞬息萬變,且過去一年的變動程度較大,各組織正受到考驗:數位轉型不是即將到來,而是已經來臨。企業正在設法管理目前大量湧入的資料,以及如雨後春筍般出現的 AI 創新技術及有效應用,包含如何使用 AI 提升靈活性與韌性。

商業科學讓更多人能夠使用機器學習技術,但組織需負責管理 AI 技術的開發作業,以及以安全、符合道德的方式使用 AI 技術。Tableau 與 Salesforce 為個人使用者及組織提供平台與指引,讓他們能夠做出明智、負責任的決策。客戶將能更進一步瞭解資料,以及要應用 AI 與 ML 解決方案的業務背景情境。我們相信將強大的 AI 與 ML 解決方案與人員的專業知識加以結合,是兼顧適當程度的跨團隊協作、符合道德規範之 AI 使用與應用,以及快速反覆執行的最有效且強大的方法。這種以人為本的做法也有助於讓預測模型、情境規劃、模擬及其他資料科學技術在使用時更有效、更成功。

我們將持續創新,我們的客戶也會處理現有的難題並發現新的挑戰,而商業科學最佳做法也會隨之出現。隨著組織採用及發展商業科學解決方案,我們也提供了符合我們價值的重要考量。我們認為組織必須要做到以下幾點,才能同時兼顧協作、快速反覆執行與道德使用等因素:

  • 定義並同意角色與程序
  • 確認成功協作的方法
  • 設立人員接觸點,以符合道德規範的方式使用並開發 AI 技術

 

定義並同意角色與程序

領域專家與資料科學家需要適應這個全新的自助式 AI 環境。實作商業科學解決方案時,分析師、商業使用者及資料科學團隊務必要定義及同意相關角色、需要完成的工作、需有哪些新程序才能流暢且有效率地交換資訊、每個團隊對於參與及驗證程度的期待,以及其他考量事項。就像任何新的工具或程序,商業解決方案也會有一個調整期間,用於測試最近定義的角色與程序。持續進行開放式對話,是讓所有團隊為成功做好準備的關鍵。

 

確認成功協作的方法

為了讓團隊之間持續對話,請務必設立持續通訊的方式。您可能已經有一些現有的通訊管道,不過如要在為更廣大的使用者群實作 ML 解決方案期間,將管道標準化並養成實際使用這些管道的習慣,則需要特別投入心力。定期安排機會,讓團隊成員詢問問題、諮詢、確認或誠實分享意見等,可在採用 AI 之分析技術進行跨團隊協作時獲得成功。

 

設立人員接觸點,以符合道德規範的方式使用並開發 AI 技術

技術上的偏見控制措施不僅相當實用,而且可讓更多人取得見解與預測,進而做出更明智的決策,但不應單單仰賴這種稽核方法。請特別在過程中的每個步驟中設立可讓人員審核的接觸點。分析師與商業使用者具有領域專業知識,可根據情境背景理解資料。他們可能也能預料到敏感資料未以符合道德規範的方式處理時,可能會產生的影響,不過這只有在員工背景相當多元時才有可能發生,也就是其中有人能夠指出資料中的差距或具有歧視性的使用,以及因 AI 系統有偏見而導致某些族群受到負面影響,且其中受到最大負面影響的族群未獲得充分代表時,有人能為他們發聲。機器學習技術與人員專業知識若結合所需的工具、人工審核程序、公開透明做法,及偏見監控機制,將能協助組織,讓組織以安全且符合道德規範的方式套用 AI 解決方案。

如果您發現自己的資料存有偏見,而且模型可能會造成傷害,則不應部署模型,或以自動化的方式做出任何決策。處理資料中的偏見至關重要,而且會影響多個層面。偏見不僅可能造成傷害,資料中有偏見表示資料有誤,因此可能導致模型、模型的預測及相關的決策出錯。如果貴組織無內部道德規範部門,或是在處理偏見方面有疑慮,可與第三方專家合作,讓他們協助您徹底檢驗並減少資料或模型中出現偏見的情況。第三方專家的調查可能會找出不處理偏見時的潛在後果。您的資料科學團隊可協助這些外部 AI 稽核人員與顧問執行工作。

Tableau 與 Salesforce 致力於為客戶、合作夥伴及員工提供所需工具,讓他們能夠以負責任、精準且符合道德規範的方式開發與使用 AI。歡迎閱讀 Salesforce 道德與人道使用辦公室的說明,進一步瞭解 我們對於 AI 道德規範的承諾。如要協助您的公司從資料及演算法中去除偏見,打造更符合道德規範的 AI 系統,請完成 Salesforce Trailhead 單元「 Responsible Creation of Artificial Intelligence」(以負責任的方式建立人工智慧)。

結論

市場上對於資料技能的需求有增無減,因此有很大的機會可協助使用者與組織學習,並以更有效的方式解決問題。雖然有些做法只注重開發或實作完全自動化的 AI 解決方案,但這種有限的做法很可能無法提供應有的價值。將 AI 與資料科學技術大眾化時,若認為人員原創力、情境背景意識及專業知識毫無價值,並加以去除,不僅會產生相反效果,而且相當不負責任。

Tableau 向來都相信人的潛能有強大的威力。發揮人的潛能是 Tableau DNA 的一部分,已建置在我們領先業界的視覺化分析平台中。現在,Tableau 商業科學這個全新等級的創新技術使用 AI 和 ML 來延續我們的傳統,為使用者提供合適的工具與功能,協助使用者詢問及回答問題、發掘見解並解決問題。藉由推出商業科學解決方案 Einstein Discovery in Tableau,我們為更多人安全地提供機器學習技術,並將強大的資料科學技術大眾化,協助使用者更快做出更完善的決策。

其他資源

Tableau:AI 分析技術

獲得增強分析,Tableau 商業科學及資料科學中運用 AI 技術產生的見解。這項功能直接整合在我們的頂尖自助式分析平台中。

Einstein Discovery in Tableau

我們的直覺式環境無須使用程式碼,讓任何人都能在 Tableau 中,透過透明且符合道德規範之 AI 的引導,快速、有信心地做出決策。

Einstein Discovery 技術白皮書 (Salesforce)

深入瞭解在機器學習領域中,Salesforce 的 Einstein Discovery 有哪些可創造差異化的能力與獨特功能。