SAS 在今年的年度大會 SAS Innovate 2024 發表 Data Maker,給企業生成數據用作訓練專門的 AI 模型。為加強技術,SAS 最新收購英國合成數據公司 Hazy 的核心軟件資產,讓企業客戶安全高效地產生難以大量搜集的數據。
數據是推動 AI 的重要資源,不過往往涉及私隱等因素,令企業無法取得大量真實數據去訓練 AI 模型,尤其醫療保健及金融等受到嚴格隱私規管的行業。隨著數據需求日增,業界開發合成數據技術,僅用小量數據模擬真實數據的統計模式,而又不帶有可識別資訊,產生大量同類數據去訓練。近年更由生成式 AI 幫助,準確模擬真實數據。
合成數據為企業帶來的競爭優勢:
運用合成數據集尋找創新機會
加快產品推出市場的時間
可信的 AI 系統
提升數據私隱和安全
降低成本
SAS 收購英國公司 Hazy 的軟件資產,將會整合至 SAS Viya 平台的 Data Maker,加強方案的合成數據能力,預計 2025 年初發表初步預覽。
SAS 技術總監 Bryan Harris 引用數據分析員預測,在 2026 年前將有 75% 的企業會使用生成式 AI 來建立合成客戶數據,而 2023 年則只有不足 5%。引入合成數據讓企業客戶能夠解決數據問題,利用以往因可用性、存取限制或數據質素等而無法觸及的數據資源。
面對自殺率高企的嚴峻挑戰,社會急需採取積極而有效的應對措施。事實上,不少國家正利用人工智能( AI )及數據分析技術,以搜集並分析大量數據,提前識別高自殺風險人士,做到防患未然,值得香港學習和借鑒。
有效及早發現具自殺傾向患者
與傳統預防自殺的措施相比,人工智能更能有效識別出潛在的危機和風險,及早發現具自殺傾向的患者,從而提供適時的援助。為有效緩解當地自殺比率,澳洲心理研究機構 Black Dog Institute 與 SAS 合作,於旗下 The Life Span 系統利用 AI 及數據分析技術整合、重整並分析來自不同來源的大量數據,以更準確地推斷可能發生自殺個案的時間及地點,有助防止達 21% 的自殺死亡個案及 30% 的自殺傾向個案。
然而,僅憑提早識別恐怕只是治標不治本,若要有效遏止自殺率升勢,應從改善現有醫療體系入手,加強精神疾病患者支援並提升成效。惟根據醫管局數據顯示,本港公立醫院精神科醫患比例高達 1:761 ,當務之急定是增加相關醫護人員及配套,輔以 AI 及數據分析等先進技術,進一步優化醫療流程及資源分配,緩解精神疾病醫療資源嚴重失衡的困境。
以加拿大癖癮及精神健康中心( The Centre for Addiction and Mental Health )為例,中心使用數據分析平台預測求診者數量、未來床位及人手需求,並透過分辨患者等級,讓醫護人員按照分析結果進行資源分配,有助優化整體的醫療流程。此外,有關技術亦可為醫療團隊仔細分析病人病歷及曾經服用的藥物,制定合適的治療方案,並同時監測患者臨床心理狀況,了解其情緒狀態和需求,以提供相應的治療建議及援助。中心亦正研究 AI 、遙距醫療及基因組數據分析等技術的應用,冀進一步提升精神疾病治療品質。
誠然,應對香港自殺率飆升的危機需社會各界多方面的努力,透過善用 AI 及數據分析等先進科技,確實可事半功倍,不但能用作預防及識別高自殺風險人士的有效工具,更有助快速部署及作出最明智的精神病臨床決策,加強醫患支援以提升治療效率,化解逆境成就希望,有效阻止香港自殺風氣蔓延。
外國企業使用 AI 技術,同時還關注安全和信任的問題。西方國家正在推動設立守則、規則等,讓業界安全地使用 AI。SAS 將在 AI 平台 Viya 內推出模型咭(Model Card),由模型數據自動建立標籤,以識別 AI 模型的「成份」。SAS 又推出 AI 管治顧問服務和可任 AI 生命周期工作流程,幫助企業客戶引入美國國家暨技術研究院(NIST)所定的 AI 風險管理框架。
SAS 數據倫理副總裁 Reggie Townsend 指出,有企業擔憂 AI 的安全風險,導致未敢使用。無論是 AI 或生成式 AI,已證明在業務流程中有效發揮作用。所有創新技術有正面效益,但同時都帶來風險,如電力推動各設備而又造成電擊,汽車載人載貨,卻會引起交通意外。「已經廣泛使用的產品,不能一刀切禁止,而又不提供代替方案。只要認清技術的本質,用行業標準規管,能讓企業放心使用 AI。」
SAS 將在今年稍後推出模型咭,通過自動標籤數據內容成份,以及開發人員標示模型的用途,給企業用戶透視 AI 模型。Townsend 表示,模型咭有如食物的營養標籤,將內容成份逐一標示,包括準確度、公平度和模型飄移(model drift)等指標。尤其當模型經使用日久或有機會出現飄移現象,透過從監察數據反映的指標能揭示情況,及時制止不正常表現。
美國商務部在 2020 年成立國家人工智能顧問委員會(NAIAC),Townsend 是成員之一,為國家的 AI 發展出謀獻計。商務部旗下的 NIST 去年根據 NAIAC 的建議,發表 AI 風險管理框架(AI Risk Management Framework,AI RMF)。SAS 按此推出可信任 AI 生命周期工作流程,協助企業將 AI RMF 引入開發和管理業務流程,包括指明每個參與者的功能、工作期望、收集文件、羅列考慮因素。最終製成生產環境運作的模型,連同說明文件顯示企業盡職確保模型屬公平、使用時不會造成傷害。
這套工作流程還會記錄企業考慮 AI 系統對社會的影響過程,如有步驟確保訓練數據足夠廣泛代表不同受眾,亦可建立人機互動(human-in-the-loop)機制,檢視 AI 模型的準確度,在必要時作出更正。
SAS 還設立 AI 管治顧問服務(AI Governance Advisory),為企業客戶的增值服務,按其需求提供建議,為數據和 AI 模型找出可信和負責任的使用模式。
Townsend 指出,各界正在為 AI 安全和任信採取行動,在使用技術的同時,盡快有效管理所帶來的風險。至於是否需要加強監管,他則認為按最佳實踐守則或是目前可行的出路。NIST 的 AI 風險管理框架正是建議守則,各行業按此發展出相應的準則,如金融服務業需要更嚴謹的措施規管使用 AI,而製造業亦有其他的要求,但絕不能一刀切定下法規或標準,以免阻礙 AI 技術及相關管治的發展。
SAS 多年來以數據分析見稱,近年將軟件整合至 Viya,從專屬平台走向現代化的雲端基建。其中 AI 模型開發工具 Viya Workbench,將會同時支援 SAS 及 Python 程式碼,代表該公司走向支援開源模型。Viya 同時支援量子電腦,把複雜的 AI 模型用量子運算快速找出最佳化。
在去年 9 月 SAS Explore 披露的 Viya Workbench,在今年 SAS Innovate 正式發表,由創辦人兼行政總裁 Jim Goodnight 示範。Viya Workbench 代管程式碼,也管理運算基建,在介面上直接選擇所需要的虛擬機器,如 vCUP 核心及記憶體容量,便可啟動執行 AI 模型。
SAS 即將推出預制 AI 模型,讓企業客戶毋須自行建立而能夠快速可用。這些預制 AI 模型將有不同行業,如金融、醫療保健、製造業、政府機構等。該公司技術總監 Bryan Harris 認為,這產品連同 Viya 方案不斷擴充功能,SAS 將在 2025 年迎接客戶高速爆發期。
企業使用 AI 最大的挑戰是先要建立模型,亦是最花資源、時間的過程。Harris 稱,尤其現時缺乏 AI 專家,企業更難組成數據科學團隊開發 AI 模型。 SAS 用過去 50 年為不同行業客戶建立 AI 模型的經驗,歸納出行業的需要,在 Viya 架構上推出相應預制模型,協助加快採用 AI 的進度。
根據 SAS AI 及進階分析副總裁 Udo Sglavo 的介鉊,預制 AI 模型將為輕量級行業專用,目前預計有識別付款欺詐、社會福利詐騙、擷取文件內容、 AI 輔助等模型。這些模型配合企業業務流程便能即時使用,加快獲得實際利益及可靠結果。
以擷取文件內容為例,實際上有標準程序,包括輸入文件、 ORC 讀取文字、文件歸檔、擷取重要數據、整理內容、分析情景、匯入至結構數據。當企業採用這開箱即用模型,只需作簡單修改符合業務需要便能迅速弔入 AI 技術。
Harris 又指,這些模型未必是現時大行其道的 LLM,需要視乎實際功能而定,如金融業的付款欺詐便不必涉及 LLM。 AI 輔助則有 LLM 協助,其中將推出的優化倉庫空間便有 AI 輔助,既有倉庫空間管理的 AI 模型,也加入 LLM 作語言介面,讓非技術用戶能加入工作流程之內,協助規劃決策。「LLM 實際上只佔 AI 生產部署和決策模型的一小部分,甚至預制 AI 模型有望超越 LLM,為不同行業加快採用 AI 過程。」
他補充,這產品是 SAS 在去年 5 月承諾投放 10 億美元發展 AI 驅動行業解決方案的一部分。SAS Innovate 公布的新方案,無論是生成式 AI 策略或預制 AI 模型,目標都是為企業建立真實可用的 AI 方案,尤其後者讓企業開箱即用,直接見到 AI 技術的市場價值。企業受惠的同時,也推動 SAS 業務進一步發展,預期明年將進入高速增長時期。
生成式 AI 已是業界必備技術,企業有意按步驟安全地引入。 SAS 在今年的年度大會發表多項在 Viya 內的生成式 AI 新產品,包括 GenAI 編排能力、 Copilot 個人助理、生成高品數據的 Data Maker,也在營銷科技方案 Customer Intelligence 360 加入 GenAI 功能。
SAS 在美國拉斯維加斯舉辦 SAS Innovate 2024 大會, 技術總監 Bryan Harris 在主題演講上指出,生成式 AI 實是業界處理數據的自然發展,讓 AI 開發人員更容易完成工作。他表示,由以往分散式基建架構 Hadoop,到好幾年前興起的 NoSQL,都有一定技術門檻,現在的生成式 AI 能夠透過自然語言發出指令,大部分工作由 AI 代勞。 SAS 將生成式 AI 開發成方案,在 Viya 上開箱即用,以合適的提示詞為用戶生成內容。
Harris 近年為 SAS 改革產品線,整合為數據和 AI 平台 Viya,推動工作效率、分析效能和可信性。他稱,將生成式 AI 加入 Viya 並在受監管的環境運行,幫助開發人員更快速地完成 AI 模型,促使員工更有效率工作。
SAS AI 和 GenAI 全球產品策略主管 Marinela Profi 表示,SAS 的生成式 AI 策略幫助企業引入實際用途,直接在現有的業務流程上解決問題。以 GenAI 編排能力為例, LLM 本身不能解決業務問題,配合業務流程和知識則發揮強大能力,惟目前在企業的用途未夠廣泛,部分用途甚至只有對話功能。Viya 的 GenAI 編排能力具價值在於達成業務流程自動化。LLM 協助處理企業的投訴,能增加 20% 處理量,減少 40% 回應時間,也減少 15% 處理成本。
Data Maker 能解決業界不足夠數據訓練模型的問題。 Profi 稱,企業開發生成式 AI 和機械學習模型需要大量難題,而且不涉及私隱等敏感資料。如銀行偵測詐騙交易,要有可疑資料亦要有正常數據供訓練模型,開發人員提供少量數據作參考,Data Maker 會由 LLM 支援生成大量數據,過程一直跟原始數據比較分佈及提供品質評分(qualtiy score),以供監察數據的質素,所生產的數據會輸出成 CSV 檔案,可直接用於分析。
與傳統訓練模式相比,教練團隊利用人工智能、數據分析及機械學習等技術收集訓練數據,可更有效識別運動員的長短之處,以定制專屬訓練方案,並向選手指出需改進的領域,發揮自身最大潛力。法國欖球聯盟( Fédération Française de Rugby,FRR )及葡萄牙里斯本與賓菲加體育會( Sport Lisboa e Benfica,SLB )均採用 SAS 的數據分析方案,收集球員數據來提升球隊整體表現,根據分析平台提供的數據評估訓練成效,於賽前準備時作出相應調整。此外,平台可就過往對手比賽數據進行迅速且精準的分析,研究隊伍及對手的比賽特徵,有助靈活調整應對戰術,爭取更好的成績。同時,教練亦可以透過實時接收訓練員 GPS 及生理數據進行球員健康管理,不但能更快洞悉傷患成因,亦有助制定有效預防受傷的措施。
SAS 早前公布投資 10 億美元研發各行業的 AI 技術,其中包括今年大熱的生成式 AI 。 SAS 早前在港辦客戶會議 SAS Innovate ,其間行政副總裁兼技術總監 Bryan Harris 展示 SAS Viya 的生成式 AI 功能。SAS 行政副總裁兼市場營銷總監 Jennifer Chase 還指出,生成式 AI 為新型營銷科技,幫助營銷人員快速找到目標客戶分類並作個人化營銷。
Bryan Harris 展示 SAS Viya 的生成式 AI ,以自然語言對話方式查問公司數據,例如設定今年銷售增長一成,要推動盈利同樣增一成,問 Viya 有何對策。 Viya 能從相關的數據倉庫中找出銷售數據來源,並建議分析過去三年的情況,預測今年餘下時間的銷售和盈利; 繼而再找出異常情況影響銷售的數據,如天氣、季節等因素,建議除去再作分析。
Harris 指出,企業用的生成 AI 技術必須可靠、源自內部數據,絕不能經通用的大型語言模型(LLM)生成文件內容。 SAS 正在與業界的 LLM 合作開發技術,採用企業內部數據調整模型,以安全準確地生成所需的內容,如程式碼、分析流程,以至市場營銷文案等。
然而,當生成式 AI 愈來愈成熟,營銷人員能夠用自然言語處理數據,變相減少複雜的數據分析技能。 Chase 則認為,營銷是結合左腦和右腦的思維,即分析及創意兼備, ChatGPT 類的生成式 AI 只是幫助營銷人員加快數據分析,他們還是需要相關技能,更要熟練地運用方可建立創意的營銷宣傳。她又透露,下月在美國拉斯維加斯舉行的 SAS Explorer 將正式發表平台上的生成式 AI 技術。
現時,已有不少領先企業採用全託管服務( Hosted Managed Services 或 HMS ),透過雲端平台部署全面的數據分析解決方案及工具,加速數碼轉型,利用數據驅動業務決策,同時符合瞬息萬變的合規要求,靈活應對市場需求及變化,為業務帶來更高的營運效率及競爭力,把握商機。
有別於現時的 IaaS (基建即服務)或 SaaS (軟件即服務),當前最炙手可熱的全託管服務( HMS )能結合兩者的自由度、個性化及高託管性優勢,為企業提供更全面及合乎成本效益的解決方案。事實上,HMS 已發展成熟,能整合軟、硬件,提供設計管理、事件管理、網絡監控、系統問題管理、軟件升級、效能管理在內的軟硬件端對端全託管,大幅刪減客戶開發分析模型的時間和人力資源。
HMS 亦能透過自動監控模型效能或企業使用者設定,自動重新訓練模型或重新部署,確保分析模型的決策準確性。領先的數據分析供應商更能提供高品質的專業服務,例如明確承諾提供 99% 服務水準( SLA )的完整解決方案( Total Solution )、採用單一服務渠道,提供軟、硬件端對端全託管服務、 24/7 全年無休支援等,妥善地配合銀行與金融服務業的特性與需求。以 SAS 提供的 HMS 為例,當中有專職技術經理 TAM ( Technical Account Managers )專責統一處理用戶問題,透過直接匯合 SAS 各部門的資源,包括 IT 專家、顧問團隊與數據專才等,能快速及全面地解決疑難。
市場成功部署 HMS 的例子不勝枚舉。北歐一間知名銀行目標利用 SAS 的 HMS 解決方案改善消費金融貸款業務的批核流程、進行資料管理,以及建立分析與決策程序等,結果於短短一個半月內即完成構建合規雲端分析環境,並於六個月內整合現有系統,完成雲端轉移及改善整體 AI 分析效能。在亞太地區,目前亦已有跨國銀行以香港作為試點部署 HMS ,以便有效分配資源,從而更集中業務拓展、風險管理以及客戶體驗上。
國際資訊科技研究及顧問 Gartner 亦指出,至 2024 年,金融業將 AI 相關工作外判的比例會由 6% 提升 40% 。隨著日新月異的市場及科技發展,銀行及金融機構必須掌握技術趨勢,加快數碼轉型,將金融數據 AI 分析轉移至雲端,善用外判專家,同時確保合規與法例遵循程序的時效優勢,才能有效將營運成本降低,更集中於業務核心,以提升業務價值,在新時代市場中突圍而出。