SAS 在今年的年度大會 SAS Innovate 2024 發表 Data Maker,給企業生成數據用作訓練專門的 AI 模型。為加強技術,SAS 最新收購英國合成數據公司 Hazy 的核心軟件資產,讓企業客戶安全高效地產生難以大量搜集的數據。
數據是推動 AI 的重要資源,不過往往涉及私隱等因素,令企業無法取得大量真實數據去訓練 AI 模型,尤其醫療保健及金融等受到嚴格隱私規管的行業。隨著數據需求日增,業界開發合成數據技術,僅用小量數據模擬真實數據的統計模式,而又不帶有可識別資訊,產生大量同類數據去訓練。近年更由生成式 AI 幫助,準確模擬真實數據。
合成數據為企業帶來的競爭優勢:
運用合成數據集尋找創新機會
加快產品推出市場的時間
可信的 AI 系統
提升數據私隱和安全
降低成本
SAS 收購英國公司 Hazy 的軟件資產,將會整合至 SAS Viya 平台的 Data Maker,加強方案的合成數據能力,預計 2025 年初發表初步預覽。
SAS 技術總監 Bryan Harris 引用數據分析員預測,在 2026 年前將有 75% 的企業會使用生成式 AI 來建立合成客戶數據,而 2023 年則只有不足 5%。引入合成數據讓企業客戶能夠解決數據問題,利用以往因可用性、存取限制或數據質素等而無法觸及的數據資源。
SAS 多年來以數據分析見稱,近年將軟件整合至 Viya,從專屬平台走向現代化的雲端基建。其中 AI 模型開發工具 Viya Workbench,將會同時支援 SAS 及 Python 程式碼,代表該公司走向支援開源模型。Viya 同時支援量子電腦,把複雜的 AI 模型用量子運算快速找出最佳化。
在去年 9 月 SAS Explore 披露的 Viya Workbench,在今年 SAS Innovate 正式發表,由創辦人兼行政總裁 Jim Goodnight 示範。Viya Workbench 代管程式碼,也管理運算基建,在介面上直接選擇所需要的虛擬機器,如 vCUP 核心及記憶體容量,便可啟動執行 AI 模型。
SAS 即將推出預制 AI 模型,讓企業客戶毋須自行建立而能夠快速可用。這些預制 AI 模型將有不同行業,如金融、醫療保健、製造業、政府機構等。該公司技術總監 Bryan Harris 認為,這產品連同 Viya 方案不斷擴充功能,SAS 將在 2025 年迎接客戶高速爆發期。
企業使用 AI 最大的挑戰是先要建立模型,亦是最花資源、時間的過程。Harris 稱,尤其現時缺乏 AI 專家,企業更難組成數據科學團隊開發 AI 模型。 SAS 用過去 50 年為不同行業客戶建立 AI 模型的經驗,歸納出行業的需要,在 Viya 架構上推出相應預制模型,協助加快採用 AI 的進度。
根據 SAS AI 及進階分析副總裁 Udo Sglavo 的介鉊,預制 AI 模型將為輕量級行業專用,目前預計有識別付款欺詐、社會福利詐騙、擷取文件內容、 AI 輔助等模型。這些模型配合企業業務流程便能即時使用,加快獲得實際利益及可靠結果。
以擷取文件內容為例,實際上有標準程序,包括輸入文件、 ORC 讀取文字、文件歸檔、擷取重要數據、整理內容、分析情景、匯入至結構數據。當企業採用這開箱即用模型,只需作簡單修改符合業務需要便能迅速弔入 AI 技術。
Harris 又指,這些模型未必是現時大行其道的 LLM,需要視乎實際功能而定,如金融業的付款欺詐便不必涉及 LLM。 AI 輔助則有 LLM 協助,其中將推出的優化倉庫空間便有 AI 輔助,既有倉庫空間管理的 AI 模型,也加入 LLM 作語言介面,讓非技術用戶能加入工作流程之內,協助規劃決策。「LLM 實際上只佔 AI 生產部署和決策模型的一小部分,甚至預制 AI 模型有望超越 LLM,為不同行業加快採用 AI 過程。」
他補充,這產品是 SAS 在去年 5 月承諾投放 10 億美元發展 AI 驅動行業解決方案的一部分。SAS Innovate 公布的新方案,無論是生成式 AI 策略或預制 AI 模型,目標都是為企業建立真實可用的 AI 方案,尤其後者讓企業開箱即用,直接見到 AI 技術的市場價值。企業受惠的同時,也推動 SAS 業務進一步發展,預期明年將進入高速增長時期。
生成式 AI 已是業界必備技術,企業有意按步驟安全地引入。 SAS 在今年的年度大會發表多項在 Viya 內的生成式 AI 新產品,包括 GenAI 編排能力、 Copilot 個人助理、生成高品數據的 Data Maker,也在營銷科技方案 Customer Intelligence 360 加入 GenAI 功能。
SAS 在美國拉斯維加斯舉辦 SAS Innovate 2024 大會, 技術總監 Bryan Harris 在主題演講上指出,生成式 AI 實是業界處理數據的自然發展,讓 AI 開發人員更容易完成工作。他表示,由以往分散式基建架構 Hadoop,到好幾年前興起的 NoSQL,都有一定技術門檻,現在的生成式 AI 能夠透過自然語言發出指令,大部分工作由 AI 代勞。 SAS 將生成式 AI 開發成方案,在 Viya 上開箱即用,以合適的提示詞為用戶生成內容。
Harris 近年為 SAS 改革產品線,整合為數據和 AI 平台 Viya,推動工作效率、分析效能和可信性。他稱,將生成式 AI 加入 Viya 並在受監管的環境運行,幫助開發人員更快速地完成 AI 模型,促使員工更有效率工作。
SAS AI 和 GenAI 全球產品策略主管 Marinela Profi 表示,SAS 的生成式 AI 策略幫助企業引入實際用途,直接在現有的業務流程上解決問題。以 GenAI 編排能力為例, LLM 本身不能解決業務問題,配合業務流程和知識則發揮強大能力,惟目前在企業的用途未夠廣泛,部分用途甚至只有對話功能。Viya 的 GenAI 編排能力具價值在於達成業務流程自動化。LLM 協助處理企業的投訴,能增加 20% 處理量,減少 40% 回應時間,也減少 15% 處理成本。
Data Maker 能解決業界不足夠數據訓練模型的問題。 Profi 稱,企業開發生成式 AI 和機械學習模型需要大量難題,而且不涉及私隱等敏感資料。如銀行偵測詐騙交易,要有可疑資料亦要有正常數據供訓練模型,開發人員提供少量數據作參考,Data Maker 會由 LLM 支援生成大量數據,過程一直跟原始數據比較分佈及提供品質評分(qualtiy score),以供監察數據的質素,所生產的數據會輸出成 CSV 檔案,可直接用於分析。
SAS 早前公布投資 10 億美元研發各行業的 AI 技術,其中包括今年大熱的生成式 AI 。 SAS 早前在港辦客戶會議 SAS Innovate ,其間行政副總裁兼技術總監 Bryan Harris 展示 SAS Viya 的生成式 AI 功能。SAS 行政副總裁兼市場營銷總監 Jennifer Chase 還指出,生成式 AI 為新型營銷科技,幫助營銷人員快速找到目標客戶分類並作個人化營銷。
Bryan Harris 展示 SAS Viya 的生成式 AI ,以自然語言對話方式查問公司數據,例如設定今年銷售增長一成,要推動盈利同樣增一成,問 Viya 有何對策。 Viya 能從相關的數據倉庫中找出銷售數據來源,並建議分析過去三年的情況,預測今年餘下時間的銷售和盈利; 繼而再找出異常情況影響銷售的數據,如天氣、季節等因素,建議除去再作分析。
Harris 指出,企業用的生成 AI 技術必須可靠、源自內部數據,絕不能經通用的大型語言模型(LLM)生成文件內容。 SAS 正在與業界的 LLM 合作開發技術,採用企業內部數據調整模型,以安全準確地生成所需的內容,如程式碼、分析流程,以至市場營銷文案等。
然而,當生成式 AI 愈來愈成熟,營銷人員能夠用自然言語處理數據,變相減少複雜的數據分析技能。 Chase 則認為,營銷是結合左腦和右腦的思維,即分析及創意兼備, ChatGPT 類的生成式 AI 只是幫助營銷人員加快數據分析,他們還是需要相關技能,更要熟練地運用方可建立創意的營銷宣傳。她又透露,下月在美國拉斯維加斯舉行的 SAS Explorer 將正式發表平台上的生成式 AI 技術。
大部分數據分析平台已從內部部署 (On-premises) 模式擴展至雲端,SAS 旗下 Viya 分析平台也正式登陸 Microsoft Azure Marketplace,以公共雲方式供服務,即買即用,並按小時收費,為企業提供使用彈性。
SAS 人工智能及分析平台總監 Alice McClure 表示,在 Microsoft Azure 上的 Viya 屬全功能版本,包括:SAS Visual Analytics 、 SAS Visual Statistics 、 SAS Visual Data Mining and Machine Learning 及 SAS Model Manager,方便全球用戶能夠進行數據探索、機械學習和模型部署分析,平台時同時多種翻譯語言,讓用戶以熟識的語言處理數據。
SAS Viya 本身是雲端原生的人工智能、數據分析及管理平台,於單一可視介面同時提供編程、低程式碼或無程式碼選項,讓不同技術水平的用戶能使用人工智能技術。平台同時支援 SAS 及開放源碼,包括 Python 及 R ,數據科學家可選擇個人偏好的語言及技術進行編碼。
雙方在 SAS Global Forum 2020 上公布消息,會議原定 3 月底在美國華盛頓特區舉行,因為疫情爆發,延至 6 月改在網上舉行。
雙方去年開始合作,今年則進一步加強關係,SAS 的人工智能和數據分析技術與 Azure 整合,而微軟的 Dynamic 365、Mircosoft 365 及 Power Platform 等服務又可整合 SAS 方案,推動人工智能及數據分析普及化。微軟亦將為客戶提供 SAS 雲端行業解決方案。
SAS 亦將新推出的雲端原生產品 Viya 和其他詐騙、風險到零售等專業行業解決方案,在 Azure Marketplace 銷售,方便企業支援雲端基建。
微軟與 SAS 將探討更多在 Azure 及 Dynamics 365 中整合 SAS 數據分析功能的可能性,包括針對特定行業的模型,建立適合不同行業採用的市場就緒聯合解決方案,並提供原生整合 SAS 服務。例如,透過結合 Azure 物聯網平台,以及 SAS 從邊緣網絡到雲端的物聯網數據分析及人工智能功能,向企業提供解決方案,協助掌握物聯網數據的價值。