Apoidea 用 AI 分析金融文件 撼贏印度外判商取得合約

金融機構每日處理大量文件,花耗不少人力資源用於這項枯燥而重要的工作。 Apoidea 聯合創辦人鄭其森指出,創業目的通過深度學習模型,將格式千變萬化的文件訊息化,協助企業自動化工作。從創業之初便用上 AWS 基建服務,方可應付金融機構嚴謹需求。

Apoidea 在 2017 年創立,鄭其森形容,公司一直研發的技術是用人工智能從文件提取資訊。他提到,技術有別於存在 30 年的 OCR 識別,只能根據預設格式去讀取文件內容。該公司通過深度學習、 NLP 等技術,可以讓系統懂得從不同格式的文件取得相關資訊。

目前 Apoidea 為全球逾 30 間金融機構提供文件訊息化服務。他以銀行處理企業開戶程序為例,需要提文銀行帳戶作證明,後勤部門花大量時間輸入。通過該公司的技術,僅用 10 秒完成,銀行員工只需核對結果。「基本上現時所建立的人工智能模型可讀取所有銀行的帳戶文件和財務報表。」

逾 20 個 AI 模型

要達至這成果,鄭其森透露,背後由超過 20 個深度學習模型支援。主要分電腦視覺和自然語言處理( NLP )。電腦視覺模型負責辦識,如文件上的內容轉為電腦可讀的文字,甚至修復紙張皺摺和模糊、扭正,閱讀文件內的表和欄,再配對鍵和數值。 NLP 模型負責閱讀內容,判斷相關文字所屬的主題。

從開發、訓練和套用人工智能模型,均需要大量運算資源,該公司自創立以來,便決定選用 AWS 的基建架構,從未自行採購硬件。鄭其森指出,現時運用 AWS 上 EKS 的Kubernetes 管理,做到零調度( scale-to-zero ),真正使用運算資源才啟動。而且能隨時大量啟動運算,他指出,曾有客戶要求數分鐘內分析 400 頁文件,以每部伺服器用 10 秒閱讀一頁紙計,同時開動數十部伺服器運作,去完成這工作。

隨著 AWS 啟用香港可用區域, Apoidea 在這兩年陸續贏得大型銀行客戶,亦由 AWS 提供支援,派出銷售團隊一同給客戶解釋,所建的數據中心具備安全標準符合法規要求。

不過, AWS 近年積極發展的 SageMaker 服務, Apoidea 卻未有選用。鄭其森稱,創業初期由零建立的模型,內部已有管理制度。 AWS 具備 GPU 的執行個體提供穩定和安全的數據中心已足夠。

30 間金融機構客戶

現時該公司服務超過 30 間金融機構。在過去一年,該公司獲得多個海外銀行客戶,其中瑞士一間金融機構,需要處理大量地址文件,過去都外判予印度的低成本服務商給人手核對。鄭其森表示,由人工智能運作,除了提高效率,準確率亦是銀行的考慮,長遠而言人工智能出錯機會比人手更低。

除了分析金融文件,該公司下一步將與律師樓和零商合作,前者分析半標準化文件,後者則分析單據。鄭其森形容更具挑戰,單據格式變化更大,目標仍是將非結構數據結構化。

Scroll to Top