內(nèi)部審計涉及眾多文本資料,包括相對方信息、相關法律法規(guī)等,在傳統(tǒng)審查相關業(yè)務的合法、合規(guī)性的過程中,需要花費大量時間搜集、查閱和整理文本資料。智慧審計則利用自然語言處理技術使繁瑣的文本處理過程智能化,使計算機自動完成文本資料處理并提示潛在風險,實現(xiàn)更高效、更智能、更標準化的內(nèi)部審計。
1.形態(tài)
語言是表達人的想法以及人與人之間交流的工具,自然語言處理(Natural Language Processing,NLP)使計算機擁有處理人類語言的能力,讓計算機能夠理解并使用人類的語言。自然語言處理的應用包羅萬象:“機器翻譯”讓世界變成真正意義上的地球村,沒有語言的屏障;“情感分析”能夠判斷出一段文字所表達觀點和態(tài)度的正負面性;“智能問答”能夠用于智能語音客服,讓機器人回答客戶提出的各種問題;“信息提取”能提取文本中包含的關鍵信息并標準化;“文本分類”可以將文檔資料進行歸類整理;“語言生成”發(fā)揮計算機理解人類語言的能力,自動生成文章摘要。德勤端腦智能自然語言處理模塊就是基于此智能技術開發(fā)的。銀行業(yè)內(nèi)審項目在配備端腦后,可以分析大量的文本并提取關鍵信息、實現(xiàn)系統(tǒng)化檢索風險點、進一步地實現(xiàn)高效智慧審計。
2.招式
隨著銀行業(yè)的迅猛發(fā)展,銀行積累了海量結構化和非結構化數(shù)據(jù),這為內(nèi)審工作帶來了巨大的挑戰(zhàn),尤其對于需要人工查閱的非結構化數(shù)據(jù),例如合同、內(nèi)部公文制度以及人行和銀監(jiān)會發(fā)文等。在海量、復雜非結構數(shù)據(jù)背景下,傳統(tǒng)的審查方式意味著大量的人工查閱工作,效率低下。同時,傳統(tǒng)內(nèi)審形式還存在一定的局限性,一是存在盲區(qū),例如人工審查過程中存在知識局限及漏判誤判等人為差錯,二是人工無法做到對全量信息進行查閱。
針對傳統(tǒng)審查方式的短板,德勤智慧審計利用端腦智能自然語言處理模塊提出了解決方案。應用此模塊后的智慧審計可以處理海量的非結構文本數(shù)據(jù),提高了處理多數(shù)據(jù)源的審查分析能力,端腦智能自然語言處理模塊在內(nèi)審過程中,可以替代人工做繁雜的文本閱讀和重要信息提取等工作。由計算機替代人工后,可以實現(xiàn)對相關材料的全量核查。更進一步的,端腦智能自然語言處理模塊借助強大的機器學習、深度學習算法通過模型訓練,可以實現(xiàn)風險點的自動識別。自然語言處理技術在銀行業(yè)智慧審計中具有深遠意義,端腦智能自然語言處理模塊將發(fā)揮極大的價值。
3.實戰(zhàn)
在某銀行的內(nèi)審實踐中,首先利用RPA監(jiān)控監(jiān)管機構發(fā)文,RPA技術定期檢索并采集各監(jiān)管機構的最新發(fā)文,例如中國人民銀行辦公廳發(fā)文《關于加強小額支付系統(tǒng)集中代收付業(yè)務管理有關事項的通知》、《中國人民銀行關于加強支付結算管理防范電信網(wǎng)絡新型違法犯罪有關事項的通知》等。RPA將節(jié)省人工檢索耗時,同時可以避免漏檢、更新不及時等現(xiàn)象。
接下來NLP歸類整理文本資料、挖掘?qū)彶橐c,NLP對于最新發(fā)文應用自動摘要算法拆分文本、提取核心內(nèi)容,形成包含標題及核心內(nèi)容簡練報告,實現(xiàn)文檔歸類。這一過程為審閱人員做了初步整理工作,簡化了大量而繁復的閱讀過程,可以讓審閱人員快速抓住重點,工作效率得到顯著提高。我們以代收付業(yè)務管理發(fā)文為例,這一過程將首先利用NLP得到發(fā)文第一條中主要內(nèi)容:
經(jīng)過以上步驟,已經(jīng)實現(xiàn)自動化更新發(fā)文、自動化歸納審核要點,再經(jīng)過人工干預整理出審查要點,為進一步NLP智能判別做準備。最后,在NLP智能判別中,我們以代收付業(yè)務管理發(fā)文第一條規(guī)定為例,目標是審查小額支付系統(tǒng)的集中代收付業(yè)務是否符合監(jiān)管要求(僅用于公用事業(yè)類和公益類機構),具體過程及結果如下:
在上述NLP智能判別實例中,第一步為內(nèi)部信息提取,利用NLP可以自動批量的提取合同文檔中的所需文本內(nèi)容,得到合同相對方基本信息,包括名稱和協(xié)議合作內(nèi)容;第二步為外部信息提取,利用爬蟲及NLP技術得到結構化文檔,包括相對方對應的工商許可經(jīng)營范圍;第三步為利用語言模型算法來對上兩步得到的初步數(shù)據(jù)進行模型判斷,得到所審查合同對應條款的簽訂是否符合相關規(guī)定,抓取出高風險合同。
融入了自然語言處理的智慧審計實現(xiàn)了內(nèi)審過程的系統(tǒng)化、擴大了內(nèi)審的范圍,同時也極大地提高了內(nèi)審效率。案例中涉及包括大量合同、法律法規(guī)、相對方信息等非結構化文本材料,不同于傳統(tǒng)內(nèi)審中的抽樣,利用自然語言處理技術可以自動化處理非結構文本信息,系統(tǒng)化、自動化地檢索整理審查要點,使內(nèi)審人員從繁重的大量閱讀、審閱工作中解放出來。同時,利用語言模型可以識別出不符合目標條款、發(fā)文的高風險案例,為內(nèi)審人員進行初步篩查,使他們可以集中關注高風險案例并進行深入跟蹤,實現(xiàn)高效率的內(nèi)審工作。端腦智能自然語言處理模塊技術,為銀行業(yè)在多數(shù)據(jù)源結構的內(nèi)審工作上提供了高度支持。