-
度小滿金融NLP技術榮登微軟MS MARCO 比賽榜首
2021/3/20 11:30:59 來源:財訊網 【字體:大 中 小】【收藏本頁】【打印】【關閉】
核心提示:近日,度小滿金融科技的AI-NLP團隊在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking(文檔排序)任務中刷新記錄近日,度小滿金融科技的AI-NLP團隊在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking(文檔排序)任務中刷新記錄,超越了三星、微軟、谷歌、斯坦福、清華大學等一眾參賽者,榮登榜首(截至2021年3月12日)。MS MARCO挑戰賽。它是自然語言處理NLP領域的權威比賽,基于微軟構建的大規模英文閱讀理數據集 MARCO,需要參賽者為用戶輸入的問題找尋到最貼切、最需要的答案,并對答案進行排序。
度小滿金融NLP團隊首次提出了DML文本排序算法
MARCO數據集采用的是來自搜索引擎 BING 的用戶真實搜索行為和點擊日志,最大程度地模擬和還原了用戶使用搜索引擎的真實場景,因此數據標注并不完全,這會直接影響模型的性能表現;而且MARCO數據集規模非常大,需要機器對多篇文檔進行綜合理解才能判斷出答案。不過,令人沒有想到的是度小滿金融NLP團隊提交的模型,不僅以0.416的eval分數大幅領先其他團隊,還在第一名的位置維持了一個多月的時間。
據悉,度小滿金融NLP團隊首次提出了DML文本排序算法,通過自主研發的自適應預訓練語言模型對query(用戶搜索的真實問題)和document文本進行深度理解,利用了數十萬數據來訓練模型,經過召回、重排等多個階段,給出最終排序。
度小滿金融NLP技術為小微企業發展帶來曙光
在近幾年的政府工作報告中,多次提及要“幫助小微企業降低綜合融資成本”。而通過公開數據我們發現,度小滿金融針對小微企業主的年化貸款利率僅有3.65%。而全國銀行業新發放普惠性小微貸款的利率平均達到5.93%(2020年數據)。2020年,度小滿金融累積為小微企業主提供了3000億元的無抵押信用貸款,人均放款額同比增加35%。
度小滿金融在MS MARCO比賽中所運用到的數據挖掘、閱讀理解等NLP技術,就已經在度小滿金融的小微風控模型中投入了實際應用,通過對企業公章、征信報告等非結構化信息進行深度挖掘和理解,為風控模型提供了更豐富的特征和數據維度,從而可以更高效精準地識別風險因素,提升小微企業的融資效率,幫助其抵御黑產侵害。
在度小滿的努力中,自然語言的奧秘被拆解,化成千行百業的智能化升級契機,小微企業可以在復雜變幻的商業環境中更快速地獲得支持、尋覓新機。這或許可以回答很多人的疑問:為什么企業要跟學術機構一起在頂級賽事上同臺競技?
答案就在于,每一次技術領域的點滴突破,都有可能改變一些行業的既有規則,化不可能為可能,助力更多小微企業飛向更光明的未來。
- 上一篇:廈門國際銀行淬煉金融硬核力量支持千企萬家
- 下一篇:星期天,紅茶森林約嗎