Menu
快讀
  • 旅遊
  • 生活
    • 美食
    • 寵物
    • 養生
    • 親子
  • 娛樂
    • 動漫
  • 時尚
  • 社會
  • 探索
  • 故事
  • 科技
  • 軍事
  • 国际
快讀

中文NL2SQL准確率超92% 産學研攜手推動智能交互發展

2022 年 8 月 16 日 用户浪里小神龙

10月12日,由追一科技主辦、南京大學計算機軟件新技術國家重點實驗室協辦的“首屆中文NL2SQL挑戰賽”總決賽答辯暨頒獎典禮在南京大學舉行。經過最終決賽的5強選手隊伍現場分享答辯和現場評委考評,國防科技大學選手團隊奪得冠軍,國雙科技團隊獲得亞軍,觀安信息與妙盈科技聯合團隊獲得季軍,華南理工大學與佛羅裏達大學的選手隊伍,以及浙江大學的團隊則獲得優勝獎。

中文NL2SQL准確率超92% 産學研攜手推動智能交互發展

由衆多人工智能權威專家組成的評委團,包括中國移動研究院首席科學家馮俊蘭、複旦大學教授肖仰華、新加坡南洋理工大學副教授毛可智、南京大學教授俞揚、追一科技CTO劉雲峰等産學研多方代表,在決賽現場對選手們的技術方案,進行了專業的分析點評,從而産生最終結果。

隨著NLP基礎能力發展,自然語言轉換可執行的SQL語句,訪問數據庫等一系列複雜的人機交互正逐漸成爲可能。此次大賽短短幾個月裏,頂級選手模型方案准確率達到92%以上,刷新業界記錄。

中文NL2SQL准確率超92% 産學研攜手推動智能交互發展

追一科技CTO劉雲峰

“此次挑戰賽參與規模、選手表現遠超預期,顯示出NL2SQL在學術和産業應用上的潛力,數據庫的交互創新,正在受到越來越多關注。”追一科技聯合創始人兼CTO劉雲峰表示,追一科技將與更多院校、企業界同仁攜手,共同推動中文NLP研究與應用突破。

新一代數據庫交互

NL2SQL(自然語言轉結構化查詢語句)作爲新興的研究領域,在國外由SalesForce耶魯大學等發布了WikiSQL和Spider數據集,但在國內市場,目前還處于起步階段。此次NL2SQL挑戰賽是國內首次舉辦。

“大數據價值變現最大難題就是訪問門檻太高”,嘉賓評委代表、複旦大學教授肖仰華表示,利用自然語言訪問關系型數據庫裏的數據,一直是數據庫業內夢想。太多的數據“沉睡”在關系表格裏,使得這一願望更變得日益迫切。

中文NL2SQL准確率超92% 産學研攜手推動智能交互發展

NL2SQL挑戰賽點評評委、複旦大學教授肖仰華

作爲此次比賽的主辦方,追一科技聯合創始人兼CTO劉雲峰也表示,追一在服務企業的過程中的發現,很多企業的知識和數據都是以關系型數據庫的形式存儲,例如銀行用戶的消費記錄、基金公司的基金屬性、保險公司的保單記錄等等,如果想更好地利用,“亟需將自然語言轉換成可執行的機器語言技術”。

劉雲峰認爲,NL2SQL正是非常好的技術實現路徑,“這也是追一科技發起比賽的原因。”

期間,追一科技發布了業內首個大規模的中文數據集,包括4870張表格數據、近50000條標注數據以及相應的SQL語句,並獲得很多學界專家、産業界夥伴的支持,通過“産學研”等多方聯動,希望提供一個平台,來推動NL2SQL研究和應用。

産學研參與

據了解,本次比賽吸引了海內外1457支隊伍參與,包括院校、機構和企業開發者。

其中,學生及科研人員占比48%,企業技術員工占比52%。學生參賽隊伍來自衆多知名院校,如北京大學、清華大學、複旦大學、上海交通大學、南京大學、浙江大學、中國科學技術大學、哈爾濱工業大學、西安交通大學等。以及來自海外CMU、墨爾本大學、新加坡國立大學等頂級院校參與。

企業界的開發愛好者,則成爲比賽的另一只重要力量。來自中國移動、平安集團、搜狗、達闼科技、中興通訊、網宿科技、國雙科技、捷通華聲等衆多企業的技術人員,也成爲參賽隊伍的重要力量。

院校與院校、企業與企業等聯合“組隊”挑戰,成爲比賽的一大亮點。比如5強中的華南理工與佛羅裏達,上海觀安信息與妙盈科技等,均爲聯合戰隊。

“衆人拾柴火焰高”,劉雲峰表示,這次比賽也是搭建一個橋梁,讓學界、技術創業者、市場多方更好地聯動,“讓企業釘子找到‘錘子’,讓學術和技術創業者的錘子找到‘釘子’。”

作爲高校嘉賓代表,南京大學人工智能創新研究院院長詹德川表示,除了選手的熱情和參與,更看重比賽的交流機會,“學界和産業界可以進行深入的交流。”他同時表示,産學研攜手,“AI的熱情不會進入冬天” 。此次活動中,南京大學計算機軟件新技術國家重點實驗室與追一科技合作,協辦比賽,助力産學研合作。

中文NL2SQL准確率超92% 産學研攜手推動智能交互發展

南京大學人工智能創新研究院院長詹德川

經過多方努力,短短幾個月裏,NL2SQL中文領域研究快速突破。

比賽初期,准確率尚爲60%多,至8月份初賽結束時,榜上頭部分數已經達到89%,接近WikiSQL成績。複賽結束時,選手最高成績達到92%,刷新業界記錄。並且,最終晉級決賽的5支隊伍,個個都在“90分”以上。

“最終選手的成績,完全超出了我們對于比賽的預期。”作爲評委代表,肖仰華表示,實際上中文自然語言轉SQL的挑戰更大,選手們的成績,不但讓人驚喜,而且表現了深厚理論功底,對深度學習、自然語言處理思路和模型的娴熟。

中文NL2SQL准確率超92% 産學研攜手推動智能交互發展

中國移動研究院首席科學家馮俊蘭

作爲來自産業界的專家評委,馮俊蘭表示,NL2SQL 是自然語言處理的一個非常重要的應用領域,涉及到多個自然語言處理領域的核心問題,非常開心看到這麽多高水平的隊伍參賽,並取得了非常好的成績,也看了産、學、研在這個方向上共同提升技術的熱情。

應用前景

如火如荼比賽背後,NL2SQL應用潛力,也受到了越來越多的矚目。

業內人士表示, NL2SQL在銀行、保險、證券、電商、汽車、地産等數據富礦領域,有很大的應用潛力,可以極大地降低數據庫訪問和使用門檻,提升人機交互體驗,並更好地挖掘數據價值。

“今天在AI與數據庫交互上,我們又一次看到了突破,新的想象空間。”對于此次比賽的舉行,創新工場董事長兼首席執行官李開複也表示,期待看到追一和更多NLP開發愛好者,不斷探索努力,推進NLP創新和普惠應用。

“此次挑戰賽參與規模遠超預期,顯示出NL2SQL在學術和産業應用上的潛力,數據庫的交互創新,正在受到越來越多關注。”追一科技聯合創始人兼CTO劉雲峰博士表示,追一科技將與更多院校、企業界同仁攜手,共同推動中文NLP研究與應用突破。

相關文章:

  • 首屆中文NL2SQL挑戰賽:千支隊伍參賽,國防科大奪冠
  • 10月12日,新加坡新增2976起,其中社區2721起,宿舍客工251起,輸入4起,再有11人死于冠病並發症
  • 中國留學生免費接種疫苗,74萬人說我願意
  • 今增4,無社區、客工 | 中國留學生免費接種疫苗,74萬人說我願意
  • 馬國再變天?安華今見國家元首,提交超過120文件,稱取得多數支持
  • 車市掃描-2019年42期(10月14日-10月20日)
娛樂

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

©2025 快讀 | 服務協議 | DMCA | 聯繫我們