10月12日,南京大学计算机软件新技术国家重点实验室协办的首届中国nl2sql挑战赛总决赛答辩及颁奖仪式在南京大学举行。经过现场答辩分享和评委现场评审,国防科技大学队夺冠,郭爽科技队获得亚军,观安信息和妙影科技队获得季军,华南理工大学和佛罗里达大学队以及浙江大学队获得优胜奖。

由中国移动研究院首席科学家冯、复旦大学教授肖、新加坡南洋理工大学副教授毛克志、南京大学教授、zhui Technology CTO等多位人工智能领域权威专家组成的评审团在决赛现场对选手的技术方案进行了专业分析和点评,最终产生了最终结果。

随着自然语言处理基础能力的发展,从自然语言转换可执行的sql语句、访问数据库和一系列复杂的人机交互逐渐成为可能。在这场比赛短短几个月的时间里,顶级玩家模型方案的准确率达到92%以上,创造了行业新纪录。

追逐科技首席技术官刘云峰

参赛规模和参赛选手的表现远远超出预期,显示了nl2sql在学术和工业应用中的潜力,数据库的交互创新越来越受到重视。准一科技联合创始人兼首席技术官刘云峰表示,准一科技将与更多高校和企业界同仁携手,共同推动中国自然语言处理研究和应用的突破。

新一代数据库交互

Nl2sql(自然语言到结构化查询语句)作为一个新的研究领域,在国外已经发表了salesforce耶鲁大学的wikisql和spider数据集,但在国内市场还处于起步阶段。此次nl2sql挑战赛首次在中国举办。

实现大数据价值的最大困难是访问门槛太高。客座评委、复旦大学教授肖表示,使用自然语言访问关系数据库中的数据一直是数据库行业的梦想。太多的数据睡在关系表中,这让这种欲望越来越迫切。

nl2sql挑战赛评委、复旦大学教授肖

作为本次比赛的组织者,转一科技的联合创始人兼首席技术官刘云峰也表示,在服务企业的过程中,很多企业的知识和数据都是以关系型数据库的形式存储的,比如银行用户的消费记录、基金公司的资金属性、保险公司的保单记录等。要想更好的利用它们,将自然语言转换成可执行的机器语言技术迫在眉睫。

刘云峰认为nl2sql是一种非常好的技术实现方式,这也是Zhuiyi Technology发起竞争的原因。

期间,Zhuiyi Technology发布了行业首个大规模中文数据集,包括4870个表格数据、近5万个标注数据和相应的sql语句,得到了众多学术专家和行业合作伙伴的支持,希望通过产学研多方联动,为推动nl2sql的研究和应用提供一个平台。

生产、教育和研究参与

据了解,本次比赛吸引了来自国内外的1457支队伍,其中包括来自高校、事业单位和企业的开发商。

其中,学生和科研人员占48%,企业技术人员占52%。学生团队来自许多著名大学,如北京大学、清华大学、复旦大学、上海交通大学、南京大学、浙江大学、中国科技大学、哈尔滨工业大学、Xi交通大学等。以及海外cmu、墨尔本大学、新加坡国立大学的顶尖院校。

商界的开发爱好者已经成为竞争中的另一股重要力量。来自中国移动、平安集团、搜狗、戴利科技、中兴、网通科技、郭爽科技、捷通华盛等多家企业的技术人员也成为了参赛团队的重要力量。

高校、企业等联合团队的挑战成为竞争的一大亮点。比如前5名的华南理工和佛罗里达、上海观安信息、妙影科技都是联合团队。

每个人都有很高的拾柴火焰。刘云峰说,这次比赛也是搭建一座桥梁,让学术界、科技企业家和市场各方能够更好地联系起来,让企业找到钉子& lsquo锤子,让学术技术型创业者的锤子去找& lsquo指甲。

南京大学人工智能创新研究所所长詹德川表示,除了参赛选手的热情和参与,更注重比赛的交流机会,学术界和工业界可以进行深入的交流。他还表示,有了产学研合作,ai的热情不会进入寒冬。在这次活动中,南京大学计算机软件新技术国家重点实验室与Zhuiyi Technology合作,共同组织了竞赛,并帮助开展了产学研合作。

南京大学人工智能创新研究所所长詹德川

经过多方努力,在短短几个月内,nl2sql在中文研究上取得了快速突破。

比赛开始时准确率还在60%以上。到8月份初赛结束时,榜单上的最高分已经达到89%,接近wikisql。半决赛结束,参赛选手最高分达到92%,创造行业新纪录。此外,最终晋级决赛的五支球队均得分在90分以上。

最后选手的成绩完全超出了我们对比赛的预期。作为评委代表,肖表示,实际上,将中文自然语言转换为sql的挑战更大。参赛选手的成绩不仅让人惊喜,而且在深度学习、自然语言处理思路和模型等方面都表现出深厚的理论基础和熟练程度。

冯中国移动研究院首席科学家

作为业内专家评委,冯表示,nl2sql是自然语言处理的一个非常重要的应用领域,涉及到自然语言处理领域的很多核心问题。他很高兴看到这么多高水平的球队参加比赛,并取得了非常好的成绩。他还看到了生产、学习和研究的热情,共同提高这方面的技术。

应用前景

在激烈的竞争背后,nl2sql的应用潜力越来越受到关注。

据业内人士介绍,nl2sql在银行、保险、证券、电子商务、汽车、房地产等数据丰富的挖掘领域有着巨大的应用潜力。,可以大大降低数据库访问和使用的门槛,增强人机交互的体验,更好的挖掘数据的价值。

今天,我们又一次看到了人工智能和数据库交互的突破,带来了新的想象空.对于此次比赛的举办,创新工场董事长兼CEO李开复也表示,他期待看到更多的nlp开发爱好者,不断努力探索和推广nlp创新和包容性应用。

参与这一挑战的规模远远超出预期,这显示了nl2sql在学术和工业应用中的潜力。数据库的交互式创新正受到越来越多的关注。准一科技联合创始人兼首席技术官刘云峰博士表示,准一科技将与更多高校和企业界同仁携手,共同推动中国自然语言处理研究和应用的突破。

标题:[科技界] 中文NL2SQL准确率超92% 产学研携手推动智能交互发展

地址:http://www.heliu2.cn/xw/7474.html