AI数智助手
目标:通过对话一句话智能引导出报表
NL2SQL
自然语言转换为sql
数据集
- ATIS&GeoQuery数据集:ATIS数据集来源于机票订阅系统,与美国的地理相关,包含880条问题及对应的SQL语句,属于单一领域但上下文无关的数据集
- WikiSQL数据集:基于维基百科标注了一个大型数据集,包含了80654条训练数据,涉及26521个数据库,仅支持简单的SQL操作
- Spider数据集:目前最为复杂的Text-to-SQL数据集,涵盖了138个领域的200多个数据库,SQL语句更为复杂,包括了多种关键字和嵌套查询
- 中文CSpider数据集:西湖大学在EMNLP2019上发布了一个中文的Text-to-SQL数据集,这个数据集基于Spider数据集,对其中的问题进行了翻译
开源项目参考
参考
Kyligence