该模型基于SQLNet，使用模版填充的方法生成SQL语句。为了更好地建模文本中出现的罕见实体和数字，TypeSQL显式地赋予每个单词类型，使用3个独立模型来预测模版填充值。

创新点：每一个文本中都对其进行类别识别，然后完成作为预先设定的条件放到模型中，这样可以最大限度地融合文本地类型。

输入预处理的类型识别

将问句分割n-gram （n取2到6），并搜索数据库表、列。对于匹配成功的部分赋值column类型赋予数字、日期四种类型：INTEGER、FLOAT、DATE、YEAR。对于命名实体，通过搜索FREEBASE，确定5种类型：PERSON，PLACE，COUNTREY，ORGANIZATION，SPORT。这五种类型包括了大部分实体类型。当可以访问数据库内容时，进一步将匹配到的实体标记为具体列名（而不只是column类型）

输入编码

输入编码器由两个BI-LSTM组成：BI_LSTM$^{QT}$（Question，Type）和BI_LSTM$^{COL}$（Column）。将问题中的单词及其对应的类型一起输入进BI_LSTM$^{QT}$中，将数据库中的列名输入进BI_LSTM$^{COL}$，那么输出的隐藏状态分别是$H^{QT}$和$H^{COL}$。

对于列名编码，SQLNet是对每一个列名使用BI-LSTM。而TypeSQL首先计算列名中单词嵌入的平均值，之后使用一个BI-LSTM进行编码。这种编码方法将结果提高了1.5%，并将训练时间缩短了一半。尽管列名的顺序并不重要，但这种改进归因于LSTM可以捕获它们的出现和关系。