tokenization; vocabulary compaction; sub-character representations; out-of-vocabulary mitigation;
机译:基于自适应词汇树的倾斜无人机图像有效匹配对选择
机译:高效的基于WFST的单遍解码,具有即时假设,可极大地记录词汇量,并能连续语音识别
机译:通过字节对编码对指令ROM进行代码压缩
机译:使用基于单词对编码的压缩的高效数据传输方案,用于大规模文本数据处理
机译:SMILES对编码:深度学习的数据驱动子结构标记算法