今天这篇文章源于上周在工作中解决的一个实际问题,它是个比较普遍的问题,无论做什么开发,估计都有遇到过.具体是这样的,我们有一份高校的名单(2657个),需要从海量的文章标题中找到包含这些高校的标题,其实就是模糊查询(关注公众号 渡码, 回复关键词 trie 获取源码).对应的伪代码如下 selected_titles = [] for 标题 in 海量标题: for 高校 in 高校名单: if 标题.contains(高校): selected_titles.add(标题) break 如果是…