最近看了关于 SQL Server 的分布式处理方面的论文,觉得它提出的 Polybase 跟之前看过的 HadoopDB 有些神似,这里做个小总结(抽空再把 HadoopDB 的总结贴出来). 不算翻译,只是挑出自己认为是重点的部分.详细情况,还请论文查阅原文,引用中有写明出处.文章末尾有我总结的 slides,可以辅助查阅. 由于缺乏实践经验,很多东西未必能理解其本质.如有其他观点,还请多指教. 当下的计划就是开始自己搭环境,实践起来!~ 背景 商业应用中,越来越多的需要将结构化数据和非结构…