由于我们从美国回来就是想把医学数据和医学人工智能的事认真做起来,所以我们选择了比较扎实的解决方法,想快速出成果的请绕道.我们的一些解决方法是:1.整合公开的所有医学词典,尽可能包含更多的标准医学词汇:2.收集各科室真实病例数据,寻找医学专业人士人工分词和标注病历3.使用机器学习算法,基于人工标注结果训练NLP模型:4.构建知识库,并完全对应UMLS或SNOMED CT等国际标准知识库.现在根据上述积累,我们的病历标注精确度已经大概达到85%-90%,后期还会进一步提高.如果有任何类似问题,可以搜…